defaultdict()和namedtuple()是collections模块里面2个很实用的扩展类型。一个继承自dict系统内置类型，一个继承自tuple系统内置类型。在扩展的同时都添加了额外的很酷的特性，而且在特定的场合都很实用。

defaultdict()

定义以及作用

返回一个和dictionary类似的对象，和dict不同主要体现在2个方面：

可以指定key对应的value的类型。
不必为默认值担心，换句话说就是不必担心有key没有value这回事。总会有默认的value.

示例

defaultdict_egfrom collections import defaultdict

s = [('yellow', 1), ('blue', 2), ('yellow', 3), ('blue', 4), ('red', 1)]

d = defaultdict(list)

for k, v in s:

    d[k].append(v)

print(list(d.items()))

d_2 = {}

for k, v in s:

    d_2.setdefault(k, []).append(v)

print(list(d_2.items()))

d_3 = {}

for k, v in s:

    d_3[k].append(v)

print(d_3.items())

输出：

defaultdict_result[('red', [1]), ('blue', [2, 4]), ('yellow', [1, 3])]

[('red', [1]), ('blue', [2, 4]), ('yellow', [1, 3])]

Traceback (most recent call last):

  File "C:/Users/Administrator/Desktop/Python Scripts/collection_eg.py", line 22, in <module>

    d_3[k].append(v)

KeyError: 'yellow'

d = defaultdict(list)，该语句创建一个defaultdict类型（你可以想象为dict类型），value的类型是list。通过对d_3的对比就能看到，defaultdict是可以直接就进行d[k]的操作，即使d此时还是一个空的字典。实际过程就是示例里d_2的处理过程。

总结

主要使用根据数据创建字典时。当你需要为一些数据生成字典，而且对值的类型进行限定的时候，考虑defaultdict。

namedtuple()

定义及作用

namedtuple是继承自tuple的子类。namedtuple和tuple比，有更多更酷的特性。namedtuple创建一个和tuple类似的对象，而且对象拥有可以访问的属性。这对象更像带有数据属性的类，不过数据属性是只读的。

示例

namedtuple_eg>>> from collections import namedtuple

>>> TPoint = namedtuple('TPoint', ['x', 'y'])

>>> p = TPoint(x=10, y=10)

>>> p

TPoint(x=10, y=10)

>>> p.x

10

>>> p.y

10

>>> p[0]

10

>>> type(p)

<class '__main__.TPoint'>

>>> for i in p:

	print(i)

10

10

>>>

TPoint = namedtuple('TPoint', ['x', 'y']) 创建一个TPoint类型，而且带有属性x, y.

通过上面的示例，可以看出不仅可以通过p.x， p.y的方式访问p的属性，而且还可以使用for来进行遍历。这些就和tuple是一样的。

还可以通过设置参数来看namedtuple的全貌。

namedtuple_eg2TPoint = namedtuple('TPoint', ['x', 'y'], verbose=True)

from builtins import property as _property, tuple as _tuple

from operator import itemgetter as _itemgetter

from collections import OrderedDict

class TPoint(tuple):

    'TPoint(x, y)'

    __slots__ = ()

    _fields = ('x', 'y')

    def __new__(_cls, x, y):

        'Create new instance of TPoint(x, y)'

        return _tuple.__new__(_cls, (x, y))

    @classmethod

    def _make(cls, iterable, new=tuple.__new__, len=len):

        'Make a new TPoint object from a sequence or iterable'

        result = new(cls, iterable)

        if len(result) != 2:

            raise TypeError('Expected 2 arguments, got %d' % len(result))

        return result

    def __repr__(self):

        'Return a nicely formatted representation string'

        return self.__class__.__name__ + '(x=%r, y=%r)' % self

    def _asdict(self):

        'Return a new OrderedDict which maps field names to their values'

        return OrderedDict(zip(self._fields, self))

    __dict__ = property(_asdict)

    def _replace(_self, **kwds):

        'Return a new TPoint object replacing specified fields with new values'

        result = _self._make(map(kwds.pop, ('x', 'y'), _self))

        if kwds:

            raise ValueError('Got unexpected field names: %r' % list(kwds))

        return result

    def __getnewargs__(self):

        'Return self as a plain tuple.  Used by copy and pickle.'

        return tuple(self)

    x = _property(_itemgetter(0), doc='Alias for field number 0')

    y = _property(_itemgetter(1), doc='Alias for field number 1')

这里就显示出了namedtuple的一些方法。很明显的看到namedtuple是直接继承自tuple的。

几个重要的方法：

1.把数据变成namedtuple类：

namedtuple_eg3>>> TPoint = namedtuple('TPoint', ['x', 'y'])

>>> t = [11, 22]

>>> p = TPoint._make(t)

>>> p

TPoint(x=11, y=22)

>>>

2. 根据namedtuple创建的类生成的类示例，其数据是只读的，如果要进行更新需要调用方法_replace.

namedtuple_eg4>>> p

TPoint(x=11, y=22)

>>> p.y

22

>>> p.y = 33

Traceback (most recent call last):

  File "<pyshell#18>", line 1, in <module>

    p.y = 33

AttributeError: can't set attribute

>>> p._replace(y=33)

TPoint(x=11, y=33)

>>>

3.将字典数据转换成namedtuple类型。

namedtuple_eg5>>> d = {'x': 44, 'y': 55}

>>> dp = TPoint(**d)

>>> dp

TPoint(x=44, y=55)

>>>

总结

namedtuple最常用还是出现在处理来csv或者数据库返回的数据上。利用map()函数和namedtuple建立类型的_make（）方法。

namedtuple_eg6EmployeeRecord = namedtuple('EmployeeRecord', 'name, age, title, department, paygrade')

import csv

for emp in map(EmployeeRecord._make, csv.reader(open("employees.csv", "rb"))):

    print(emp.name, emp.title)

# sqlite数据库

import sqlite3

conn = sqlite3.connect('/companydata')

cursor = conn.cursor()

cursor.execute('SELECT name, age, title, department, paygrade FROM employees')

for emp in map(EmployeeRecord._make, cursor.fetchall()):

    print(emp.name, emp.title)

# MySQL 数据库

import mysql

from mysql import connector

from collections import namedtuple

user = 'herbert'

pwd = '######'

host = '127.0.0.1'

db = 'world'

cnx = mysql.connector.connect(user=user, password=pwd, host=host,database=db)

cur.execute("SELECT Name, CountryCode, District, Population FROM CITY where CountryCode = 'CHN' AND Population > 500000")

CityRecord = namedtuple('City', 'Name, Country, Dsitrict, Population')

for city in map(CityRecord._make, cur.fetchall()):

    print(city.Name, city.Population)

再谈collections模块defaultdict()和namedtuple()的更多相关文章

python拓展2 collections模块与string模块
知识内容 1.collections模块介绍 2.collections模块使用 3.string模块介绍及使用一.collections模块介绍 collections模块中提供了很多python ...
collections模块---（namedtuple、deque、OrderdDict、defaultdict、Counter）和configparser模块
在内置数据类型(dict. list.set.tuple)的基础上,collections模块还提供了几个额外的数据类型:Counter. deque.defaultdict.namedtuple 和 ...
collections模块之defaultdict()与namedtuple()方法简单介绍
一.defaultdict() 作用:根据数据创建字典时,需要为一些数据生成字典,而且对值得类型进行限定的时候,考虑defaultdict from collections import defaul ...
collections 模块（namedtuple， deque， Counter ）
基本介绍我们都知道,Python拥有一些内置的数据类型,比如str, int, list, tuple, dict等, collections模块在这些内置数据类型的基础上,提供了几个额外的数据类型 ...
python之collections模块（OrderDict,defaultdict）
前言: import collections print([name for name in dir(collections) if not name.startswith("_" ...
Python的collections模块中namedtuple结构使用示例
namedtuple顾名思义,就是名字+元组的数据结构,下面就来看一下Python的collections模块中namedtuple结构使用示例 namedtuple 就是命名的 tuple,比较 ...
collections模块-namedtuple
namedtuple -> 命名元组这里的命名指的是对元组中元素的命名. 通过一个例子来看 import collections Person = collections.namedtuple ...
python collections模块之 defaultdict
defaultdict 是 dict 的子类,因此 defaultdict 也可被当成 dict 来使用,dict 支持的功能,defaultdict 基本都支持.但它与 dict 最大的区别在于,如 ...
python常用模块（1）：collections模块和re模块（正则表达式详解）
从今天开始我们就要开始学习python的模块,今天先介绍两个常用模块collections和re模块.还有非常重要的正则表达式,今天学习的正则表达式需要记忆的东西非常多,希望大家可以认真记忆.按常理来 ...

随机推荐

middleware - bodyparser
express4之前,bodyparser是express下的一个对象. express4把bodyparser分离出来. 本文中的实例基于以下的这个请求 $.ajax({ url: '/save', ...
TortoiseSVN客户端使用说明
TortoiseSVN客户端使用说明 TortoiseSVN不是一个独立的窗口程序,而是集成在windows右键菜单中,下面对TortoiseSVN的菜单项做简要的说明.01.SVN Checkout ...
windows编程：画线，简单的碰撞检测，简单的帧率锁定
#define WIN32_LEAN_AND_MEAN #include <windows.h> #include <windowsx.h> #include <mmsy ...
MyEclipse调用Matlab打包函数
本文部分内容参考了http://www.360doc.com/content/15/1103/16/1180274_510463048.shtml 一.检查Java环境对于已经装上JAVA环境的计算 ...
Ceph性能测试工具和方法。
0. 测试环境同 Ceph 的基本操作和常见故障排除方法一文中的测试环境. 1. 测试准备 1.1 磁盘读写性能 1.1.1 单个 OSD 磁盘写性能,大概 165MB/s. root@ceph1 ...
让 File Transfer Manager 在新版本WIndows上能用
最近研究.NET NATIVE,听说发布了第二个预览版,增加了X86支持,所以下,发现连接到的页面是:https://connect.microsoft.com/VisualStudio/Downlo ...
TJ/T808 终端通讯协议设计与实现(码农本色）
由于公司项目涉及到相关技术,对于平常写WEB的技术人员来说对这人来说比较默生:为了让下面的技术人员更好地对这个协议的实施,所以单独针对这个协议进行了分析和设计,以更于后期更好指导相关开发工作.由于自己 ...
使用statsd+graphite+grafana构建业务及性能监控模块
近些年随着DevOps概念越来越收到重视,除了传统的Splunk,Zabbix外在开源领域也有越来越多的软件可供使用.从数据收集,时序数据库,图形展示等主要方面有各类可扩展的软件用于搭建一个数据监控平 ...
java 多线程（ReadWriteLock）
package com.example; public class App { public static void main(String[] args) { Info info = new Inf ...
那些年使用Hive踩过的坑
1.概述这个标题也是用血的教训换来的,希望对刚进入hive圈的童鞋和正在hive圈爬坑的童鞋有所帮助.打算分以下几个部分去描述: Hive的结构 Hive的基本操作 Hive Select Hive ...

再谈collections模块defaultdict()和namedtuple()