列表和字典的区别是列表可以通过索引来访问值,而字典可以通过名称来访问各个值。
字典这种数据结构称为映射(mapping),字典是Python中唯一内置映射类型,值不按照顺序排列,而是存储再键下面。
其中键可以是数字、字符串或元组等不可变数据类型。
字典的用途
字典的名称指出了这种数据结构的用途。日常生活中的字典和Python中的字典都能够轻松的通过单词(键)获取其定义的值。
- 表示棋盘的分布,其中每个键都是由坐标组成的元组
- 存储文件修改时间,其中的键为文件名
- 数字电话/地址簿
通过列表查找数据:
>>> >>> names = ['Alice', 'Beth', 'Cecil', 'Dee-Dee', 'Earl']>>> numbers = ['2341', '9102', '3158', '0142', '5551']>>> numbers[names.index('Cecil')] # 要查找Ceil的号码,通过列表的方式很麻烦'3158'>>>
创建和使用字典
上面查找电话号码的,可以通过创建一个字典实现。
>>> phonebook = {'Alice': '2314', 'Beth': '9102', 'Cecil': '3258'}>>> phonebook['Alice']'2314'>>>
字典(dict)由键(key)及其对应的值(value)组成,这种键-值对称为项(item)。
在上面的示例中,键为名字,值为手机号。
每个键与值之间都是用冒号(:)分隔,项之间使用逗号分隔,整个字典放在大括号中。
空字典(没有任何项)用两个大括号表示,类似于 {}
。
在字典(以及其他映射类型)中,键必须是独一无二的,而字典中的值无此要求。
可以使用函数dict从其他映射(如其他字典)或键值对序列创建字典:
>>> >>> items = [('name', 'Gubmy'), ('age', 42)]>>> d = dict(items) >>> d{'name': 'Gubmy', 'age': 42}>>> d['name']'Gubmy'>>>>>> >>> d = dict(name='Gumby', age=42) # 使用关键字实参创建字典>>> d{'name': 'Gumby', 'age': 42}>>>
字典基本操作
字典的基本行为在很多方面类似于序列。
len(d)
返回字典项(键值对)数d[k]
返回与k
相关联的值d[k] = v
将值v
关联到键k
del d[k]
删除键为k
的项k in d
检查字典d
是否包含键位k
的项
字典和列表有一些不同之处。
键的类型:字典中键可以是整数,单并非必须是整数。字典中的键可以是任何不可变的类型,如浮点数(实数)、字符串、元组。——字典的主要优点
自动添加:即便是字典中原本没有键,也可以给他赋值,这将在字典中创建一个新项;但是如果不适用append或其他类似方法,就不能给列表中没有的元素赋值
成员资格:表达式
k in d
(其中d
是一个字典)查找的是键而不是值,而表达式v in l
(其中l
是一个列表)查找的是值而不是索引。其实字典中的键可以理解为列表中的索引,所以这里不一样。查字典中是否包含键的效率比检查列表中是否包含值更高,这也说明了数据结构越大效率差距就越大。>>> >>> x = []>>> x[42] = 'Foobar' # 因为空列表中没有索引42,所以会报错。定义的时候必须使用[None]*43才可以Traceback (most recent call last): File "", line 1, in IndexError: list assignment index out of range>>>>>> x = {}>>> x[42] = 'Foobar' # 空字典中可以给没有的键赋值,会生成新的item>>> x{42: 'Foobar'}>>>
创建电话簿数据库代码示例
# 一个简单的数据库# 将一个人名用作键的字典,每个人都用一个字典表示# 字典中包含键'phone'和'addr',它们分别与电话号码和地址相关联people = { 'Alice': { 'phone': '2341', 'addr': 'Foo driver 23' }, 'Beth': { 'phone': '9102', 'addr': 'Bar street 42' }, 'Cecil': { 'phone': '3158', 'addr': 'Baz avenue 90' }}# 电话号码和地址的描述性标签,供打印输出时使用labels = { 'phone': 'phone number', 'addr': 'address'}name = input('Name: ')# 要查找电话号码还是地址request = input('Phone number (p) or address (a) ? ')# 使用正确的键if request == 'p': key = 'phone'if request == 'a': key = 'addr'# 仅当名字是字典中包含的键时才打印信息if name in people: print("{}'s {} is {}.".format(name, labels[key], people[name][key])) # OutputName: BethPhone number (p) or address (a) ? pBeth's phone number is 9102.
格式化引用字典
字符产格式化引用最常用的方法为format
。
同样可以通过在字典中存储一系列命名的值,可让格式设置更容易些。提取的时候只需在格式字符串中提取所需要的信息即可,使用format_map
来指出你将通过一个映射来提供所需要的信息。
>> >>> phonebook = {'Alice': '2314', 'Beth': '9102', 'Cecil': '3258'}>>> "Cecil's phone number is {Cecil}.".format_map(phonebook)"Cecil's phone number is 3258.">>>>>>>>> # 只要所有的字段名称都包含在字典的键中,可以指定任意数量的转换说明符。如下:template = ''' {title} {title}
{text}
'''data = {'title': 'My Home Page', 'text': 'Welcome to my home page!'}print(template.format_map(data))# Output''' My Home Page My Home Page
Welcome to my home page!
'''
字典方法
与其他内置类型一样,字典也有方法,字典的方法很有用,介绍几个常用的字典方法。
- clear
方法clear删除所有字典项。
>>> >>> d = {}>>> d['name'] = 'Gumby'>>> d['age'] = 42>>> d{'name': 'Gumby', 'age': 42}>>> returned_value = d.clear()>>> d{}>>> print(returned_value) None>>>>>> # 场景一:通过给x赋值空字典来“清空”x,但是不影响y。这种方法很有用。>>> x = {}>>> y = x>>> x['key'] = 'value'>>> y{'key': 'value'}>>> x{'key': 'value'}>>> x = {}>>> y{'key': 'value'}>>> x{}>>>>>> # 场景二:调用clear方法,会同时删除x、y中的元素。这种方法很有用>>> x = {}>>> y = x>>> x['key'] = 'value'>>> y{'key': 'value'}>>> x{'key': 'value'}>>> x.clear()>>> y{}>>> x{}>>>
- copy
方法copy返回一个新字典,其包含的键值对与原来的字典相同(这个方法执行的是浅复制,因为值本身是原件,而非副本)。
浅复制得到的副本,替换副本中的值,原件不受影响,但是修改副本中的值也会一并修改原件中的值,因为原件指向的也是被修改的值。
深复制就可以避免这种问题。
>>> >>> x = {'username': 'admin', 'machines': ['foo', 'bar', 'baz']}>>> y = x.copy() # 浅复制>>> y['username'] = 'mlh'>>> y['machines'].remove('bar')>>> y{'username': 'mlh', 'machines': ['foo', 'baz']}>>> x{'username': 'admin', 'machines': ['foo', 'baz']} # 原件变化>>>>>>>>> >>> from copy import deepcopy>>> d = {}>>> d['name'] = ['Alfred', 'Berthand']>>> c = d.copy()>>> dc = deepcopy(d) # 深复制>>> d['name'].append('Clive')>>> c{'name': ['Alfred', 'Berthand', 'Clive']} # 原件不变>>> dc{'name': ['Alfred', 'Berthand']}>>>
- fromkeys
方法fromkeys创建一个新字典,其中包含指定的键,且每个键对应的值都是None。
# 从空字典创建另一个字典d = {}df = d.fromkeys(['name', 'age']) print(df) # {'name': None, 'age': None}# 直接使用dict创建字典(dict是所有字典所属类型)df = dict.fromkeys(['name', 'key'])print(df) # {'name': None, 'age': None}# 提供特定的值创建字典df1 = dict.fromkeys(['name', 'age'], '(unknown)')print(df1) # {'name': '(unknown)', 'age': '(unknown)'}
- get
方法get为访问字典项提供了宽松的环境。因为通常访问字典中没有的项,将发生错误。
>>> >>> d = {}>>> d['name'] # 通常访问报错Traceback (most recent call last): File "", line 1, in KeyError: 'name'>>>>>> print(d.get('name')) # 通过get方法访问返回NoneNone>>>>>> d.get('name', 'N/A') # 指定默认值(如果有值就返回,没有就返回默认值)'N/A'>>>>>> d['name'] = 'Eric'>>> d {'name': 'Eric'}>>> d.get('name') # 访问的时候有值'Eric'
使用get方法优化有的代码:
# 一个使用get()的简单的数据库,可以保证即使输入的值不对也能正常输出# 将一个人名用作键的字典,每个人都用一个字典表示# 字典中包含键'phone'和'addr',它们分别与电话号码和地址相关联people = { 'Alice': { 'phone': '2341', 'addr': 'Foo driver 23' }, 'Beth': { 'phone': '9102', 'addr': 'Bar street 42' }, 'Cecil': { 'phone': '3158', 'addr': 'Baz avenue 90' }}# 电话号码和地址的描述性标签,供打印输出时使用labels = { 'phone': 'phone number', 'addr': 'address'}name = input('Name: ')# 要查找电话号码还是地址request = input('Phone number (p) or address (a)? ')# 使用正确的键key = request # 如果request既不是'p'也不是'a'if request == 'p': key = 'phone'if request == 'a': key = 'addr'# 使用get提供默认值person = people.get(name, {})label = labels.get(key, key)result = person.get(key, 'not available')# 才打印信息print("{}'s {} is {}.".format(name, label, result))
- items
方法items返回一个包含所有字典项的列表,其中每个元素都已(key, value)的形式展示。其中排序是不确定的。
返回值属于一种名称为字典视图的特殊类型,可迭代,可检查长度。字典视图生成后不会复制原字典,即使修改了原字典。
可以使用list将字典视图转换为列表。
>>> >>> d = {'title': 'Python Web Site', 'url': 'http://www.python.org', 'span': 0}>>> d.items()dict_items([('title', 'Python Web Site'), ('url', 'http://www.python.org'), ('span', 0)]) # 返回值属于一种名称为字典视图的特殊类型,可迭代,可检查长度>>>>>> it = d.items()>>> len(it)3>>> ('span', 0) in itTrue>>>>>> d['span'] = 1 # 修改字典d并不影响字典视图it>>> ('span', 0) in itFalse>>> d['span'] = 0 >>> ('span', 0) in itTrue>>>>>> l = list(d.items()) # 使用list方法将字典视图转换为列表>>> l[('title', 'Python Web Site'), ('url', 'http://www.python.org'), ('span', 0)]>>>
- keys
方法keys返回一个字典视图,其中包含指定字典中的键。
>>> >>> d = {'title': 'Python Web Site', 'url': 'http://www.python.org', 'span': 0}>>> d.keys() dict_keys(['title', 'url', 'span'])>>>
- values
方法values返回一个由字典中的值组成的字典视图。不同于方法keys,方法values返回的视图可能包含重复的值。
>>> >>> d = {}>>> d[1] = 1>>> d[2] = 2 >>> d[3] = 3 >>> d[4] = 1 >>> d{1: 1, 2: 2, 3: 3, 4: 1}>>> d.values()dict_values([1, 2, 3, 1])>>>
- pop
方法pop可用于获取与指定键关联的的值,并将该键值对从字典中删除。
>>> >>> d = {'x': 1, 'y': 2, 'z': 3}>>> d.pop('x')1>>> d{'y': 2, 'z': 3}>>>
- popitem
方法popitem类似于list.pop,但list.pop弹出列表的最后一个元素,而popitem随机弹出一个字典项(因为字典项的顺序是不确定的,所有没有’最后一个元素’的概念),因此字典也没有类似列表中append的方法,无意义。
这个方法可以高效的逐个删除并处理所有字典项,因为这样无需先获取字典列表。
>>>>>> d = {'title': 'Python Web Site', 'url': 'http://www.python.org', 'span': 0}>>> d.popitem()('span', 0)>>> d{'title': 'Python Web Site', 'url': 'http://www.python.org'}>>>
- setdefault
方法setdefault有点像get,有键时获取值,但是无键时可以添加键值对
>>> >>> d = {'title': 'Python Web Site', 'url': 'http://www.python.org', 'span': 0}>>> d.setdefault('title')'Python Web Site'>>> d{'title': 'Python Web Site', 'url': 'http://www.python.org', 'span': 0}>>> d.setdefault('name', 'N/A') # setdefault指定的值不存在时,返回指定值并更新字典;如果没有指定,同get一样返回None'N/A'>>> d{'title': 'Python Web Site', 'url': 'http://www.python.org', 'span': 0, 'name': 'N/A'}>>> d.setdefault('type', 'Python') 'Python'>>> d{'title': 'Python Web Site', 'url': 'http://www.python.org', 'span': 0, 'name': 'N/A', 'type': 'Python'}>>>
- update
方法update使用一个字典中的项来更新另一个字典,如果没有就添加,如果有就更新。
>>> >>> d = {'title': 'Python Web Site', 'url': 'http://www.python.org', 'spam': 0} >>> x = {'title': 'Python Language Website'}>>> d.update(x) # 这里要理解下,是对字典d调用update方法,所以因该是使用字典x去更新字典d的内容,而不是改变字典x的内容>>> d{'title': 'Python Language Website', 'url': 'http://www.python.org', 'spam': 0}>>>