collections模塊簡介
collections是Python標(biāo)準(zhǔn)庫里有關(guān)數(shù)據(jù)類型的模塊,里面包含了一些實(shí)用的數(shù)據(jù)類型,在某些情況下作為Python標(biāo)準(zhǔn)內(nèi)建容器(dict,list,set,和tuple)的替代選擇。
namedtuple()命名元組的工廠函數(shù)
Python官方文檔上是這樣說的:"命名元組賦予每個(gè)位置一個(gè)含義,提供可讀性和自文檔性。它們可以用于任何普通元組,并添加了通過名字獲取值的能力,通過索引值也是可以的?!拔沂沁@樣理解的:它可以構(gòu)建一個(gè)有名字的類,而且為元組中的元素添加了更易懂的"名字”(或者說是對元素的簡單描述),這樣就可以用"名字"取值。
如果元組內(nèi)的元素很多,比如記錄一個(gè)人的身高,年齡,家庭住址,電話號碼…等等,只靠索引訪問這些信息是很麻煩的,這就凸顯出了"名字"的重要性。
fromcollectionsimportnamedtuple
City=namedtuple('City','namecountry')#注1
beijing=City('Beijing','China')
print(beijing)#City(name='Beijing',country='China')
print(beijing.name)#通過"名字"獲取對應(yīng)的值
print(beijing.country)
print(beijing[0])#同樣支持用索引訪問
注1.創(chuàng)建了一個(gè)類名是"City"的類,其中"name"和"country"是"名字","名字"可以是數(shù)個(gè)字符串組成的可迭代類型(比如list),還可以是用空格分開的字符串。
下面介紹一些常用的功能:
fromcollectionsimportnamedtuple
Point=namedtuple('Point',['x','y'])
print(Point._fields)#_fields方法會返回一個(gè)包含"Point"類里所有"名字"的元組('x','y')
p=[1,2]
print(Point._make(p))#_make()接受一個(gè)可迭代對象創(chuàng)建新的命名元組
p=Point(1,2)
print(p._asdict())#返回一個(gè)OrderedDict(這個(gè)數(shù)據(jù)類型以后再談),它能友好地呈現(xiàn)出元組里的信息
print(p._replace(x=2))#返回一個(gè)新的命名元組實(shí)例,并將指定"名字"的值替換為新的值
print(p)#_replace()返回的是新的命名元組實(shí)例,所以p不會改變
p2={'x':2,'y':3}
print(Point(**p2))#將字典轉(zhuǎn)化為命名元組
Counter(計(jì)數(shù)器)
Counter是dict的子類,可以給可散列對象(文末有解釋)計(jì)數(shù)。
廢話不多說,直接上例子:
fromcollectionsimportCounter
a=Counter('aaabbcdddd')#統(tǒng)計(jì)'aaabbcdddd'(可迭代對象)里字母出現(xiàn)的次數(shù)并創(chuàng)建對應(yīng)的計(jì)數(shù)器(按次數(shù)大小排列)
print(a)
b=Counter()#空的計(jì)數(shù)器
print(b)
c=Counter({'a':3,'b':2,'c':3,'d':4})#根據(jù)字典創(chuàng)建計(jì)數(shù)器
print(c)
d=Counter(a=3,b=2,c=1,d=4)#根據(jù)鍵值創(chuàng)建
print(d)
e=Counter(['a','a','b'])#也可以換成其他可迭代對象
print(e['a'])#統(tǒng)計(jì)列表中'a'出現(xiàn)的次數(shù)
print(e['c'])#如果沒有相應(yīng)的鍵就返回零
下面介紹一些常用的功能:
fromcollectionsimportCounter
#elements()方法會返回一個(gè)迭代器
a=Counter(a=2,b=1,c=0,d=-1)#elements()函數(shù)會忽略計(jì)數(shù)值小于1的元素
print(sorted(f.elements()))#迭代器不能直接打印,需要先用sorted()函數(shù)新建一個(gè)列表
#most_common([n])返回一個(gè)包含n個(gè)最常見的元素及出現(xiàn)次數(shù)的列表
b=Counter('aaabbcdddd')
print(g.most_common(2))#結(jié)果:[('d',4),('a',3)]
print(g.most_common())#如果不傳參或傳"None",將返回計(jì)數(shù)器中的所有元素
print(g.most_common(None))
#subtract減去元素
e=Counter(a=4,b=1,c=0,d=-1)
f=Counter(a=2,b=1,c=2,d=0)
e.subtract(f)#這里既可以減去可迭代對象(如字符串,列表)也可以是映射對象(如字典)
print(e)
e.subtract('aaa')
print(e)#輸入和輸出都可以是0或者負(fù)數(shù)
關(guān)于可散列對象的介紹不多,《流暢的Python》里是這樣說的(選自Python詞匯表):
如果一個(gè)對象是可散列的,那么在這個(gè)對象的生命周期中,他的散列值是不會變的,而且這個(gè)對象需要實(shí)現(xiàn)__hash__()方法。另外還要有__eq__()方法,這樣才能和其他鍵作比較。如果兩個(gè)可散列對象是相等的,那么他們的散列值一定是一樣的。
簡單說可散列對象就是能被映射成數(shù)字的對象。
“可散列”,"映射"會牽扯到一種數(shù)據(jù)結(jié)構(gòu):散列表(《算法圖解》第五章和《流暢的Python》第三章中對散列表都有一定介紹,讀者可以用微信讀書了解這種數(shù)據(jù)結(jié)構(gòu))
在理解了散列表之后,可散列對象就不難理解了。
下面看幾個(gè)例子:
a=1
print(hash(a))
s='a'
print(hash(s))
t1=(1,2,3)
t2=(1,[2,3])
t3=(1,frozenset([2,3]))
print(hash(t1))
print(hash(t2))
print(hash(t3))
l=[1,2]
print(hash(l))#list是不可散列的,所以會拋出異常:TypeError:unhashabletype:'list'
b=1
print(hash(a)==hash(b))
在以上的例子中,變量a,s,t1和t3都是可散列對象(都實(shí)現(xiàn)了__hash__()方法);
最后一個(gè)例子證明了"如果兩個(gè)可散列對象是相等的,那么他們的散列值一定是一樣的"這句話。
總結(jié)一下可散列對象:
1.str(s),bytes,和數(shù)值類型(a);
2.frozenset,因?yàn)閒rozenset只能容納可散列類型;
3.在元組里的所有元素都是可散列類型的情況下,它才是可散列的。
以上內(nèi)容為大家介紹了Python標(biāo)準(zhǔn)庫之collections模塊,希望對大家有所幫助,如果想要了解更多Python相關(guān)知識,請關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。http://m.2667701.com/