首先是跳過開始部分，這個在我們讀取文本的時候最常用。在實(shí)際的應(yīng)用當(dāng)中，比如記錄的日志或者是代碼等等，一般來說頭部都會附上一段說明，或者用注釋標(biāo)注或者是用特殊的符號標(biāo)記。這些信息是給用到數(shù)據(jù)的程序員看的，當(dāng)我們通過代碼獲取數(shù)據(jù)的時候，顯然是希望可以過濾掉這些信息的。

比如我們有一段數(shù)據(jù)，它的開頭用#做了一些注釋：

#Thisisadataforstudent

#Rows100

xiaoming,17,99;

xiaoli,18,98;

...

常規(guī)操作當(dāng)中，我們會創(chuàng)建一個打開文件的迭代器，我們通過遍歷這個迭代器去獲取文件當(dāng)中的數(shù)據(jù)：

withopen('xxxx.txt')asf:

forlineinf:

print(line)

如果只是用來輸出還好，如果我們需要加工文件當(dāng)中的數(shù)據(jù)，那么頭部的注釋信息就會干擾我們代碼的運(yùn)行。我們當(dāng)然可以手動加入一些判斷，但是這會比較麻煩，代碼也不夠美觀。針對這個問題，一個比較好的解決方案是dropwhile。

dropwhile是itemtools當(dāng)中的一個函數(shù)，它可以接收一個我們自定義的過濾函數(shù)和迭代器重新生成一個新的迭代器，這個新的迭代器當(dāng)中會過濾掉之前迭代器頭部不符合我們要求的數(shù)據(jù)：

在剛才的例子當(dāng)中我們想要過濾掉頭部加了#注釋的部分，我們可以這么操作：

fromitertoolsimportdropwhile

withopen('xxxx.txt')asf:

forlineindropwhile(lambdaline:line.startswith('#'),f):

print(line)

這樣出來的結(jié)果就沒有頭部我們不需要的內(nèi)容了。

當(dāng)我們知道頭部不符合情況的數(shù)據(jù)的格式的時候，可以使用dropwhile來規(guī)定過濾的格式。如果我們知道需要過濾的條數(shù)，則可以使用另外一個工具，叫做islice，它的本質(zhì)是一個切片函數(shù)，就像是Python當(dāng)中數(shù)組的切片功能一樣，可以切出迭代器當(dāng)中指定片段的數(shù)據(jù)。

舉個例子：

fromitertoolsimportdropwhile

withopen('xxxx.txt')asf:

forlineinislice(f,3,None):

print(line)

這樣我們就會從第三行開始獲取，之前的數(shù)據(jù)會被過濾掉。它其實(shí)就代表著數(shù)組當(dāng)中[3:]的切片操作。

迭代排列組合我們都知道在C++當(dāng)中有一個叫做next_permutation的函數(shù)，可以傳入一個數(shù)組，返回下一個字典序的排列。在Python當(dāng)中也有同樣的功能，但是是以迭代器的形式使用的。

舉個簡單的例子，比如我們有a,b,c三個元素，我們希望求出它的所有排列：

items=['a','b','c']

fromitertoolsimportpermutations

forpinpermutations(items):

print(p)

permutations還支持多傳一個參數(shù)，比如上述的排列當(dāng)中我們希望只保留前兩個元素，除了切片之外，我們只需要多傳一個參數(shù)就好了，likethis：

forpinpermutations(items,2):

print(p)

除了排列之外，itertools當(dāng)中還支持組合，用法還是一樣，只是把函數(shù)名稱換成是combinations而已：

fromitertoolsimportcombindations

forcincombinations(items):

print(c)

在一般的組合當(dāng)中，一個元素一旦被選中那么它接下來就會從候選集當(dāng)中移除，再也不會被選中。如果我們希望獲得有放回的組合，我們可以再換一個函數(shù)，這個函數(shù)名稱有點(diǎn)長，但是名字倒也直觀叫做combinations_with_replacement。但既然是有放回的抽樣，我們需要設(shè)定元素的數(shù)量，否則抽樣可以無限進(jìn)行下去。

forcincombinations_with_replacement(items,3):

print(c)

迭代合并后的序列上一篇文章當(dāng)中我們介紹了zip可以同時迭代多個迭代器，除此之外還有一種情況是我們需要把多個迭代器串起來迭代。比如系統(tǒng)的日志打在了多個文件當(dāng)中，我們希望找出其中有error的日志來分析。這個時候，我們希望的不是同時讀取多個迭代器，而是希望能夠有辦法將多個迭代器的內(nèi)容串聯(lián)起來。這個功能就是itertools當(dāng)中的chain方法，它接受多個迭代器，當(dāng)我們遍歷的時候，會自動將多個迭代器的內(nèi)容串聯(lián)起來，我們可以無縫迭代。

舉個例子：

fromitertoolsimportchain

nums=[1,2,3]

chars=['a','b','c']

foriinchain(nums,chars):

print(i)

這樣我們會把nums和chars當(dāng)中的內(nèi)容一起輸出出來，就好像從頭到尾只執(zhí)行了一個迭代器一樣。

你可能會說我們不用chain也可以實(shí)現(xiàn)啊，我們可以這樣：

foriinnums+chars:

print(i)

的確，從結(jié)果上來看這樣也是行得通的。但是如果我們分析一下內(nèi)部執(zhí)行的時候的中間變量，會發(fā)現(xiàn)當(dāng)我們執(zhí)行nums+chars的時候，實(shí)際上是先創(chuàng)建了一個新的臨時list。然后在這個list當(dāng)中存儲nums和chars的數(shù)據(jù)，也就是說我們迭代的其實(shí)是這個新的list。這帶來的結(jié)果是我們額外開辟了一段內(nèi)存，并且花費(fèi)了一些時間。如果我們使用chain，它并不會有這樣的中間變量，完全是通過迭代器來執(zhí)行的迭代，非常節(jié)省內(nèi)存，這也是chain的優(yōu)點(diǎn)。

歸并迭代的內(nèi)容對于歸并操作我們應(yīng)該都不陌生，在之前的歸并排序以及一些題解的文章當(dāng)中我們見過很多次。同樣，我們在使用工具合并多個迭代器內(nèi)容的時候，如果迭代器當(dāng)中的內(nèi)容有序，我們也可以對多個迭代器當(dāng)中的元素進(jìn)行歸并，而不再需要我們自己手動操作。

使用我們之前介紹的heapq的庫可以非常輕松地做到這一點(diǎn)，我們一起來看一個例子：

a=[1,3,5]

b=[2,4,6]

importheapq

forcinheapq.merge(a,b):

print(c)

執(zhí)行之后，我們會得到[1,2,3,4,5,6]的結(jié)果。也就是說通過heapq.merge操作，我們把多個有序的迭代器合并到了一起。當(dāng)然我們也可以自己合并，但如果我們只是需要利用當(dāng)中的數(shù)據(jù)的話，使用merge操作可以節(jié)省內(nèi)存空間。

以上內(nèi)容為大家介紹了Python之迭代器的幾個高級用法，希望對大家有所幫助，如果想要了解更多Python相關(guān)知識，請關(guān)注 IT培訓(xùn)機(jī)構(gòu):千鋒教育。

久久精品国产亚洲高清|精品日韩中文乱码在线|亚洲va中文字幕无码久|伊人久久综合狼伊人久久|亚洲不卡av不卡一区二区|精品久久久久久久蜜臀AV|国产精品19久久久久久不卡|国产男女猛烈视频在线观看麻豆

Python之迭代器的幾個高級用法