迭代

2018-02-24 15:48 更新

跟一些比較牛X的程序員交流,經(jīng)常聽(tīng)到他們嘴里冒出一個(gè)不標(biāo)準(zhǔn)的英文單詞,而loop、iterate、traversal和recursion如果不在其內(nèi),總覺(jué)得他還不夠牛X。當(dāng)讓?zhuān)嬲的絕對(duì)不會(huì)這么說(shuō)的,他們只是說(shuō)“循環(huán)、迭代、遍歷、遞歸”,然后再問(wèn)“這個(gè)你懂嗎?”。哦,這就是真正牛X的程序員。不過(guò),他也僅僅是牛X罷了,還不是大神。大神程序員是什么樣兒呢?他是掃地僧,大隱隱于市。

先搞清楚這些名詞再說(shuō)別的:

  • 循環(huán)(loop),指的是在滿(mǎn)足條件的情況下,重復(fù)執(zhí)行同一段代碼。比如,while語(yǔ)句。
  • 迭代(iterate),指的是按照某種順序逐個(gè)訪問(wèn)列表中的每一項(xiàng)。比如,for語(yǔ)句。
  • 遞歸(recursion),指的是一個(gè)函數(shù)不斷調(diào)用自身的行為。比如,以編程方式輸出著名的斐波納契數(shù)列。
  • 遍歷(traversal),指的是按照一定的規(guī)則訪問(wèn)樹(shù)形結(jié)構(gòu)中的每個(gè)節(jié)點(diǎn),而且每個(gè)節(jié)點(diǎn)都只訪問(wèn)一次。

對(duì)于這四個(gè)聽(tīng)起來(lái)高深莫測(cè)的詞匯,其實(shí)前面,已經(jīng)涉及到了一個(gè)——循環(huán)(loop),本節(jié)主要介紹一下迭代(iterate),看官在網(wǎng)上google,就會(huì)發(fā)現(xiàn),對(duì)于迭代和循環(huán)、遞歸之間的比較的文章不少,分別從不同角度將它們進(jìn)行了對(duì)比。這里暫不比較,先搞明白python中的迭代。

當(dāng)然,迭代的話(huà)題如果要說(shuō)起來(lái),會(huì)很長(zhǎng),本著循序漸進(jìn)的原則,這里介紹比較初級(jí)的。

逐個(gè)訪問(wèn)

在python中,訪問(wèn)對(duì)象中每個(gè)元素,可以這么做:(例如一個(gè)list)

>>> lst
['q', 'i', 'w', 's', 'i', 'r']
>>> for i in lst:
...     print i,
... 
q i w s i r

除了這種方法,還可以這樣:

>>> lst_iter = iter(lst)    #對(duì)原來(lái)的list實(shí)施了一個(gè)iter()
>>> lst_iter.next()         #要不厭其煩地一個(gè)一個(gè)手動(dòng)訪問(wèn)
'q'
>>> lst_iter.next()
'i'
>>> lst_iter.next()
'w'
>>> lst_iter.next()
's'
>>> lst_iter.next()
'i'
>>> lst_iter.next()
'r'
>>> lst_iter.next()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

iter()是一個(gè)內(nèi)建函數(shù),其含義是:

上面的next()就是要獲得下一個(gè)元素,但是做為一名優(yōu)秀的程序員,最佳品質(zhì)就是“懶惰”,當(dāng)然不能這樣一個(gè)一個(gè)地敲啦,于是就:

>>> while True:
...     print lst_iter.next()
... 
Traceback (most recent call last):      #居然報(bào)錯(cuò),而且錯(cuò)誤跟前面一樣?什么原因
  File "<stdin>", line 2, in <module>
StopIteration

先不管錯(cuò)誤,再來(lái)一遍。

>>> lst_iter = iter(lst)                #上面的錯(cuò)誤暫且擱置,回頭在研究
>>> while True:
...     print lst_iter.next()
... 
q                                       #果然自動(dòng)化地讀取了
i
w
s
i
r
Traceback (most recent call last):      #讀取到最后一個(gè)之后,報(bào)錯(cuò),停止循環(huán)
  File "<stdin>", line 2, in <module>
StopIteration

首先了解一下上面用到的那個(gè)內(nèi)置函數(shù):iter(),官方文檔中有這樣一段話(huà)描述之:

iter(o[, sentinel])

Return an iterator object. The first argument is interpreted very differently depending on the presence of the second argument. Without a second argument, o must be a collection object which supports the iteration protocol (the?iter() method), or it must support the sequence protocol (the?getitem() method with integer arguments starting at 0). If it does not support either of those protocols, TypeError is raised. If the second argument, sentinel, is given, then o must be a callable object. The iterator created in this case will call o with no arguments for each call to its next() method; if the value returned is equal to sentinel, StopIteration will be raised, otherwise the value will be returned.

大意是說(shuō)...(此處故意省略若干字,因?yàn)槲蚁嘈趴创宋恼碌目垂儆⒄Z(yǔ)水平是達(dá)到看文檔的水平了,如果沒(méi)有,也不用著急,找個(gè)詞典什么的幫助一下。)

盡管不翻譯了,但是還要提煉一下主要的東西:

  • 返回值是一個(gè)迭代器對(duì)象
  • 參數(shù)需要是一個(gè)符合迭代協(xié)議的對(duì)象或者是一個(gè)序列對(duì)象
  • next()配合與之使用

什么是“可迭代的對(duì)象”呢?在前面學(xué)習(xí)的時(shí)候,曾經(jīng)提到過(guò),如果忘記了請(qǐng)往前翻閱。

一般,我們常常將哪些能夠用諸如循環(huán)語(yǔ)句之類(lèi)的方法來(lái)一個(gè)一個(gè)讀取元素的對(duì)象,就稱(chēng)之為可迭代的對(duì)象。那么用來(lái)循環(huán)的如for就被稱(chēng)之為迭代工具。

用嚴(yán)格點(diǎn)的語(yǔ)言說(shuō):所謂迭代工具,就是能夠按照一定順序掃描迭代對(duì)象的每個(gè)元素(按照從左到右的順序)。

顯然,除了for之外,還有別的可以稱(chēng)作迭代工具。

那么,剛才介紹的iter()的功能呢?它與next()配合使用,也是實(shí)現(xiàn)上述迭代工具的作用。

在python中,甚至在其它的語(yǔ)言中,迭代這塊的說(shuō)法比較亂,主要是名詞亂,剛才我們說(shuō),那些能夠?qū)崿F(xiàn)迭代的東西,稱(chēng)之為迭代工具,就是這些迭代工具,不少程序員都喜歡叫做迭代器。當(dāng)然,這都是漢語(yǔ)翻譯,英語(yǔ)就是iterator。

看官看上面的所有例子會(huì)發(fā)現(xiàn),如果用for來(lái)迭代,當(dāng)?shù)侥┪驳臅r(shí)候,就自動(dòng)結(jié)束了,不會(huì)報(bào)錯(cuò)。如果用iter()...next()迭代,當(dāng)最后一個(gè)完成之后,它不會(huì)自動(dòng)結(jié)束,還要向下繼續(xù),但是后面沒(méi)有元素了,于是就報(bào)一個(gè)稱(chēng)之為StopIteration的錯(cuò)誤(這個(gè)錯(cuò)誤的名字叫做:停止迭代,這哪里是報(bào)錯(cuò),分明是警告)。

看官還要關(guān)注iter()...next()迭代的一個(gè)特點(diǎn)。當(dāng)?shù)鷮?duì)象lst_iter被迭代結(jié)束,即每個(gè)元素都讀取了一遍之后,指針就移動(dòng)到了最后一個(gè)元素的后面。如果再訪問(wèn),指針并沒(méi)有自動(dòng)返回到首位置,而是仍然停留在末位置,所以報(bào)StopIteration,想要再開(kāi)始,需要重新載入迭代對(duì)象。所以,當(dāng)我在上面重新進(jìn)行迭代對(duì)象賦值之后,又可以繼續(xù)了。這在for等類(lèi)型的迭代工具中是沒(méi)有的。

文件迭代器

現(xiàn)在有一個(gè)文件,名稱(chēng):208.txt,其內(nèi)容如下:

Learn python with qiwsir.
There is free python course.
The website is:
http://qiwsir.github.io
Its language is Chinese.

用迭代器來(lái)操作這個(gè)文件,我們?cè)谇懊嬷v述文件有關(guān)知識(shí)的時(shí)候已經(jīng)做過(guò)了,無(wú)非就是:

>>> f = open("208.txt")
>>> f.readline()        #讀第一行
'Learn python with qiwsir.\n'
>>> f.readline()        #讀第二行
'There is free python course.\n'
>>> f.readline()        #讀第三行
'The website is:\n'
>>> f.readline()        #讀第四行
'http://qiwsir.github.io\n'
>>> f.readline()        #讀第五行,也就是這真在讀完最后一行之后,到了此行的后面
'Its language is Chinese.\n'
>>> f.readline()        #無(wú)內(nèi)容了,但是不報(bào)錯(cuò),返回空。
''

以上演示的是用readline()一行一行地讀。當(dāng)然,在實(shí)際操作中,我們是絕對(duì)不能這樣做的,一定要讓它自動(dòng)進(jìn)行,比較常用的方法是:

>>> for line in f:     #這個(gè)操作是緊接著上面的操作進(jìn)行的,請(qǐng)看官主要觀察
...     print line,    #沒(méi)有打印出任何東西 
... 

這段代碼之所沒(méi)有打印出東西來(lái),是因?yàn)榻?jīng)過(guò)前面的迭代,指針已經(jīng)移到了最后了。這就是迭代的一個(gè)特點(diǎn),要小心指針的位置。

>>> f = open("208.txt")     #從頭再來(lái)
>>> for line in f:
...     print line,
... 
Learn python with qiwsir.
There is free python course.
The website is:
http://qiwsir.github.io
Its language is Chinese.

這種方法是讀取文件常用的。另外一個(gè)readlines()也可以。但是,需要有一些小心的地方,看官如果想不起來(lái)小心什么,可以在將關(guān)于文件的課程復(fù)習(xí)一邊。

上面過(guò)程用next()也能夠讀取。

>>> f = open("208.txt")
>>> f.next()
'Learn python with qiwsir.\n'
>>> f.next()
'There is free python course.\n'
>>> f.next()
'The website is:\n'
>>> f.next()
'http://qiwsir.github.io\n'
>>> f.next()
'Its language is Chinese.\n'
>>> f.next()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration

如果用next(),就可以直接讀取每行的內(nèi)容。這說(shuō)明文件是天然的可迭代對(duì)象,不需要用iter()轉(zhuǎn)換了。

再有,我們用for來(lái)實(shí)現(xiàn)迭代,在本質(zhì)上,就是自動(dòng)調(diào)用next(),只不過(guò)這個(gè)工作,已經(jīng)讓for偷偷地替我們干了,到這里,列位是不是應(yīng)該給for取另外一個(gè)名字:它叫雷鋒。

還有,列表解析也能夠做為迭代工具,在研究列表的時(shí)候,看官想必已經(jīng)清楚了。那么對(duì)文件,是否可以用?試一試:

>>> [ line for line in open('208.txt') ]
['Learn python with qiwsir.\n', 'There is free python course.\n', 'The website is:\n', 'http://qiwsir.github.io\n', 'Its language is Chinese.\n']

至此,看官難道還不為列表解析所折服嗎?真的很強(qiáng)大,又強(qiáng)又大呀。

其實(shí),迭代器遠(yuǎn)遠(yuǎn)不止上述這么簡(jiǎn)單,下面我們隨便列舉一些,在python中還可以這樣得到迭代對(duì)象中的元素。

>>> list(open('208.txt'))
['Learn python with qiwsir.\n', 'There is free python course.\n', 'The website is:\n', 'http://qiwsir.github.io\n', 'Its language is Chinese.\n']

>>> tuple(open('208.txt'))
('Learn python with qiwsir.\n', 'There is free python course.\n', 'The website is:\n', 'http://qiwsir.github.io\n', 'Its language is Chinese.\n')

>>> "$$$".join(open('208.txt'))
'Learn python with qiwsir.\n$$$There is free python course.\n$$$The website is:\n$$$http://qiwsir.github.io\n$$$Its language is Chinese.\n'

>>> a,b,c,d,e = open("208.txt")
>>> a
'Learn python with qiwsir.\n'
>>> b
'There is free python course.\n'
>>> c
'The website is:\n'
>>> d
'http://qiwsir.github.io\n'
>>> e
'Its language is Chinese.\n'

上述方式,在編程實(shí)踐中不一定用得上,只是向看官展示一下,并且看官要明白,可以這么做,不是非要這么做。

補(bǔ)充一下,字典也可以迭代,看官自己不妨摸索一下(其實(shí)前面已經(jīng)用for迭代過(guò)了,這次請(qǐng)摸索一下用iter()...next()手動(dòng)一步一步迭代)。

以上內(nèi)容是否對(duì)您有幫助:
在線(xiàn)筆記
App下載
App下載

掃描二維碼

下載編程獅App

公眾號(hào)
微信公眾號(hào)

編程獅公眾號(hào)