·垃圾回收
我們作為Python程序員也是非常幸福的,我們?nèi)粘2惶枰P(guān)注內(nèi)存管理和垃圾回收,是因?yàn)镃Python的解釋器有一套自己的機(jī)制來處理。那么,在Python的世界里為什么不太需要關(guān)注垃圾回收呢?
這是因?yàn)镻ython自己的解釋器自動(dòng)做了垃圾回收相應(yīng)的處理,在絕大部分場景下是不需要人為的干涉的。另外,大家對(duì)于Python的共識(shí)就是開發(fā)效率。因?yàn)槠涫且粋€(gè)膠水語言,在很多場景下高性能以及內(nèi)存問題其實(shí)并不凸顯,而且現(xiàn)在服務(wù)器資源很便宜而人力資源很貴的情況下。
使用Python做Web開發(fā),工作很多年也不太會(huì)遇到內(nèi)存管理和垃圾回收的。在Web應(yīng)用幾乎都是使用多進(jìn)程模型的,一則是會(huì)有定期超時(shí)重啟的機(jī)制,二是每次上線的操作也會(huì)進(jìn)程的重啟。所以不會(huì)有某個(gè)進(jìn)程長時(shí)間的駐留,使其占用很多內(nèi)存,導(dǎo)致內(nèi)存泄漏。所以,GC的缺陷基本不太會(huì)對(duì)Web開發(fā)產(chǎn)生很大的影響。且CPython也足夠完善,基本不太會(huì)出現(xiàn)內(nèi)存泄漏這樣的問題。大部分場景下,都是因?yàn)殚_發(fā)者錯(cuò)誤的使用或者是誤判導(dǎo)致內(nèi)存占用不正常。
·引用計(jì)數(shù)
Python的垃圾回收是建立在引用技術(shù)上的,所以理解引用計(jì)數(shù)也是非常重要的。而引用計(jì)數(shù)的原理就是,當(dāng)一個(gè)對(duì)象的引用被創(chuàng)建或者復(fù)制時(shí),對(duì)象的引用計(jì)數(shù)加1;當(dāng)一個(gè)對(duì)象的引用被銷毀時(shí),對(duì)象的引用計(jì)數(shù)減1;當(dāng)對(duì)象的引用計(jì)數(shù)減少為0時(shí),就意味著對(duì)象已經(jīng)沒有被任何人使用了,可以將其所占用的內(nèi)存立刻釋放了。
引用計(jì)數(shù)這種機(jī)制的特點(diǎn)是,有比較好的實(shí)時(shí)性,但是引用計(jì)數(shù)會(huì)有一個(gè)循環(huán)引用的問題。比如說A引用了B,而B又引用了A,導(dǎo)致每一個(gè)對(duì)象的引用計(jì)數(shù)都不為0,那么A和B占用的內(nèi)存資源永遠(yuǎn)都不會(huì)被回收。所以,就需要一些回收算法來解決這個(gè)問題,而Python就是使用了標(biāo)記清除和分代回收機(jī)制。
·標(biāo)記清除
上面我們說了,標(biāo)記-清除就是為解決循環(huán)引用的問題。最理想的情況下,比如說有兩個(gè)對(duì)象A和B,其中A有一個(gè)B的引用,就會(huì)將B的引用計(jì)數(shù)減1。然后順著引用達(dá)到B,因?yàn)锽有一個(gè)引用了A,同樣將A的引用計(jì)數(shù)減少1。這樣,就將引用計(jì)數(shù)中循環(huán)引用的環(huán)給摘除。
但是,還會(huì)存在另外一個(gè)問題。假設(shè)對(duì)象A,它有一個(gè)對(duì)象C的引用,而C并沒有引用A。如果將C的引用計(jì)數(shù)減少1,而最后A沒有被回收,顯然我們錯(cuò)誤將C的引用計(jì)數(shù)減少了1。這樣,將導(dǎo)致在未來的某個(gè)時(shí)段出現(xiàn)了一個(gè)對(duì)C的懸空引用。這就要求我們?cè)贑沒有被刪除的情況下,復(fù)用C的引用計(jì)數(shù)。如果采用這樣方案的話,那么維護(hù)這個(gè)引用計(jì)數(shù)的復(fù)雜度就會(huì)成倍的增加。而這個(gè)標(biāo)記清除采用了更好的做法來解決這個(gè)問題。
標(biāo)記清除采用了更好的做法,它并不改動(dòng)真實(shí)的引用計(jì)數(shù),而是將集合中對(duì)象的引用計(jì)數(shù)復(fù)制一份副本,改動(dòng)該對(duì)象引用的副本。對(duì)于副本做任何的改動(dòng),都不會(huì)影響到對(duì)象生命周期的維護(hù)。
·分代回收
分代回收是在面試中,常常會(huì)被問到的一個(gè)問題。分代回收的核心思想就是,對(duì)象存活的時(shí)間越長,越不可能是垃圾,應(yīng)該更少的去回收。且Python將所有的對(duì)象分為0、1、2三代,所有的新建對(duì)象都是0代對(duì)象。但是,當(dāng)某一代對(duì)象經(jīng)歷過垃圾回收,依然存活,那么它就被歸入下一代對(duì)象,即1代或者2代了。
分代回收的預(yù)值,可以使用如下代碼進(jìn)行查看。通常,返回一個(gè)元組且包含三個(gè)數(shù)值,默認(rèn)值為(700,10,10)。其中第一個(gè)數(shù)值700表示,從上一個(gè)垃圾回收到現(xiàn)在分配內(nèi)存的數(shù)目減去釋放內(nèi)存的數(shù)目。如果這個(gè)數(shù)值到了700,則會(huì)對(duì)第一代的垃圾對(duì)象進(jìn)行回收,并且給第二個(gè)數(shù)值加1。當(dāng)?shù)诙€(gè)數(shù)值增加到10的時(shí)候,就會(huì)對(duì)第一代和第二代的垃圾對(duì)象進(jìn)行回收,并且給第三個(gè)數(shù)值加1。當(dāng)?shù)谌齻€(gè)數(shù)值增加到10的時(shí)候,則三代都會(huì)被回收,然后初始化為(0,0,0)并繼續(xù)開始計(jì)數(shù)。
需要注意的是,如果沒有十分必要的場景,這個(gè)分代回收的默認(rèn)值通常是不需要我們?nèi)藶榈母膭?dòng)的。
In[1]:importgc
In[2]:gc.get_threshold()
Out[2]:(700,10,10)
·強(qiáng)制回收
上面介紹了Python的自動(dòng)垃圾回收機(jī)制,而Python也支持在某一刻特定的時(shí)間點(diǎn),使用gc.collect()方法強(qiáng)制回收。不會(huì),通常我們是不適用強(qiáng)制回收的,而是使用下面這種禁用垃圾回收的方式。
·禁用垃圾回收
這個(gè)垃圾回收機(jī)制不是挺好的,那我們會(huì)什么還要禁用呢。通常我們禁用GC的一個(gè)場景就是,某一段代碼中需要加載大量的原始數(shù)據(jù),尤其是有大量的新建、刪除對(duì)象這樣的操作。也就是執(zhí)行某一段代碼的時(shí)候,會(huì)自動(dòng)觸發(fā)很多次的垃圾回收。但是,我們需要知道Python執(zhí)行垃圾回收的時(shí)候,它會(huì)暫停當(dāng)前的工作。所以,這種工作耗時(shí)越多就會(huì)拖累我們程序的運(yùn)行時(shí)間。
那我們?cè)趺崔k呢?我們通常都會(huì)在執(zhí)行這段代碼之前,禁用垃圾回收,執(zhí)行完之后再手動(dòng)開啟。熟悉開源項(xiàng)目的同學(xué)可以會(huì)看到,有些項(xiàng)目中會(huì)使用gc.set_threshold(0)而不用gc.disable這種寫法。是因?yàn)橛行┑谌降膸鞎?huì)隱式的啟用GC讓gc.disable不起作用了,而使用gc.set_threshold(0)就不會(huì)有第三方的庫把垃圾回收開啟了,除非我們想要把它開啟。
gc.disable()
dosomethings
gc.enable()
以上內(nèi)容為大家介紹了Python為什么不太需要關(guān)注垃圾回收呢?希望對(duì)大家有所幫助,如果想要了解更多Python相關(guān)知識(shí),請(qǐng)關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。http://m.2667701.com/