眼看著項目即將完成,卻被測試人員告知沒有通過性能測試,這種情況在開發(fā)中屢見不鮮。接下來的工作就是加班加點(diǎn)地找出性能瓶頸,然后進(jìn)行優(yōu)化,再進(jìn)行性能測試,如此這般周而復(fù)始直到通過性能測試。盡管豐富的工作經(jīng)驗(yàn)有助于性能優(yōu)化,但只有科學(xué)地應(yīng)用工具才能在最短的時間內(nèi)找出最佳優(yōu)化粒度的瓶頸代碼段,達(dá)到事半功倍的效果。
profile、cProfile與hotshot
Python內(nèi)置了豐富的性能優(yōu)化工具來幫助我們定位性能瓶頸,如:profile、cProfile和hotshot。它們易于使用,而且有完備的支持文檔可供參考。下面以最常用的profile模塊為例來說明它們的使用方法,假定要剖分的腳本文件為foo.py,它的內(nèi)容如下:
deffoo():
sum=0
foriinrange(100):
sum+=i
returnsum
if__name__=="__main__":
foo()
對foo.py進(jìn)行性能剖分的方法之一是修改foo.py里的if程序塊,引入profile模塊:
if__name__=="__main__":
importprofile
profile.run("foo()")
然后執(zhí)行foo.py即可完成性能剖分,剖分結(jié)果將以文本報表的形式打印到標(biāo)準(zhǔn)輸出。
因?yàn)樯鲜龇椒ㄐ枰薷膄oo.py文件,所以我們通常更傾向于使用無需修改源文件的方法——就是在命令行中用應(yīng)用python的–m參數(shù)來執(zhí)行profile:
python–mprofilefoo.py
除了可以使用profile模塊外,還可以使用cProfile模塊。cProfile由C語言實(shí)現(xiàn),是剖分代價更低的剖分器,有和profile模塊相同的接口,但只能用于2.5或以上版本。Python另一個內(nèi)置的剖分器是hotshot,但是hotshot模塊已經(jīng)不再推薦使用,因?yàn)閷硭赡軙灰瞥鰳?biāo)準(zhǔn)庫。
pstats
無論使用哪個剖分器,它的剖分?jǐn)?shù)據(jù)都可以保存到二進(jìn)制文件,如foo.prof。分析和查看剖分結(jié)果文件需要使用pstats模塊,它極具伸縮性,可以輸出形式多樣的文本報表,是文本界面下不可或缺的工具。
使用pstats分析剖分結(jié)果很簡單,幾行代碼就可以了:
importpstats
p=pstats.Stats("foo.prof")
p.sort_stats("time").print_stats()
運(yùn)行上述腳本將輸出結(jié)果為按函數(shù)內(nèi)部運(yùn)行時間(不計調(diào)用子函數(shù)的時間)長短排序的報表。
sort_stats()方法是pstats.Stats最重要的方法之一,它用以對剖分?jǐn)?shù)據(jù)進(jìn)行排序。sort_stats()接受一個字符串參數(shù),這個字符串標(biāo)識了排序的字段,常用的可選的參數(shù)及其意義如下:
ncalls’
被調(diào)用次數(shù)
‘cumulative’
函數(shù)運(yùn)行的總時間
‘nfl’
Name/file/line
‘time’
函數(shù)內(nèi)部運(yùn)行時間(不計調(diào)用子函數(shù)的時間)
除了sort_stats()外,pstats.Stats還有print_callees()和print_callers()方法用以輸出指定函數(shù)所調(diào)用的函數(shù)和調(diào)用過指定函數(shù)的函數(shù)。
除了編編程接口外,pstats還提供了友好的命令行交互環(huán)境,在命令行執(zhí)行python–mpstats就可以進(jìn)入交互環(huán)境,在交互環(huán)境里可以使用read/add指令讀入/加載剖分結(jié)果文件,stats指令用以查看報表,callees和callers指令用以查看特定函數(shù)的被調(diào)用者和調(diào)用者。下圖是pstats的截圖,標(biāo)識了它的基本使用方法
以上內(nèi)容為大家介紹了Python性能剖分工具,希望對大家有所幫助,如果想要了解更多Python相關(guān)知識,請關(guān)注IT培訓(xùn)機(jī)構(gòu):千鋒教育。http://m.2667701.com/