Python優化中如何算出每條語句執行時間,很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。
用Python寫的程序,確實在性能上會比其他語言差一些,這是因為Python為了最大化開發效率,犧牲了一定的運行效率。開發效率和運行效率往往是魚與熊掌不可兼得的關系。
不過,程序性能較差有很多原因,并不能全把鍋甩到Python身上,我們應該首先從自己的代碼上找原因,找原因最快的方法就是算出自己寫的語句或函數的執行時間。這時候,很多人都會選擇用以下的形式打印出語句的執行時間:
這是一種比較低效的做法,如果你有上萬條語句要測試,想用這個方法來找到瓶頸簡直是大海撈針。幸好,得益于Python強大的社區功能,我們有很多關于效率的模塊可以使用,今天要介紹的是 line_profiler , 它可以算出函數里每條語句的占用時間。
我們將使用上次電影人臉識別中的代碼進行講解:Python 識別電影中的人臉,不過要注意,這篇推送里的函數少傳遞了幾個參數,正確參數請點擊該推送下方的閱讀原文進行查看哦。
Python環境當然是必備的,如果你還沒有安裝Python,可以看這篇文章:超詳細Python安裝指南。
打開cmd/terminal輸入以下命令安裝line_profile:
pip install line_profiler
windows機器如果出現 Microsoft Visual C++ 14.0 is required 這樣的錯誤,請前往微軟官網,下載vs2015勾選"適用于visual C++2015的公共工具" 進行安裝。
如果出現:ModuleNotFoundError: No module named 'skbuild'
的情況,請輸入以下命令安裝scikit-build:
pip install scikit-build
實在還是安裝不上的話,可以下載anaconda,輸入以下命令安裝:
conda install -c anaconda line_profiler
使用方式非常簡單,比如原來我們在讀取人臉的代碼中,主函數是這樣的:
我們要測的是read_pic_save_face函數中所有語句的執行時間,只需要這樣調用line_profiler:
這樣就可以獲得該函數所有語句的執行時間報表。當然,它還有許多其他的調用方法,具體可以看line_profiler說明文檔:
https://github.com/rkern/line_profiler
line_profiler報告包括幾個部分:
Line: 語句位于第幾行
Hits: 該行被執行的次數
Time: 該語句運行的總時間
Per Hit: 該語句運行一次的平均耗時
% Time: 該語句占總時間的比重
可以看到,我們的這份代碼主要是在face_cascade.detectMultiScale 耗時最久,這是opencv的分類器執行效率問題。知道了是這里的效率問題,優化就有一個目標了。
這一部分的優化,我們可以從硬件方面入手,讓OpenCV在GPU上運行算法,這樣做性能將遠超在CPU上運行的性能,這是絕招。其次就是利用多線程計算(沒試過,不確定是否有用,或許下次可以試一下)。
看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。