今天就跟大家聊聊有關如何用Python熱力圖可視化表格缺失數據,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。

Python熱力圖尋找缺失數據
你有沒有遇到一種情況,處理一張很大的csv表格的時候很難找到表格中每一列的缺失數據,或者說處理速度非常慢
?當然如果你的excel水平非常高,這些可能不會成為你的問題。但如果你想可視化出每一列缺失數據的分布和數量怎么辦?這時候就需要用Python繪制熱力圖了!
在開始之前我們需要安裝以下Python包(庫),打開你的CMD(Windows系統)/Terminal(macOS系統)輸入以下指令即可:
pip install seaborn
pip install pandas
pip install matplotlib
其中pandas是用于數據操作與處理的,matplotlib和seaborn主要用于Python數據可視化,也就是繪制我們所需要的熱力圖。
好了,廢話不多說,讓我們現在就開始使用panda加載數據:

沒錯,pandas的使用就這么簡單,讀取csv文件直接使用read_csv函數,你可以使用自己需要的csv文件,也可以使用我們提供的:Python推特機器人分類數據集:
https://pythondict.com/download/python-twitter-bot-classify-dataset-download/
中的training_data.csv,只需要你移動到當前代碼的文件夾下即可。
使用Python構造熱力圖識別表格的缺失數據:


Python熱力圖尋找缺失數據
seaborn.heatmap用于生成熱力圖,其會檢查data中的每個單元格,如果為空則標記為黃色,cmap為顏色圖譜,viridis即藍-綠-黃. 此外,matplotlib.pyplot主要用于負責展示圖片。如果你需要知道seaborn更詳細的參數文檔,可以閱讀這篇文章:
https://seaborn.pydata.org/api.html
整體代碼如下(一共只用了7行
)

看完上述內容,你們對如何用Python熱力圖可視化表格缺失數據有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注億速云行業資訊頻道,感謝大家的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。