溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

Python如何實現Excel數據的探索和清洗

發布時間：2021-04-28 10:27:41 來源：億速云閱讀：280 作者：小新欄目：編程語言

這篇文章主要介紹了Python如何實現Excel數據的探索和清洗，具有一定借鑒價值，感興趣的朋友可以參考下，希望大家閱讀完這篇文章之后大有收獲，下面讓小編帶著大家一起了解一下。

python是什么意思

Python是一種跨平臺的、具有解釋性、編譯性、互動性和面向對象的腳本語言，其最初的設計是用于編寫自動化腳本，隨著版本的不斷更新和新功能的添加，常用于用于開發獨立的項目和大型項目。

數據的探索和清洗

1、讀取Excel文件的數據并轉換為dataframe

# 1.讀取Excel文件的數據并轉換為dataframe
file = "d:/test/Summary/Data_Summary.xlsx"
data_raw = pd.read_excel(file, header=0, index_col=0)   
# header設定為0：是為了使第1行的數據成為列的字段名

2、查看數據集的整體狀態，了解基本特征列的情況

data_raw.head()

3、刪除無效的數據列

remove_col = ["序號"]
data_prep0 = data_raw.drop(columns=remove_col, axis=1, inplace=None)
data_prep0.head()

4、查看數據集的整體信息，了解缺失值的分布情況

data_prep0.info()

5、檢看數據集中缺失值的狀態并刪除缺失值

data_prep = data_prep0.dropna(subset=["產品"], axis=0)
data_prep.info()

6、檢查數據集中重復值的狀態并刪除重復值

print("數據集中的重復值數量：", np.sum(data_prep.duplicated()))
# 如果重復值的數量不為"0", 則表示有重復值存在，可使用下列代碼刪除
# data_prep.drop_duplicates(keep="first", inplace=True)

感謝你能夠認真閱讀完這篇文章，希望小編分享的“Python如何實現Excel數據的探索和清洗”這篇文章對大家有幫助，同時也希望大家多多支持億速云，關注億速云行業資訊頻道，更多相關知識等著你來學習!

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
python如何實現信息熵的計算代碼
下一篇新聞：
怎么新建html文件

猜你喜歡

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女