溫馨提示×

pandas根據列去重的方法是什么

Pandas

小億

175

2024-01-27 22:03:20

欄目: 編程語言

pandas根據列去重的方法是使用drop_duplicates()函數。該函數能夠返回一個新的DataFrame，其中的重復值已經被刪除。

具體用法如下：

df.drop_duplicates(subset=[列名], keep='first', inplace=True)

subset參數用于指定要檢查重復的列名或列名列表。默認情況下，該參數為None，表示檢查所有列。
keep參數用于指定保留哪一個重復值?？蛇x值有first、last和False。默認為first，表示保留第一個出現的重復值；last表示保留最后一個出現的重復值；False表示刪除所有重復值。
inplace參數用于指定是否在原DataFrame上進行修改。默認為False，表示返回刪除重復值后的新DataFrame；若設置為True，則在原DataFrame上進行修改，并返回None。

示例：

import pandas as pd

# 創建一個包含重復值的DataFrame
data = {'A': [1, 2, 2, 3, 4, 4],
        'B': ['a', 'b', 'b', 'c', 'd', 'd']}
df = pd.DataFrame(data)

# 根據列'A'去重
df.drop_duplicates(subset=['A'], keep='first', inplace=True)
print(df)

輸出結果：

在上述示例中，根據列’A’去重后，保留了第一個出現的重復值。

0 贊

0 踩

最新問答

相關問答

相關標簽

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女