溫馨提示×

pandas根據列去重的方法是什么

小億
175
2024-01-27 22:03:20
欄目: 編程語言

pandas根據列去重的方法是使用drop_duplicates()函數。該函數能夠返回一個新的DataFrame,其中的重復值已經被刪除。

具體用法如下:

df.drop_duplicates(subset=[列名], keep='first', inplace=True)
  • subset參數用于指定要檢查重復的列名或列名列表。默認情況下,該參數為None,表示檢查所有列。
  • keep參數用于指定保留哪一個重復值??蛇x值有first、lastFalse。默認為first,表示保留第一個出現的重復值;last表示保留最后一個出現的重復值;False表示刪除所有重復值。
  • inplace參數用于指定是否在原DataFrame上進行修改。默認為False,表示返回刪除重復值后的新DataFrame;若設置為True,則在原DataFrame上進行修改,并返回None。

示例:

import pandas as pd

# 創建一個包含重復值的DataFrame
data = {'A': [1, 2, 2, 3, 4, 4],
        'B': ['a', 'b', 'b', 'c', 'd', 'd']}
df = pd.DataFrame(data)

# 根據列'A'去重
df.drop_duplicates(subset=['A'], keep='first', inplace=True)
print(df)

輸出結果:

   A  B
0  1  a
1  2  b
3  3  c
4  4  d

在上述示例中,根據列’A’去重后,保留了第一個出現的重復值。

0
亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女