# Pandas中nan, extract, round怎么用
在Pandas中處理數據時,`nan`、`extract`和`round`是常用的功能,下面分別介紹它們的用法。
## 1. 處理缺失值(nan)
Pandas用`np.nan`表示缺失值,常用方法包括:
```python
import pandas as pd
import numpy as np
# 創建含nan的DataFrame
df = pd.DataFrame({'A': [1, np.nan, 3], 'B': [4, 5, np.nan]})
# 檢測nan
print(df.isna())
# 填充nan
df.fillna(0, inplace=True) # 用0填充
str.extract()
用于從字符串列中提取匹配正則表達式的組:
data = pd.Series(['John Doe (30)', 'Jane Smith (25)'])
# 提取姓名和年齡
result = data.str.extract(r'([A-Za-z ]+) \((\d+)\)')
print(result)
輸出兩列:姓名和年齡
round()
用于對數值進行四舍五入:
df = pd.DataFrame({'A': [1.234, 2.567, 3.891]})
# 保留2位小數
df_rounded = df.round(2)
print(df_rounded)
輸出:
A
0 1.23
1 2.57
2 3.89
nan
用于表示和操作缺失值extract
配合正則表達式實現文本提取round
控制數值精度掌握這些方法能有效提升數據清洗效率。 “`
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。