今天就跟大家聊聊有關怎么在python中利用pandas創建一個Series數據類型,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。
Python是一種編程語言,內置了許多有效的工具,Python幾乎無所不能,該語言通俗易懂、容易入門、功能強大,在許多領域中都有廣泛的應用,例如最熱門的大數據分析,人工智能,Web開發等。
print(pd.__version__)
輸出:
0.24.1
常見的數據類型:
- 一維: Series
- 二維: DataFrame
- 三維: Panel …
- 四維: Panel4D …
- N維: PanelND …
array = ["粉條", "粉絲", "粉帶"] # 如果不指定索引, 默認從0開始; s1 = pd.Series(data=array) print(s1) # 如果不指定索引, 默認從0開始; ss1 = pd.Series(data=array, index=['A', 'B', 'C']) print(ss1)
輸出:
0 粉條 1 粉絲 2 粉帶 dtype: object A 粉條 B 粉絲 C 粉帶 dtype: object
n = np.random.randn(5) # 隨機創建一個ndarray對象; s2 = pd.Series(data=n) print(s2) # 修改元素的數據類型; ss2 = s2.astype(np.int) print(ss2)
輸出:
0 -1.649755 1 0.607479 2 0.943136 3 -1.794060 4 1.569035 dtype: float64 0 -1 1 0 2 0 3 -1 4 1 dtype: int64
dict = {string.ascii_lowercase[i]:i for i in range(10)} s3 = pd.Series(dict) print(s3)
輸出:
a 0 b 1 c 2 d 3 e 4 f 5 g 6 h 7 i 8 j 9 dtype: int64
共同部分:
import pandas as pd import numpy as np import string array = ["粉條", "粉絲", "粉帶"] s1 = pd.Series(data=array) print(s1)
輸出:
0 粉條 1 粉絲 2 粉帶 dtype: object
print(s1.index) #輸出:RangeIndex(start=0, stop=3, step=1) s1.index = ['A', 'B', 'C'] print(s1)
輸出:
A 粉條 B 粉絲 C 粉帶 dtype: object
s1.index = ['A', 'B', 'C'] array = ["粉條", "粉絲", "粉帶"] # 如果不指定索引, 默認從0開始; s2 = pd.Series(data=array) s3 = s1.append(s2) print(s3)
輸出:
A 粉條 B 粉絲 C 粉帶 0 粉條 1 粉絲 2 粉帶 dtype: object
s3 = s3.drop('C') # 刪除索引為‘C'對應的值; print(s3)
輸出:
A 粉條 B 粉絲 0 粉條 1 粉絲 2 粉帶 dtype: object
print(s3['B']) #粉絲 s3['B'] = np.nan #索引B處的值替換為缺失值 print(s3)
輸出:
A 粉條 B NaN 0 粉條 1 粉絲 2 粉帶 dtype: object
print(s3[:2]) #顯示前兩個元素 print(s3[::-1]) #逆序 print(s3[-2:]) # 顯示最后兩個元素
輸出:
A 粉條 B NaN dtype: object ------------------------- 2 粉帶 1 粉絲 0 粉條 B NaN A 粉條 dtype: object ------------------------- 1 粉絲 2 粉帶 dtype: object
先設置兩個Series對象:
import pandas as pd import numpy as np import string s1 = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5])) s2 = pd.Series(np.arange(2, 8), index=list(string.ascii_lowercase[2:8])) print(s1) print(s2)
按照對應的索引進行計算, 如果索引不同,則填充為Nan;
print(s1 + s2) print(s1.add(s2))
輸出:
a NaN b NaN c 4.0 d 6.0 e 8.0 f NaN g NaN h NaN dtype: float64
print(s1 - s2) print(s1.sub(s2))
輸出:
a NaN b NaN c 0.0 d 0.0 e 0.0 f NaN g NaN h NaN dtype: float64
print(s1 * s2) print(s1.mul(s2))
輸出:
a NaN b NaN c 4.0 d 9.0 e 16.0 f NaN g NaN h NaN dtype: float64
print(s1 / s2) print(s1.div(s2))
輸出:
a NaN b NaN c 1.0 d 1.0 e 1.0 f NaN g NaN h NaN dtype: float64
print(s1.median())
輸出:
2.0
print(s1.sum())
輸出:
10
print(s1.max())
輸出:
4
print(s1.min())
輸出:
0
series中的where方法運行結果和numpy中完全不同
import pandas as pd import numpy as np import string s1 = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5])) print(s1)
輸出:
a 0 b 1 c 2 d 3 e 4 dtype: int64
print(s1.where(s1 > 3))
大于3的顯示,不大于3的為NaN
# 對象中小于3的元素賦值為10; print(s1.where(s1 > 3, 10))
# 對象中大于3的元素賦值為10; print(s1.mask(s1 > 3, 10))
看完上述內容,你們對怎么在python中利用pandas創建一個Series數據類型有進一步的了解嗎?如果還想了解更多知識或者相關內容,請關注億速云行業資訊頻道,感謝大家的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。