溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

python中pandas.read_csv()函數的示例分析

發布時間：2021-03-29 10:39:13 來源：億速云閱讀：333 作者：小新欄目：開發技術

這篇文章主要介紹了python中pandas.read_csv()函數的示例分析，具有一定借鑒價值，感興趣的朋友可以參考下，希望大家閱讀完這篇文章之后大有收獲，下面讓小編帶著大家一起了解一下。

pandas庫簡介

官方網站里詳細說明了pandas庫的安裝以及使用方法，在這里獲取最新的pandas庫信息，不過官網僅支持英文。

pandas是一個Python包，并且它提供快速，靈活和富有表現力的數據結構。這樣當我們處理"關系"或"標記"的數據（一維和二維數據結構）時既容易又直觀。

pandas是我們運用Python進行實際、真實數據分析的基礎，同時它是建立在NumPy之上的。

csv文件格式簡介

函數介紹

pandas.csv() 函數將逗號分離的值（csv）文件讀入數據框架。還支持可選地將文件讀入塊或將其分解。

函數原型

源文件

pandas.read_csv(filepath_or_buffer, sep=, delimiter=None, header=‘infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, cache_dates=True, iterator=False, chunksize=None, compression=‘infer', thousands=None, decimal='.', lineterminator=None, quotechar='"', quoting=0, doublequote=True, escapechar=None, comment=None, encoding=None, dialect=None, error_bad_lines=True, warn_bad_lines=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None, storage_options=None

函數參數以及含義

輸入

參數名	功能以及含義
filepath_or_buffer	字符串。任何有效的字符串路徑都可以，網址也行。
sep	字符串，表示分隔符，默認為',' .。一個字符及以上都可以，注意如果是轉義字符要加''
delimiter	字符串，sep的別名，默認None
header	int或者int列表，默認由推斷出來。這是用于規定列名的行號。
names	類似于數組結構，選擇性使用。這是要使用的列名稱列表，與header共同使用。
index_col	整數或者字符串或者整數/字符串列表。指定用作的行標簽的列。
usecols	列表，可用可不用。功能是返回列的子集。
squeeze	布爾值，默認為False。如果解析的數據僅包含一列，則返回一個Series
prefix	字符串，選擇性使用。沒有標題時要添加到列號的前綴
mangle_dupe_cols	布爾值，默認為True。重復的列將被指定為“ X”，“ X.1”，……“ X.N”，而不是“ X”……“ X”。如果列中的名稱重復，則False將導致數據被覆蓋。
dtype	類型名稱或者類型列的字典，選擇性使用。數據或列的數據類型。
engine	{‘c', ‘python'}，選擇性使用。要使用的解析器引擎。C引擎速度更快，而python引擎當前功能更完善。
converters	字典，選擇性使用。轉換器，用于轉換某些列中的值的函數的字典。鍵可以是整數或列標簽。
true_value	列表，選擇性使用。視為True的值
false_values	列表，選擇性使用。視為False的值
skipinitialspace	布爾值，默認為False。在定界符后跳過空格。
skiprows	列表或者整數，選擇性使用。在文件開始處要跳過的行號（索引為0）或要跳過的行數（整數）。
skipfooter	整數，默認為0。要跳過的文件底部的行數（不支持engine =‘c'）。
nrows	整數，選擇性使用。要讀取的文件行數。對于讀取大文件很有用。
na_values	標量，字符串，類似列表的字典，選擇性使用。識別為NA / NaN的其他字符串。如果dict通過，則為特定的每列NA值。默認情況下，以下值解釋為NaN：''，'＃N / A'，'＃N / AN / A'，'＃NA'，'-1.＃IND'，'-1.＃QNAN'， ‘-NaN'，'-nan'，‘1.＃IND'，‘1.＃QNAN'，''，‘N / A'，‘NA'，‘NULL'，‘NaN'，‘n / a'，‘nan'，‘null'。
keep_default_na	布爾值，默認為True。解析數據時是否包括默認的NaN值。
na_filter	布爾值，默認為True。檢測缺失值標記（空字符串和na_values的值）。請注意，如果將na_filter傳遞為False，則將忽略keep_default_na和 na_values參數。
verbose	布爾值，默認為False。指示放置在非數字列中的NA值的數量。
skip_blank_lines	布爾值，默認為True。如果為True，跳過空白行，并且不解釋為NaN值。
parse_dates	布爾值，整數列表，名稱列表，列表或字典的列表。默認為False。功能是解析為時間。
infer_datetimes_format	布爾值，默認為False。如果啟用True和parse_dates，則pandas將嘗試推斷列中日期時間字符串的格式，并且如果可以推斷出日期格式，就會切換到更快的解析它們的方法。
keep_date_col	布爾值，默認為False。如果True和parse_dates指定合并多個列，則保留原始列。
date_parser	函數，選擇性使用。用于將字符串列序列轉換為日期時間實例數組的函數。
dayfirst	布爾值，默認為False。DD / MM格式的日期，國際和歐洲格式。
cache_dates	布爾值，默認為True。如果為True，則使用唯一的轉換日期緩存來應用datetime轉換。
iterator	布爾值，默認為False。返回TextFileReader對象以進行迭代或使用獲取塊 get_chunk()。
chunksize	整數，選擇性使用。返回TextFileReader對象以進行迭代。
compression	{‘infer', ‘gzip', ‘bz2', ‘zip', ‘xz', None}，默認為'infer'。用于對磁盤數據進行即時解壓縮。設置為“無”將不進行解壓縮。
thousands	字符串，選擇性使用。千位分隔符。
decimal	字符串，默認為'.'。識別為小數點的字符（例如，對于歐洲數據，請使用“，”）。
lineterminator	長度為1的字符串，選擇性使用。用于將文件分成幾行的字符。僅對C解析器有效。
quotechar	長度為1的字符串，選擇性使用。用于表示引用項目的開始和結束的字符。
quoting	整數或者csv.QUOTE_* 實例，默認為0。每個csv.QUOTE_*常量的控制字段引用行為。使用QUOTE_MINIMAL（0），QUOTE_ALL（1），QUOTE_NONNUMERIC（2）或QUOTE_NONE（3）中的一種。
doublequote	布爾值，默認為True。如果指定quotechar而未使用引號QUOTE_NONE，則指示是否將一個字段內的兩個連續的quotechar元素解釋為單個quotechar元素。
escapechar	長度為1的字符串，選擇性使用。一字符字符串，用于轉義其他字符。
comment	字符串，選擇性使用。指示不應分析行的其余部分。如果在一行的開頭找到該行，則將完全忽略該行。此參數必須是單個字符。
encoding	字符串，選擇性使用。讀/寫時用于UTF的編碼（例如'utf-8'）。
dialect	字符串或者csv.Dialect，選擇性使用。如果提供的話，該參數將覆蓋為以下參數的值（默認或不）：delimiter, doublequote, escapechar, skipinitialspace, quotechar, and quoting。
error_bad_lines	布爾值，默認為True。默認情況下，具有太多字段的行（例如，帶有太多逗號的csv行）將引發異常，并且不會返回任何DataFrame。如果為False，則這些“壞行”將從返回的DataFrame中刪除。
warn_bad_lines	布爾值，默認為True。如果error_bad_lines為False，而warn_bad_lines為True，則將為每個“壞行”輸出警告。
delim_whiterspace	布爾值，默認為False。指定是否將空格（例如或）用作分隔符。
low_memory	布爾值，默認為True。在內部對文件進行分塊處理，從而在解析時減少了內存使用。
memory_map	布爾值，默認為False。如果為filepath_or_buffer提供了文件路徑，則將文件對象直接映射到內存中，然后直接從那里訪問數據。使用此選項可以提高性能，因為不再有任何I / O開銷。
float_precision	字符串，選擇性使用。指定C引擎應將哪個轉換器用于浮點值。
storage_option	字典，選擇性使用。解析特殊的URL。如果為該參數提供非fsspec URL，則會引發錯誤。

返回

DataFrame：將逗號分隔值（csv）文件讀取到DataFrame中。

函數使用實例

終端使用范例：

>>>import pandas as pd
>>>pd.read_csv('data.csv')

代碼行使用范例

#導入pandas庫，并取別名為pd
import pandas as pd
#books.csv與項目不在同一文件夾下使用絕對路徑，分隔符為';'，出錯的行直接跳過，編碼方式使用"latin-1"，變量books是DataFrame數據結構
books = pd.read_csv('D:\coder\python_program\Books.csv', sep=';', error_bad_lines = False, encoding="latin-1")
#查看books的行和列
print(books.shape)
#查看
print(list(books.columns))
print(books.head())

感謝你能夠認真閱讀完這篇文章，希望小編分享的“python中pandas.read_csv()函數的示例分析”這篇文章對大家有幫助，同時也希望大家多多支持億速云，關注億速云行業資訊頻道，更多相關知識等著你來學習!

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
c#與js的rsa加密互通示例
下一篇新聞：
如何獲取docker容器里面的root權限

猜你喜歡

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女