本篇文章給大家分享的是有關在Python中使用for循環時需要注意哪些問題,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。
陷阱 1:循環兩次
現在我們先假設有一個數字組成的列表,和一個用于返回這些數字的平方的生成器:
>>> nums = [1, 2, 3, 4] >>> squares = (n**2 for n in nums)
我們可以將這個生成器對象傳遞給元組構造器,從而可以得到一個元組:
>>> tuple(squares) (1, 4, 9, 16)
這個時候,如果我們再將這個構造器對象傳遞給 sum 函數,按理說應該會返回這些數字的和吧:
>>> sum(squares) 0
返回的是個 0,先拖住下巴。
陷阱 2:檢查是否包含
我們還是使用上面的數字列表和生成器:
>>> nums = [1, 2, 3, 4] >>> squares = (n**2 for n in nums)
如果我 squares 生成器中是否包含 9,答案是肯定的,若果我再問一次呢?
你敢答應嗎
>>> 9 in squares True >>> 9 in squares False
發現,第二次不靈了~
怎么不靈了
陷阱 3:拆包
現在假設有一個字典:
>>> counts = {1:'a', 2:'b'}
然后,我們用多個變量對字典進行拆包:
>>> x,y = counts
你覺得這時候,x 和 y 中會是什么?
>>> x 1 >>> y 2
我們只得到了鍵。
下面,我們先來了解下 Python 中的循環工作原理,然后再反過頭來看這些陷阱問題。
一些概念
首先,先了解一些基本概念:
可迭代和序列
可迭代就是指任意可以使用 for 循環遍歷的東西,可迭代意味著可以遍歷,任何可以遍歷的東西都是可迭代的。
for item in some_iterable: print(item)
序列是一種常見的可迭代類型,如列表、元組、字符串等。
序列是可迭代的,它有著一些特點,它們是從 0 開始索引,索引長度不超過序列的長度;它們有序列長度;并且它們可以被切分。
Python 中的大部分東西都是可以迭代的,但是可以迭代并不意味著它是序列。如集合、字典、文件和生成器都是可迭代的,但是它們都不是序列。
>>> my_set = {1, 2, 3} >>> my_dict = {'k1': 'v1', 'k2': 'v2'} >>> my_file = open('some_file.txt') >>> squares = (n**2 for n in my_set)
總結下來就是,任何可以用 for 循環遍歷的東西都是可迭代的,序列可迭代的類型中的一種,Python 還有著許多其他種類的可迭代類型。
迭代器
迭代器就是可以驅動可迭代對象的東西。你可以從任何可迭代對象中獲得迭代器,你也可以使用迭代器來手動對它的迭代進行遍歷。
下面有三個可迭代對象:一個集合、一個元祖和一個字符串:
>>> nums = {1,2,3,4} >>> coors = (4,5,6) >>> words = "hello hoxis"
我們可以使用 Python 的內置函數 iter ,從這些可迭代對象中獲取到迭代器:
>>> iter(nums) <setiterator object at 0x7fa8c194ad70> >>> iter(coors) <tupleiterator object at 0x7fa8c1959610> >>> iter(words) <iterator object at 0x7fa8c19595d0>
一旦我們有了迭代器,我們就可以使用其內置函數 next() 來獲取它的下一個值:
>>> nums = {1,2,3,4} >>> num_iter = iter(nums) >>> next(num_iter) 1 >>> next(num_iter) 2 >>> next(num_iter) 3 >>> next(num_iter) 4 >>> next(num_iter) Traceback (most recent call last): File "<stdin>", line 1, in <module> StopIteration
若果迭代到頭了,也就是沒有下一個值了,就會拋出 StopIteration 異常。也就是說,它不會繼續循環取獲取第一個值。
是不是有點懵逼了?
可迭代對象是可以迭代的東西
迭代對象器實際上是遍歷可迭代對象的代理
迭代器沒有長度,它們不能被索引。
可以使用迭代器來做的唯一有用的事情是將其傳遞給內置的 next 函數,或者對其進行循環遍歷
可以使用 list() 函數將迭代器轉換為列表
>>> nums = {1,2,3,4} >>> num_iter = iter(nums) >>> next(num_iter) 1 >>> list(num_iter) [2, 3, 4] >>> list(num_iter) []
若果想再次將其轉換為列表,明顯地,得到的是一個空列表。
其實這也是迭代器的一個重要特性:惰性,只能使用一次,只能循環遍歷一次。并且,在我們調用 next() 函數之前,它不會做任何事情。因此,我們可以創建無限長的迭代器,而創建無限長的列表則不行,那樣會耗盡你的內存!
可迭代對象不一定是迭代器,但是迭代器一定是可迭代的:
對象 | 可迭代? | 迭代器? |
---|---|---|
可迭代對象 | √ | 不一定 |
迭代器 | √ | √ |
生成器 | √ | √ |
列表 | √ | × |
其實,Python 中有許多迭代器,生成器是迭代器,Python 的許多內置類型也是迭代器。例如,Python 的 enumerate 和 reversed 對象就是迭代器。zip, map 和 filter 也是迭代器;文件對象也是迭代器。
Python 中的 for 循環
其實,Python 并沒有傳統的 for 循環,什么是傳統的 for 循環?
我們看下 Java 中的 for 循環:
int[] integers = {1, 2, 3, 4}; for (int j = 0; j<integers.length; j++) { int i = integers[j]; System.out.println(i); }
這是一種 C風格 的 for 循環,JavaScript、C、C++、Java、PHP 和一大堆其他編程語言都有這種風格的 for 循環,但是 Python 確實沒有。
Python 中的我們稱之為 for 循環的東西,確切的說應該是 foreach 循環:
numbers = [1, 2, 3, 5, 7] for n in numbers: print(n)
和 C風格 的 for 循環不同之處在于,Python 的 for 循環沒有索引變量,沒有索引變量的初始化,邊界檢查和索引變量的增長。
這就是 Python 的 for 循環的不同之處!
使用索引?
你可能會懷疑,Python 的 for 循環是否在底層使用了索引,下面我們手動的使用 while 循環和索引來遍歷:
>>> nums = [1,2,3,4] >>> i = 0 >>> while i < len(nums): ... print(num[i]) ... i += 1 ... 0 1 2 3
對于列表,這樣遍歷是可以的,但不代表適用于所有可迭代對象,它只適用于序列。
比如,我們對一個 set 使用這種方法遍歷,會得到一個異常:
>>> set = {1,2,3} >>> i = 0 >>> while i < len(set): ... print(set[i]) ... i += 1 ... Traceback (most recent call last): File "<stdin>", line 2, in <module> TypeError: 'set' object does not support indexing
因為 set 不是序列,因此不支持索引遍歷。
我們不能使用索引手動對 Python 中的每一個迭代對象進行遍歷。對于那些不是序列的迭代器來說,更是行不通的。
實現沒有 for 的循環
從上文可以看出,Python 中的 for 循環不使用索引,它使用的是迭代器。讓我們來看下它是如何工作的。
通過上文,我們了解到了迭代器和 iter、next 函數,現在我們可以嘗試不用 for 循環來遍歷一個可迭代對象。
下面是一個正常的 for 循環:
def funky_for_loop(iterable, action_to_do): for item in iterable: action_to_do(item)
我們要嘗試用迭代器的方法和 while 實現上面 for 循環的邏輯,大致步驟如下:
獲取給定可迭代對象的迭代器;
調用迭代器的 next() 方法獲取下一項;
對當前項數據進行處理;
如果捕獲到 StopIteration ,那么就停止循環
def funky_for_loop(iterable, action_to_do): iterator = iter(iterable) while not done_looping: try: item = next(iterator) except StopIteration: break else: action_to_do(item)
Python 底層的循環工作方式基本上如上代碼,就是迭代器驅動的 for 循環。
再次回到循環陷阱
陷阱 1:耗盡的迭代器
陷阱 1 中,因為生成器是迭代器,迭代器是惰性的,也是一次性的,在已經遍歷過一次的情況下,再對其求和,返回的就是一個 0。
陷阱 2:部分消耗迭代器
陷阱 2 中,我們兩次詢問 9 是否存在于同一個生成器中,得到了不同的答案。
這是因為,第一次詢問時,Python 已經對這個生成器進行了遍歷,也就是調用 next() 函數查找 9,找到后就會返回 True,第二次再詢問 9 是否存在時,會從上次的位置繼續 next() 查找。
>>> nums = [1,2,3,4,5] >>> squares = (n**2 for n in nums) >>> 9 in squares True # 此時打印出來 >>> list(squares) [16, 25]
陷阱 3:拆包是迭代
當直接在字典上迭代時,得到的是鍵:
>>> counts = {1:'a',2:'b'} >>> for i in counts: ... print(i) ... 1 2
而對字典拆包時,和在字典上遍歷是一樣的,都是依賴于迭代器協議,因此得到的也是鍵。
以上就是在Python中使用for循環時需要注意哪些問題,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。