溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

用python爬蟲爬取表情包

發布時間：2021-06-24 11:53:14 來源：億速云閱讀：246 作者：chen 欄目：編程語言

本篇內容介紹了“用python爬蟲爬取表情包”的有關知識，在實際案例的操作過程中，不少人都會遇到這樣的困境，接下來就讓小編帶領大家學習一下如何處理這些情況吧！希望大家仔細閱讀，能夠學有所成！

文章目錄

一、需要用到的模塊

二、開始寫代碼

1.創建保存圖片的文件夾

2.創建請求頭

3.代碼主體

4.創建循環

完整代碼

一、需要用到的模塊

import requests 
import os
from bs4 import BeautifulSoup

還需要有一個 lxml庫但不需要導入 BeautifulSoup 在 beautifulsoup4 的包下

二、開始寫代碼

1.創建保存圖片的文件夾

if not os.path.isdir("./img/"): #如果當前目錄下沒有img文件夾
    os.mkdir("./img/") #創建img文件夾

2.創建請求頭

headers={
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:52.0) Gecko/20100101 Firefox/52.0'
	}

那么為什么要創建請求頭呢，因為在網站訪問的過程中，有大部分網站會對當前請求做驗證，來判斷當前的請求是否合法(不是使用瀏覽器來獲取網站數據的話會被認為非法請求)。如果不添加請求頭的話，可能會出現當前網站沒有訪問權限。

提示：請求頭的內容可用Burpsuite來抓取 用python爬蟲爬取表情包

3.代碼主體

def pa(num):
    url = 'https://fabiaoqing.com/biaoqing/lists/page/'+str(num)+'.html' #構造url
    rp = requests.get(url,headers).text #請求url 用文本返回
    soup = BeautifulSoup(rp,'lxml') #構建soup
    img_list = soup.find_all('img',class_='ui image lazy') #篩選所有img標簽 條件為class=xxx
    for img in img_list:  
        img_url = img['data-original'] #獲取這個屬性的內容
        img_title = img['title'] 
        print(img_url,img_title)
        try:
            with open('img/'+img_title + os.path.splitext(img_url)[-1],'wb') as f: #圖片文件
                image = requests.get(img_url).content #請求img_url 以二進制返回
                f.write(image)
        except:
            pass

4.創建循環

for i in range(1,201): #網站有多少頁就設置多少
    pa(i)
# 將每一頁的圖片都抓下來

用python爬蟲爬取表情包

完整代碼

import requests #請求模塊
import os
from bs4 import BeautifulSoup #抓取網站內容
if not os.path.isdir("./img/"):
    os.mkdir("./img/")
headers={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64; rv:52.0) Gecko/20100101 Firefox/52.0'}
#創造頭
def pa(num):
    url = 'https://fabiaoqing.com/biaoqing/lists/page/'+str(num)+'.html' #構造url
    rp = requests.get(url,headers).text #請求url 用文本返回
    soup = BeautifulSoup(rp,'lxml') #構建soup
    img_list = soup.find_all('img',class_='ui image lazy') #篩選所有img標簽 條件為class=xxx
    for img in img_list:  
        img_url = img['data-original'] #獲取這個屬性的內容
        img_title = img['title'] 
        print(img_url,img_title)
        try:
            with open('img/'+img_title + os.path.splitext(img_url)[-1],'wb') as f:
                image = requests.get(img_url).content #請求img_url 以二進制返回
                f.write(image)
        except:
            pass
for i in range(1,201):
    pa(i)

“用python爬蟲爬取表情包”的內容就介紹到這里了，感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站，小編將為大家輸出更多高質量的實用文章！

向AI問一下細節

推薦閱讀：

免責聲明：本站發布的內容（圖片、視頻和文字）以原創、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
如何生成無限制的微信小程序碼
下一篇新聞：
java中poi如何設置生成的word圖片為上下型環繞

猜你喜歡

AI
助
手

產品服務

地區劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女