溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

什么是Python爬蟲爬取資料時遇到的cookie

發布時間:2020-08-25 16:23:52 來源:億速云 閱讀:303 作者:Leah 欄目:編程語言

什么是Python爬蟲爬取資料時遇到的cookie?很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。

cookie 的由來

大家都知道HTTP協議是無狀態的。

無狀態的意思是每次請求都是獨立的,它的執行情況和結果與前面的請求和之后的請求都無直接關系,

它不會受前面的請求響應情況直接影響,也不會直接影響后面的請求響應情況。

一句有意思的話來描述就是人生只如初見,對服務器來說,每次的請求都是全新的。

狀態可以理解為客戶端和服務器在某次會話中產生的數據,那無狀態的就以為這些數據不會被保留。

會話中產生的數據又是我們需要保存的,也就是說要“保持狀態”。因此Cookie就是在這樣一個場景下誕生。

cookie 定義

Cookie具體指的是一段小信息,它是服務器發送出來存儲在瀏覽器上的一組組鍵值對,

下次訪問服務器時瀏覽器會自動攜帶這些鍵值對,以便服務器提取有用信息。

1. 由服務器讓瀏覽器進行設置的

2. 瀏覽器保存在瀏覽器本地

3. 下次訪問時自動攜帶

cookie的工作原理是:由服務器產生內容,瀏覽器收到請求后保存在本地;當瀏覽器再次訪問時,

瀏覽器會自動帶上Cookie,這樣服務器就能通過Cookie的內容來判斷這個是“誰”了。

簡單的來說:cookie就是保存在瀏覽器本地上的一組組鍵值對。

cookie 簡單應用

1. 登錄(只是cookie一種應用)

2. 保存瀏覽習慣 如:分頁瀏覽器,顯示數據條數(只是cookie一種應用)

3. 簡單的投票 計數(只是cookie一種應用)

當我們關閉cookie的時,登錄博客園效果

什么是Python爬蟲爬取資料時遇到的cookie

什么是Python爬蟲爬取資料時遇到的cookie

查看cookie

什么是Python爬蟲爬取資料時遇到的cookie

什么是Python爬蟲爬取資料時遇到的cookie

什么是Python爬蟲爬取資料時遇到的cookie

cookie設置

獲取Cookie

request.COOKIES['key']
request.get_signed_cookie('key', default=RAISE_ERROR, salt='', max_age=None)
get_signed_cookie方法的參數:
- default: 默認值
- salt: 加密鹽
- max_age: 后臺控制過期時間

設置Cookie

rep = HttpResponse(...)
rep = render(request, ...)
rep.set_cookie(key,value,...)
rep.set_signed_cookie(key,value,salt='加密鹽',...)

參數:

- key, 鍵
- value='', 值
- max_age=None, 超時時間
- expires=None, 超時時間(IE requires expires, so set it if hasn't been already.)
- path='/', Cookie生效的路徑,/ 表示根路徑,特殊的:根路徑的cookie可以被任何url的頁面訪問
- domain=None, Cookie生效的域名
- secure=False, https傳輸
- httponly=False 只能http協議傳輸,無法被JavaScript獲?。ú皇墙^對,底層抓包可以獲取到也可以被覆蓋)

刪除Cookie

什么是Python爬蟲爬取資料時遇到的cookie

def logout(request):
    rep = redirect("/login/")
    rep.delete_cookie("user")  # 刪除用戶瀏覽器上之前設置的user的cookie值
    return rep

簡單的創建一個django項目,使用cookie完成用戶登錄狀態的效驗

1.login.html

<!DOCTYPE html>
<html>
<head>
    <meta charset="UTF-8">
    <meta http-equiv="x-ua-compatible" content="IE=edge">
    <meta name="viewport" content="width=device-width, initial-scale=1">
    <title>登錄</title>
</head>
<body>
<form action="" method="post">
{{% csrf_token %}}
    <p>
        用戶名: <input type="text" name="username">
    </p>
    <p>
        密碼: <input type="password" name="pwd">
    </p>
    <p>{{ error }}</p>
    <button>提交</button>
</form>
</body>
</html>

2.views.py

from django.views import View                        #導入基于類的視圖模塊
from django.shortcuts import render, redirect, HttpResponse#導入響應三劍客
class Login(View):                                   #登錄邏輯視圖函數
    def get(self, request, *args, **kwargs):         #處理get請求方法
        return render(request, 'login.html')         #如果是get請求(頁面刷新等操作),還是登錄頁面
    def post(self, request, *args, **kwargs):        #處理post請求方法
        username = request.POST.get('username')      #form表單提交的賬戶
        pwd = request.POST.get('pwd')                #form表單提交的密碼
        if username == 'gkf' and pwd == '318':       #賬戶密碼簡單校驗
            url = request.GET.get('return_url')      #獲取return_url,后面的路徑信息
            if url:                                  #如果有路徑信息
                ret = redirect(url)                  #重定向要訪問的路徑
            else:
                ret = redirect('/index/')            #如果沒有,默認重定向index頁面
            ret.set_cookie('is_login', '1')          #利用cookie標識登錄狀態
            return ret                               #響應請求
        return render(request, 'login.html', {'error': '用戶名或密碼錯誤'})#密碼賬戶錯誤,重定向login.html并提示
    
def login_required(func):                           #裝飾器函數,用來判斷,訪客登錄狀態
    def inner(request, *args, **kwargs):
        is_login = request.COOKIES.get('is_login')  #獲取is_login的狀態值
        url = request.path_info                     #訪問頁面的路徑信息
        if is_login != '1':                         #如果狀態值不為1表示未登錄
            return redirect('/login/?return_url={}'.format(url))#返會login頁面,并把之前訪問頁面信息,拼接在路徑后面
        ret = func(request, *args, **kwargs)        #如果狀態值是1,執行視圖函數
        return ret                                  #響應請求
    return inner
@login_required                                     #判斷登錄狀態裝飾器
def index(request):                                 #處理index路由請求的視圖函數
    return HttpResponse('首頁')                     #簡單模擬首頁
@login_required                                    #判斷登錄狀態裝飾器
def home(request):                                 #處理home路由請求的視圖函數
    return HttpResponse('home')                    # #簡單模擬home頁

密碼賬戶錯誤登錄失敗

什么是Python爬蟲爬取資料時遇到的cookie

訪問home也 登錄成功跳轉home頁面

什么是Python爬蟲爬取資料時遇到的cookie

直接從login頁面直接登錄,默認返回index頁面

什么是Python爬蟲爬取資料時遇到的cookie

看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女