什么是Python爬蟲爬取資料時遇到的cookie?很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。
cookie 的由來
大家都知道HTTP協議是無狀態的。
無狀態的意思是每次請求都是獨立的,它的執行情況和結果與前面的請求和之后的請求都無直接關系,
它不會受前面的請求響應情況直接影響,也不會直接影響后面的請求響應情況。
一句有意思的話來描述就是人生只如初見,對服務器來說,每次的請求都是全新的。
狀態可以理解為客戶端和服務器在某次會話中產生的數據,那無狀態的就以為這些數據不會被保留。
會話中產生的數據又是我們需要保存的,也就是說要“保持狀態”。因此Cookie就是在這樣一個場景下誕生。
cookie 定義
Cookie具體指的是一段小信息,它是服務器發送出來存儲在瀏覽器上的一組組鍵值對,
下次訪問服務器時瀏覽器會自動攜帶這些鍵值對,以便服務器提取有用信息。
1. 由服務器讓瀏覽器進行設置的
2. 瀏覽器保存在瀏覽器本地
3. 下次訪問時自動攜帶
cookie的工作原理是:由服務器產生內容,瀏覽器收到請求后保存在本地;當瀏覽器再次訪問時,
瀏覽器會自動帶上Cookie,這樣服務器就能通過Cookie的內容來判斷這個是“誰”了。
簡單的來說:cookie就是保存在瀏覽器本地上的一組組鍵值對。
cookie 簡單應用
1. 登錄(只是cookie一種應用)
2. 保存瀏覽習慣 如:分頁瀏覽器,顯示數據條數(只是cookie一種應用)
3. 簡單的投票 計數(只是cookie一種應用)
當我們關閉cookie的時,登錄博客園效果


查看cookie



cookie設置
獲取Cookie
request.COOKIES['key']
request.get_signed_cookie('key', default=RAISE_ERROR, salt='', max_age=None)
get_signed_cookie方法的參數:
- default: 默認值
- salt: 加密鹽
- max_age: 后臺控制過期時間設置Cookie
rep = HttpResponse(...) rep = render(request, ...) rep.set_cookie(key,value,...) rep.set_signed_cookie(key,value,salt='加密鹽',...)
參數:
- key, 鍵 - value='', 值 - max_age=None, 超時時間 - expires=None, 超時時間(IE requires expires, so set it if hasn't been already.) - path='/', Cookie生效的路徑,/ 表示根路徑,特殊的:根路徑的cookie可以被任何url的頁面訪問 - domain=None, Cookie生效的域名 - secure=False, https傳輸 - httponly=False 只能http協議傳輸,無法被JavaScript獲?。ú皇墙^對,底層抓包可以獲取到也可以被覆蓋)
刪除Cookie

def logout(request):
rep = redirect("/login/")
rep.delete_cookie("user") # 刪除用戶瀏覽器上之前設置的user的cookie值
return rep簡單的創建一個django項目,使用cookie完成用戶登錄狀態的效驗
1.login.html
<!DOCTYPE html>
<html>
<head>
<meta charset="UTF-8">
<meta http-equiv="x-ua-compatible" content="IE=edge">
<meta name="viewport" content="width=device-width, initial-scale=1">
<title>登錄</title>
</head>
<body>
<form action="" method="post">
{{% csrf_token %}}
<p>
用戶名: <input type="text" name="username">
</p>
<p>
密碼: <input type="password" name="pwd">
</p>
<p>{{ error }}</p>
<button>提交</button>
</form>
</body>
</html>2.views.py
from django.views import View #導入基于類的視圖模塊
from django.shortcuts import render, redirect, HttpResponse#導入響應三劍客
class Login(View): #登錄邏輯視圖函數
def get(self, request, *args, **kwargs): #處理get請求方法
return render(request, 'login.html') #如果是get請求(頁面刷新等操作),還是登錄頁面
def post(self, request, *args, **kwargs): #處理post請求方法
username = request.POST.get('username') #form表單提交的賬戶
pwd = request.POST.get('pwd') #form表單提交的密碼
if username == 'gkf' and pwd == '318': #賬戶密碼簡單校驗
url = request.GET.get('return_url') #獲取return_url,后面的路徑信息
if url: #如果有路徑信息
ret = redirect(url) #重定向要訪問的路徑
else:
ret = redirect('/index/') #如果沒有,默認重定向index頁面
ret.set_cookie('is_login', '1') #利用cookie標識登錄狀態
return ret #響應請求
return render(request, 'login.html', {'error': '用戶名或密碼錯誤'})#密碼賬戶錯誤,重定向login.html并提示
def login_required(func): #裝飾器函數,用來判斷,訪客登錄狀態
def inner(request, *args, **kwargs):
is_login = request.COOKIES.get('is_login') #獲取is_login的狀態值
url = request.path_info #訪問頁面的路徑信息
if is_login != '1': #如果狀態值不為1表示未登錄
return redirect('/login/?return_url={}'.format(url))#返會login頁面,并把之前訪問頁面信息,拼接在路徑后面
ret = func(request, *args, **kwargs) #如果狀態值是1,執行視圖函數
return ret #響應請求
return inner
@login_required #判斷登錄狀態裝飾器
def index(request): #處理index路由請求的視圖函數
return HttpResponse('首頁') #簡單模擬首頁
@login_required #判斷登錄狀態裝飾器
def home(request): #處理home路由請求的視圖函數
return HttpResponse('home') # #簡單模擬home頁密碼賬戶錯誤登錄失敗

訪問home也 登錄成功跳轉home頁面

直接從login頁面直接登錄,默認返回index頁面

看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。