溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么在PHP中利用curl對跳轉后的頁面進行抓取

發布時間:2020-12-23 16:31:02 來源:億速云 閱讀:354 作者:Leah 欄目:開發技術

怎么在PHP中利用curl對跳轉后的頁面進行抓???很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。

PHP的CURL正常抓取頁面程序如下:

$url = 'http://www.baidu.com';

$ch = curl_init(); 
curl_setopt($ch, CURLOPT_URL, $url); 
curl_setopt($ch, CURLOPT_VERBOSE, true); 
curl_setopt($ch, CURLOPT_HEADER, true);
curl_setopt($ch, CURLOPT_NOBODY, true);
curl_setopt($ch, CURLOPT_CUSTOMREQUEST, 'GET');
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); 
curl_setopt($ch, CURLOPT_TIMEOUT, 20); 
curl_setopt($ch, CURLOPT_AUTOREFERER, true); 
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); 
$ret = curl_exec($ch); 
$info = curl_getinfo($ch); 
curl_close($ch);


如果你抓取到的是302狀態,是因為再抓取的過程中,有的跳轉需要給下一個鏈接傳遞參數,而下一個鏈接同時也設置了如果沒接收到相應的參數是為非法訪問。

curl_setopt($curl, CURLOPT_CUSTOMREQUEST, 'GET');

顯示就應該正常了。

上面用來抓取功能,幾乎應該沒問題的。你可以查一下CURLOPT_CUSTOMREQUEST相關資料。

使用一個自定義的請求信息來代替”GET”或”HEAD”作為HTTP請求。這對于執行”DELETE” 或者其他更隱蔽的HTTP請求。有效值如”GET”,”POST”,”CONNECT”等等。也就是說,不要在這里輸入整個HTTP請求。例如輸入”GET /index.html HTTP/1.0\r\n\r\n”是不正確的。

看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女