溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》
  • 首頁 > 
  • 教程 > 
  • 開發技術 > 
  • Python+Selenium+phantomjs實現網頁模擬登錄和截圖功能(windows環境)

Python+Selenium+phantomjs實現網頁模擬登錄和截圖功能(windows環境)

發布時間:2020-08-28 16:28:04 來源:腳本之家 閱讀:349 作者:廊坊吳彥祖 欄目:開發技術

本文全部操作均在windows環境下

安裝 Python

Python是一種跨平臺的計算機程序設計語言,它可以運行在Windows、Mac和各種Linux/Unix系統上。是一種面向對象的動態類型語言,最初被設計用于編寫自動化腳本(shell),隨著版本的不斷更新和語言新功能的添加,越來越多被用于獨立的、大型項目的開發

去Python的官網  www.python.org  下載安裝

安裝時勾選pip (python包管理工具),同時安裝pip

python安裝好之后,打開命令行工具cmd,輸入“python -V”,然后敲回車,如果出現python版本號,則表示安裝成功

安裝 selenium

selenium 是一個用于Web應用程序測試的工具。selenium測試直接運行在瀏覽器中,就像真正的用戶在操作一樣。支持的瀏覽器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。selenium 是一套完整的web應用程序測試系統,包含了測試的錄制(selenium IDE),編寫及運行(Selenium Remote Control)和測試的并行處理(Selenium Grid)

通過python包管理工具pip安裝

pip install selenium

安裝 phantomjs

phantomJS是一個基于webkit的javaScript API。它使用QtWebKit作為它核心瀏覽器的功能,使用webkit來編譯解釋執行javaScript代碼。任何你可以基于在webkit瀏覽器做的事情,它都能做到。它不僅是個隱性的瀏覽器,提供了諸如css選擇器、支持wen標準、DOM操作、json、HTML5等,同時也提供了處理文件I/O的操作,從而使你可以向操作系統讀寫文件等。phantomJS的用處可謂非常廣泛諸如網絡監測、網頁截屏、無需瀏覽器的wen測試、頁面訪問自動化等

phantomjs安裝鏈接 www.phantomjs.org

在桌面創建demo文件夾,創建demo.py文件,當做我們的腳本文件,創建img文件夾用來存放截取的圖片demo.py:

# coding=utf-8
# 導入網頁驅動軟件
from selenium import webdriver
# 導入WebDriverWait等待模塊
from selenium.webdriver.support.wait import WebDriverWait
import time

# 調用環境變量指定的PhantomJS瀏覽器創建瀏覽器對象
# 括號內為phantomjs安裝位置
driver = webdriver.PhantomJS(executable_path="D:\\Python27\\Scripts\\phantomjs-2.1.1-windows\\bin\\phantomjs.exe")
# 訪問的網址(以央視網為例)
driver.get("http://www.cctv.com/")
# 最大化瀏覽器
driver.maximize_window()

# 模擬點擊登錄按鈕登錄彈出登錄框(后面有定位元素方法介紹)
driver.find_elements_by_xpath('//span[@class="btn_icon"]')[1].click()

# 等待登錄頁面加載完成,WebDriverWait (后面有等待方法介紹)
WebDriverWait(driver, 10, 0.5).until(lambda diver:driver.find_element_by_xpath('//a[@class="dl"]'),message="")
time.sleep(2)
# 截取登錄框的頁面保存到相應位置
driver.save_screenshot('demo\\img\\login1.png')
# 定位登錄頁面用戶名和密碼元素并模擬填入用戶名和密碼
driver.find_element_by_name("username").send_keys('xxxxxxxxxxx')
driver.find_element_by_name("passwd_view").send_keys('xxxxxxxxxxx')
# 模擬點擊登錄按鈕登錄
driver.find_element_by_link_text('登錄').click()

WebDriverWait(driver, 10, 0.5).until(lambda diver:driver.find_elements_by_xpath('//span[@class="btn_icon"]'),message="")
time.sleep(2)
# 截取登錄后的頁面保存到相應位置
driver.save_screenshot('demo\\img\\login2.png')

# 模擬點擊按鈕跳轉體育頁面
driver.find_element_by_link_text('體育').click()
WebDriverWait(driver, 10, 0.5).until(lambda diver:driver.find_element_by_link_text('CBA'),message="")
time.sleep(2)

# 截取體育頁面保存到相應位置
driver.save_screenshot('demo\\img\\sport.png')

# 退出驅動關閉所有窗口
driver.quit()

運行python腳本

打開命令行窗口cmd,切換到demo.py文件的路徑下,輸入

python demo.py

腳本運行后會自動填寫我們設定好的用戶名密碼并登錄,截取設置好的頁面并保存到img文件夾

登錄框的頁面截圖:

Python+Selenium+phantomjs實現網頁模擬登錄和截圖功能(windows環境)

登錄后的頁面截圖:

Python+Selenium+phantomjs實現網頁模擬登錄和截圖功能(windows環境)

體育頁面截圖:

Python+Selenium+phantomjs實現網頁模擬登錄和截圖功能(windows環境)

部分方法介紹:區塊定位截圖(二次截圖)方法:

PIL(Python Image Library)是python的第三方圖像處理庫,PIL功能非常強大,API非常簡單易用,已經是Python平臺事實上的圖像處理標準庫了。 PIL只支持python2.x的版本,python3.x的版本需要安裝pillow, pillow是一個對PIL友好的分支,但是支持python3.x的版本

python2.x版本下安裝PIL進行二次截圖

pip install PIL

python3.x版本下安裝pillow 進行區塊定位截圖

pip install pillow

demo.py:

# 導入Image類
from PIL import Image

# 定位需要二次截圖區塊的元素
img = driver.find_element_by_xpath('//*[@class="weui-img"]')
# 區塊元素左上角在網頁中的x坐標
left = img.location['x']
# 區塊元素左上角在網頁中的y坐標
top = img.location['y']
# 區塊元素右下角在網頁中的x坐標
right = img.location['x'] + img.size['width']
# 區塊元素右下角在網頁中的y坐標
bottom = img.location['y'] + img.size['height']
# 打開頁面的截圖
photo = Image.open('demo\\img\\img_page.png')
# 根據區塊元素坐標實現二次截圖
photo = photo.crop((left, top, right, bottom))
# 保存二次截圖
photo.save('demo\\img\\img.png')

WebDriver8種基本元素定位方法:

1. find_element_by_id() 根據id屬性進行定位

例如:find_element_by_id(“one”) 定位id為one的元素

2. find_element_by_name() 根據name屬性進行定位

例如:find_element_by_name(“one”) 定位name屬性為one的元素

3. find_element_by_class_name() 根據class的名字進行定位

例如:find_element_by_class_name(“one”) 定位class為one的元素

4. find_element_by_xpath() xpath是XML路徑語言,通過確定xml文檔中的元素位置來完成對元素的定位

例如:find_element_by_xpath("http://div[@id=‘one']") 定位id為one的div元素
find_element_by_xpath("http://*[@class=‘two']") 定位class為two的元素

5. find_element_by_css_selector() 根據css屬性進行定位

例如:find_element_by_css_selector("#one") 定位id為one的div元素
find_element_by_css_selector(".two") 定位class為two的元素

6. find_element_by_tag_name () 根據標簽名進行定位

例如:find_element_by_tag_name(“input”) 定位input元素

7. find_element_by_link_text() 根據完整a鏈接文字進行定位find_element_by_partial_link_text() 根據部分a鏈接文字進行定位

例如:find_element_by_link_text(“新聞”) 定位文字為‘新聞'的a元素
find_element_by_partial_link_text(“聞”) 定位文字包括‘聞'的a元素

8. By定位( 需要導入By類:from selenium.webdriver.common.by import By )

例如:find_element(By.ID,“one”) 定位id為one的元素
find_element(By.NAME,“one”) 定位name屬性為one的元素
find_element(By.CLASS_NAME,“one”) 定位class為one的元素
find_element(By.TAG_NAME,“div”) 定位div元素

當定位元素為多個時,使用elements復數定位,即把定位方法中的element換成elements,此時獲取到的為相同屬性的一組元素,返回一個list隊列,然后可以再去定位單個元素

例如:find_elements_by_class_name(“one”)[1] 定位class為one的所有元素中第二個元素

selenium的3種等待方法:

在做自動化測試時,有時下一步的操作會依賴上一步的結果或者內容,上一步操作成功完成之后才能進行下一步操作,此時,我們就需要使用等待,來判斷上一步操作是否完成,進而執行下面的操作,例如登錄頁面進行登錄操作時,需要等待登錄頁面加載成功,才能定位到用戶名和密碼對應的元素,然后才能填充用戶名和密碼,進行登錄操作。

1. 強制等待time.sleep(s) 強制等待s秒后再進行下面的操作

缺點:不易把控時間,等待時間固定,如果沒到設置時間,已經可以進行下面的操作,則需要多余的等待,如果到達設置時間,還沒完成上一步操作,下面的操作還無法正常進行,則會直接報錯

2. 隱式等待implicitly_wait(s) 在s秒內,上一步操作完成,進行下一步操作,否則等待s秒后,然后進行下一步操作

缺點:如果到達設置時間,還沒完成上一步操作,下面的操作還無法正常進行,則會直接報錯

3. 顯式等待(推薦使用)WebDriverWait(driver,timeout,poll_frequency=0.5,ignored_exceptions=None)

等待頁面加載完成,找到某個條件發生后再繼續執行后續代碼,如果超過設置時間檢測不到則拋出異常

driver:瀏覽器驅動
timeout:最長超時時間,默認以秒為單位
poll_frequency:檢測的間隔步長,默認為0.5s
ignored_exceptions:超時后的拋出的異常信息,默認拋出NoSuchElementExeception異常

與until()結合使用:

WebDriverWait(driver, s).until(method,message="")

在s秒內,每0.5秒檢測一次,如果傳入的方法返回為true,進行下一步操作,如果到達設置時間未檢測到,下面的操作無法正常運行,則會直接報錯

總結

以上所述是小編給大家介紹的Python+Selenium+phantomjs實現網頁模擬登錄和截圖功能(windows環境),希望對大家有所幫助,如果大家有任何疑問請給我留言,小編會及時回復大家的。在此也非常感謝大家對億速云網站的支持!
如果你覺得本文對你有幫助,歡迎轉載,煩請注明出處,謝謝!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女