小說網站爬蟲第一天
從今天開始,學習一下爬蟲的知識,爬取小說網站。
第一天:
網站:http://www.bxwx9.org
小說:大主宰
語言:IDEA+java
jar包:maven工程,所以放上dependencies,每一個jar包的作用大家去研究一下
項目結構:
需求:獲取小說的章節列表中的標題和URL
原理:
代碼如下操作:
中文亂碼的解決:
運行的效果圖:
明天繼續?。。?!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。