小編給大家分享一下運用jieba庫的方法,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!
《斗破蒼穹》可謂玄幻小說的巔峰之作,曾經癡迷到徹夜看小說,回不到的過去,等不到的未來!今天就利用python的jieba庫以及在線制作詞云工具TAGUL,制作《斗破蒼穹》詞云。
步驟
jieba分詞
首先,通過pip3 install jieba安裝jieba庫,隨后在網上下載《斗破蒼穹》小說及停用詞表。代碼如下:
import jieba.analyse path = '小說路徑' fp = open(path,'r',encoding='utf-8') content = fp.read() try: jieba.analyse.set_stop_words('停用詞表路徑') tags = jieba.analyse.extract_tags(content, topK=100, withWeight=True) for item in tags: print(item[0]+'\t'+str(int(item[1]*1000))) finally: fp.close()
大家運行程序可能會報錯,是編碼問題,我們這時需打開下載的txt文檔,另存為,選擇utf-8編碼即可。
運行部分結果圖:
詞云制作
(1)打開taglue官網,點擊import words,把運行的結果copy過來。
(2)選擇形狀,在這里是網上下載的圖片進行的導入。
(3)選擇字體。
(4)點擊Visualize生成圖片。
《斗破蒼穹》詞云
在這個斗氣大陸上,只有強者才可以生存,蕭炎在藥老及丹藥的幫助下不斷修煉,擁有多種異火,有著極強的靈魂感知力;在不斷修煉中,遇到了小醫仙,納蘭,美杜莎,紫研等人,成為斗氣大陸上的強者而奮斗。
看完了這篇文章,相信你對運用jieba庫的方法有了一定的了解,想了解更多相關知識,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。