溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

運用jieba庫的方法

發布時間:2020-07-08 15:26:47 來源:億速云 閱讀:567 作者:清晨 欄目:編程語言

小編給大家分享一下運用jieba庫的方法,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!

《斗破蒼穹》可謂玄幻小說的巔峰之作,曾經癡迷到徹夜看小說,回不到的過去,等不到的未來!今天就利用python的jieba庫以及在線制作詞云工具TAGUL,制作《斗破蒼穹》詞云。

步驟

jieba分詞

首先,通過pip3 install jieba安裝jieba庫,隨后在網上下載《斗破蒼穹》小說及停用詞表。代碼如下:

import jieba.analyse

path = '小說路徑'
fp = open(path,'r',encoding='utf-8')
content = fp.read()
try:
    jieba.analyse.set_stop_words('停用詞表路徑')    
    tags = jieba.analyse.extract_tags(content, topK=100, withWeight=True)    
    for item in tags:
        print(item[0]+'\t'+str(int(item[1]*1000)))
finally:
     fp.close()

大家運行程序可能會報錯,是編碼問題,我們這時需打開下載的txt文檔,另存為,選擇utf-8編碼即可。

運用jieba庫的方法

運行部分結果圖:

運用jieba庫的方法

詞云制作

(1)打開taglue官網,點擊import words,把運行的結果copy過來。
(2)選擇形狀,在這里是網上下載的圖片進行的導入。
(3)選擇字體。
(4)點擊Visualize生成圖片。

運用jieba庫的方法

《斗破蒼穹》詞云

運用jieba庫的方法

在這個斗氣大陸上,只有強者才可以生存,蕭炎在藥老及丹藥的幫助下不斷修煉,擁有多種異火,有著極強的靈魂感知力;在不斷修煉中,遇到了小醫仙,納蘭,美杜莎,紫研等人,成為斗氣大陸上的強者而奮斗。

看完了這篇文章,相信你對運用jieba庫的方法有了一定的了解,想了解更多相關知識,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女