小編給大家分享一下Python中一個漢字占了幾個字節,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!
Python中字符漢字在utf-8編碼下占三個字節,在gbk編碼下占兩個字節。
1、Python中漢字在utf-8編碼下示例:
2、Python中漢字在gbk編碼下示例:
UTF-8是Unicode的一種實現方式,也就是它的字節結構有特殊要求,所以我們說一個漢字的范圍是0X4E00到0x9FA5,是指unicode值,至于放在utf-8的編碼里去就是由三個字節來組織,所以可以看出unicode是給出一個字符的范圍,定義了這個字是碼值是多少,至于具體的實現方式可以有多種多樣來實現。
GBK全稱《漢字內碼擴展規范》,GBK編碼,是在GB2312-80標準基礎上的內碼擴展規范,使用了雙字節編碼方案,其編碼范圍從8140至FEFE(剔除xx7F),共23940個碼位,共收錄了21003個漢字,完全兼容GB2312-80標準。
看完了這篇文章,相信你對Python中一個漢字占了幾個字節有了一定的了解,想了解更多相關知識,歡迎關注億速云行業資訊頻道,感謝各位的閱讀!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。