這篇文章將為大家詳細講解有關在mysql里中文占幾個字節,小編覺得挺實用的,因此分享給大家做個參考,希望大家閱讀完這篇文章后可以有所收獲。
在mysql中,一個中文漢字所占的字節數與編碼格式有關:如果是GBK編碼,則一個中文漢字占2個字節;如果是UTF8編碼,則一個中文漢字占3個字節,而英文字母占1字節。
mysql里中文占多少個字節?
1. 一個中文漢字占多少字節與編碼有關:
UTF8:一個中文漢字=3個字節
GBK:一個中文漢字=2個字節
utf-8, 英文字母1字節
2.varchar(n)能存儲幾個漢字?
varchar(n)表示n個字符,無論漢字和英文,Mysql都能存入n個字符,僅是實際字節長度有所區別
3.MySQL怎么檢查長度(占的字節數)?
可用SQL語言中length函數:
select LENGTH(fieldname) from tablename
說明:
UTF-8:Unicode Transformation Format-8bit,允許含BOM,但通常不含BOM。是用以解決國際上字符的一種多字節編碼,它對英文使用8位(即一個字節),中文使用24為(三個字節)來編碼。UTF-8包含全世界所有國家需要用到的字符,是國際編碼,通用性強。UTF-8編碼的文字可以在各國支持UTF8字符集的瀏覽器上顯示。如,如果是UTF8編碼,則在外國人的英文IE上也能顯示中文,他們無需下載IE的中文語言支持包。
GBK 是國家標準GB2312基礎上擴容后兼容GB2312的標準。GBK的文字編碼是用雙字節來表示的,即不論中、英文字符均使用雙字節來表示,為了區分中文,將其最高位都設定成1。GBK包含全部中文字符,是國家編碼,通用性比UTF8差,不過UTF8占用的數據庫比GBD大。
GBK、GB2312等與UTF8之間都必須通過Unicode編碼才能相互轉換:
GBK、GB2312-->Unicode-->UTF8
UTF8-->Unicode-->GBK、GB2312
GB2312是GBK的子集,GBK是GB18030的子集
GBK是包括中日韓字符的大字符集合
為了避免所有亂碼問題,應該采用UTF-8,將來要支持國際化也非常方便
UTF8可以看作是大字符集,它包含了大部分文字的編碼。
使用UTF8的一個好處是其他地區的用戶(如香港臺灣)無需安裝簡體中文支持就能正常觀看你的文字而不會出現亂碼。
總結:
gb2312是簡體中文的碼
gbk支持簡體中文及繁體中文
big5支持繁體中文
utf8支持幾乎所有字符
關于在mysql里中文占幾個字節就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。