今天就跟大家聊聊有關java字符出現亂碼的原因和解決方法,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結了以下內容,希望大家根據這篇文章可以有所收獲。
原因:
編解碼不一致導致字符亂碼。
首先,我們可以通過調用java.nio.charset.Charset.defaultCharset()獲得系統的默認字符集,中文Windows系統都是GBK,所以JVM默認都是以GBK字符集來進行編解碼。
亂碼產生最大的可能性在于編解碼不一致。
// 代碼片段1: byte[] read = "你好abc".getBytes(); String result = new String(read); System.out.println(result);
上訴這段代碼一共有3步:
1、編碼。這里為了看起來更簡潔就這樣寫,事實上和你從文件/網絡等其他媒介讀取是一樣的,原本輸入流是什么類型編碼,讀取后也是什么類型編碼。這里沒有指定編碼方式,所以默認為GBK。
2、解碼。我們最終的操作都是字符串對象,可以通過指定字符串的對字節數組的解碼方式,最終獲得一個字符串對象。這里沒有指定解碼方式,所以默認為GBK。
3、輸出、使用字符串。事實上這里還有一次編解碼過程,就是輸出流編碼為GBK,控制臺解碼為GBK,最終顯示。因為輸出、使用字符串時都是以系統默認字符集進行,不存在編解碼不一致的可能,所以這里不會是亂碼根源。
假設我們將輸入流的編碼改一下:
// 代碼片段2:
byte[] read = "你好abc".getBytes("utf-8");
String result = new String(read);
System.out.println(result);再來分析一下3步:
1、編碼,utf-8;
2、解碼,gbk。
編解碼不一致,這里便產生了亂碼。
至于如何修復,相信已經很清楚了。
修復方法如下:
// 代碼片段3:
byte[] read = "你好abc".getBytes("utf-8");
String result = new String(read,"utf-8");
System.out.println(result);將解碼方式改為與編碼對應就可以了。
小結:
1、我們一般比較難控制輸入流是什么編碼,所以注意解碼時與輸入流的編碼類型一致即可。我們一般在調用輸入流的相關方法看到有charset參數,就是指解碼方式。
2、輸出流同樣可以操作其編碼方式,如果后續會以輸入流操作這個輸出的結果,比如說文件,只要都以默認的方式進行,便不會產生亂碼。我們一般在調用輸出流的相關方法看到有charset參數,就是指編碼方式。
看完上述內容,你們對java字符出現亂碼的原因和解決方法有進一步的了解嗎?如果還想了解更多相關內容,歡迎關注億速云行業資訊頻道,感謝各位的閱讀。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。