PHP中中文字符串出現亂碼如何解決?針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
function substring($str, $start, $length){ //比較好用字符串截取函數
$len = $length;
if($length < 0){
$str = strrev($str);
$len = -$length;
}
$len= ($len < strlen($str)) ? $len : strlen($str);
$tmpstr = "";
for ($i= $start; $i < $len; $i ++)
{
if (ord(substr($str, $i, 1)) > 0xa0)
{
$tmpstr .= substr($str, $i, 2);
$i++;
} else {
$tmpstr .= substr($str, $i, 1);
}
}
if($length < 0) $tmpstr = strrev($tmpstr);
return $tmpstr;
}使用方法示例:
$str1 = '我是一串比較長的中文不帶英文'; $str2 = '我是一串比較長的中文帶yingwen'; $len = strlen($str1); echo '<br />'.$len; //return 28 $len = strlen($str2); echo '<br />'.$len; //return 29 echo '<br />'; echo substring($str1, 0, 11); echo '<br />'; echo substring($str2, 0, 11); echo '<br />'; echo substring($str1, 16, 28); echo '<br />'; echo substring($str2, 16, 29);
結果顯示:
28
29
我是一串比較
我是一串比較
中文不帶英文
中文帶yingwen
這個函數十分有用,比如用來截斷比較長的文件名,但是要在中間加上...,可以這樣來做:
function formatName($str, $size){
$len = strlen($str);
if(strlen($str) > $size) {
$part1 = substring($str, 0, $size / 2);
$part2 = substring($str, $len - ($size/2), $len);
return $part1 . "..." . $part2;
} else {
return $str;
}
}另外,網上看到一種超級簡單的中文截斷解決方案,試用了一下,效果也不錯:
echo substr($str1,0,10).chr(0);
原理解釋:
chr(0)不是null
07null是什么都沒有,而chr(0)的值是0。表示成16進制是0x00,表示成二進制是00000000
08雖然chr(0)不會顯示出什么,但是他是一個字符。
09當漢字被截斷時,根據編碼規則他總是要把后邊的其他字符拉過來一起作為漢字解釋,這就是出現亂碼的原因。而值為0x81到0xff與0x00組合始終都顯示為“空”
10根據這一特點,在substr的結果后面補上一個chr(0),就可以防止出現亂碼了
----------------------------
20120705更新:
以上方法雖好,但是偶爾還是會碰到亂碼,原因未深究。不過可以用以下的方法,對UTF8字符文本屢試不爽。
注意:該方法中將漢字計算為1單位長度,英文一個字母1單位長度,所以截斷時需要注意長度設置。
計算長度的方法:
function strlen_UTF8($str)
{
$len = strlen($str);
$n = 0;
for($i = 0; $i < $len; $i++) {
$x = substr($str, $i, 1);
$a = base_convert(ord($x), 10, 2);
$a = substr('00000000'.$a, -8);
if (substr($a, 0, 1) == 0) {
}elseif (substr($a, 0, 3) == 110) {
$i += 1;
}elseif (substr($a, 0, 4) == 1110) {
$i += 2;
}
$n++;
}
return $n;
} // End strlen_UTF8;字符串截斷函數:
function subString_UTF8($str, $start, $lenth)
{
$len = strlen($str);
$r = array();
$n = 0;
$m = 0;
for($i = 0; $i < $len; $i++) {
$x = substr($str, $i, 1);
$a = base_convert(ord($x), 10, 2);
$a = substr('00000000'.$a, -8);
if ($n < $start){
if (substr($a, 0, 1) == 0) {
}elseif (substr($a, 0, 3) == 110) {
$i += 1;
}elseif (substr($a, 0, 4) == 1110) {
$i += 2;
}
$n++;
}else{
if (substr($a, 0, 1) == 0) {
$r[ ] = substr($str, $i, 1);
}elseif (substr($a, 0, 3) == 110) {
$r[ ] = substr($str, $i, 2);
$i += 1;
}elseif (substr($a, 0, 4) == 1110) {
$r[ ] = substr($str, $i, 3);
$i += 2;
}else{
$r[ ] = '';
}
if (++$m >= $lenth){
break;
}
}
}
return join($r);
} // End subString_UTF8;使用方法和之前介紹的一樣,比如formatName可以實現如下(這對漢字長度做了小優化):
function formatName($str, $size){
$len = strlen_UTF8($str);
$one_len = strlen($str);
$size = $size * 1.5 * $len / ($one_len);
if(strlen_UTF8($str) > $size) {
$part1 = subString_UTF8($str, 0, $size / 2);
$part2 = subString_UTF8($str, $len - ($size/2), $len);
return $part1 . "..." . $part2;
} else {
return $str;
}
}關于PHP中中文字符串出現亂碼如何解決問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注億速云行業資訊頻道了解更多相關知識。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。