在PHP中利用DOMDocument對xml進行保存時出現中文亂碼如何解決?很多新手對此不是很清楚,為了幫助大家解決這個難題,下面小編將為大家詳細講解,有這方面需求的人可以來學習下,希望你能有所收獲。
php中DOMDocument對于xml操作我們只要是英文是沒有問題了,但如果是中文字體就會有亂碼問題了,下面我們就此問題給各位介紹一些解決辦法吧.
PHP的DOM內部是utf8機制的,在loadHTML時,是通過檢查字符中meta的charset來設置編碼的,如果沒有charset,就當iso8859進行處理了,而這種情況下進行saveXML時,輸出來的卻是utf8,所以就看到亂碼了.
這么說是不是還不太理解,舉個例子:
$xml = new DOMDocument(); @$xml->loadHTML('<div>我就是測試看看</div>'); $dom = new DOMXPath($xml); echo $dom->query('//div')->item(0)->saveXML();
打開網頁執行,你會發現輸出亂碼了,那如何解決這個問題呢?有兩種方式.
第一種:在loadHTML的時候指定編碼,下面這段代碼引用自php.net官方文檔中的回復,代碼如下:
$doc = new DOMDocument(); $doc->loadHTML('<?xml encoding="UTF-8">' . $html); foreach ($doc->childNodes as $item) { if ($item->nodeType == XML_PI_NODE) { $doc->removeChild($item); // remove hack } } $doc->encoding = 'UTF-8'; // insert proper
第二種方法:通過iconv對輸出的字符重新轉換,代碼如下:
echo iconv("UTF-8", "GB18030//TRANSLIT", $dom->saveXML($n) );
看完上述內容是否對您有幫助呢?如果還想對相關知識有進一步的了解或閱讀更多相關文章,請關注億速云行業資訊頻道,感謝您對億速云的支持。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。