本篇內容介紹了“.NET Compact Framework中解碼GB2312怎么實現”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
代碼如下:
Imports System.Text
Imports System.IO
Module Module1Module Module1
Sub Main()Sub Main()
Dim sr As New StreamReader("D:gb2312.txt")
Dim fs As New FileStream("D:gb2312.dat", FileMode.Create)
Dim sw As New BinaryWriter(fs)
For i As Integer = 1 To 70
sr.ReadLine()
Next
Do Until sr.EndOfStream
Dim ss As String() = sr.ReadLine.Split
Dim HEX As Short = CShort(Val(ss(1).Replace("0x", "&H")))
Dim offset As Integer = (CInt(Val(ss(0).Replace("0x", "&H"))) - &H2121) * 2
sw.BaseStream.Position = offset
sw.Write(HEX)
Loop
sw.Close()
End Sub
End Module使用的時候將欲解碼的GB2312編碼減去0x8080,再減去0x2121(偏移),也就是說減去0xA1A1,然后將 FileStream.Position指向所得到的結果的2倍(兩個字節一個碼)并讀取一個Int16就可以得到對應的Unicode碼。下面是我在掌 心IP通中的一段代碼。
public class GB2312ToUnicode
{
private FileStream fs;
private BinaryReader br;
public GB2312ToUnicode(string index)
{
fs=new FileStream(index, FileMode.Open);
br = new BinaryReader(fs);
}
public char Convert(byte[] b)
{
int index = ((b[0] << 8) + b[1] - 0xa1a1)*2;
fs.Position = index;
int tmp = (int)br.ReadInt16() & 0xFFFF;
return System.Convert.ToChar(tmp);
}
~GB2312ToUnicode()
{
br.Close();
}
}這樣就方便的得到了GB2312的解碼器。
另外,如果打開GB2312.DAT文件可以看到,數據中有很多的0。本來可以通過重新計算偏移的方法來壓縮數據,但是考慮到PocketPC上面的速度,尤其是要解碼大量文本的時候,就只好用空間換取時間了。
“.NET Compact Framework中解碼GB2312怎么實現”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。