溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

[ASP.NET]強大的網頁處理類NSoup

發布時間:2020-08-02 21:46:03 來源:網絡 閱讀:1133 作者:蓬萊仙羽 欄目:編程語言

我們如果在項目中碰到要處理HTML,如果是.NET程序員的話,強烈推薦使用NSoup,不然的話截取字符串是在是太痛苦了。NSoup是一個開源框架,是JSoup的.NET移植版本,使用方法基本一致!NSoup點擊下載

獲取網頁的html代碼

處理網頁html
[csharp]view plaincopyprint?[ASP.NET]強大的網頁處理類NSoup[ASP.NET]強大的網頁處理類NSoup
  1. <span style="font-family: Arial, Helvetica, sans-serif;">NSoup.Nodes.Document doc = NSoup.NSoupClient.Connect("http://blog.csdn.net/dingxiaowie2013").Get();</span>  

或者是自定義html,生成html頁面
[csharp]view plaincopyprint?[ASP.NET]強大的網頁處理類NSoup[ASP.NET]強大的網頁處理類NSoup
  1. NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(HtmlString);  


但是很遺憾NSoup默認的是UTF-8,處理中文會有亂碼(對于編碼是UTF-8自然會正常,但是有些是GB2312的就可能有亂碼)

解決NSoup解析HTML亂碼的辦法

1.下載網頁源代碼再處理


[csharp]view plaincopyprint?[ASP.NET]強大的網頁處理類NSoup[ASP.NET]強大的網頁處理類NSoup
  1. //下載網頁源代碼

  2. WebClient webClient = new WebClient();  

  3. string htmlString = Encoding.GetEncoding("utf-8").GetString(webClient.DownloadData("http://www.baidu.com"));  

  4. NSoup.Nodes.Document doc = NSoup.NSoupClient.Parse(htmlString);  


2.獲得網頁的流



[csharp]view plaincopyprint?[ASP.NET]強大的網頁處理類NSoup[ASP.NET]強大的網頁處理類NSoup
  1. //獲得網頁流

  2. WebRequest webRequest = WebRequest.Create("http://blog.csdn.net/dingxiaowei2013");  

  3. NSoup.Nodes.Document doc1 = NSoup.NSoupClient.Parse(webRequest.GetResponse().GetResponseStream(), "utf-8");  



效果圖


[ASP.NET]強大的網頁處理類NSoup

[ASP.NET]強大的網頁處理類NSoup

會發現跟百度的源碼是一樣的


向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

亚洲午夜精品一区二区_中文无码日韩欧免_久久香蕉精品视频_欧美主播一区二区三区美女