好得很程序员自学网

<tfoot draggable='sEl'></tfoot>

Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用

Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用

简介

本文介绍net处理html页面元素的工具类(HtmlAgilityPack.dll)的使用,用途比较多的应该是例如采集类的功能,采集到的html字符串要怎样处理是一个头痛的问题,如果是截取就太麻烦了而且容易出错。所有就用到本文的第三方dll来处理了。

 

下载

下载地址: http://htmlagilitypack.codeplex.com/

点击“download”按钮直接下载。

 

使用

1.添加HtmlAgilityPack.dll引用(引用类using HtmlAgilityPack;)。

2.简单根据html中input的id获取value代码如下:

 //   模拟用户请求 
WebClient webClient =  new   WebClient();
webClient.Encoding  =  System.Text.Encoding.UTF8;
  string  htmlContext = webClient.DownloadString( "  http://stone_w.cnblogs.com/  "  );
webClient.Credentials  = CredentialCache.DefaultCredentials;  //   添加授权证书 
webClient.Headers.Add( "  User-Agent  " ,  "  Microsoft Internet Explorer  "  );
webClient.Headers.Add(  "  Host  " ,  "  www.cnblogs.com  "  );

  //   获取html元素(htmlContext为html页面字符串) 
HtmlDocument htmlDoc =  new   HtmlDocument();
htmlDoc.LoadHtml(htmlContext);    //   加载html页面 
HtmlNode navNode = htmlDoc.GetElementbyId( "  id名称  "  );
Response.Write(navNode.Attributes[  "  value  " ].Value);

 

总结

HtmlAgilityPack可以根据id查询value,还可以获取单个元素节点,都是HtmlDocument类的内置方法,大家可以试着练 练 。谢谢完~

 

 


作者: 西安.王磊  
出处: http://stone_w.cnblogs.com/  
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。 

作者: Leo_wl

    

出处: http://www.cnblogs.com/Leo_wl/

    

本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。

版权信息

查看更多关于Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用的详细内容...

  阅读:51次

上一篇: 为什么使用框架

下一篇:WCF消息编码器