.Net解析html文档类库HtmlAgilityPack完整使用说明
2017-11-20 13:26
585 查看
一个解析html的C#类库HtmlAgilityPack
HtmlAgilityPack是一个基于.Net的、第三方免费开源的微型类库,主要用于在服务器端解析html文档(在B/S结构的程序中客户端可以用Javascript、jquery解析html)。截止到本文发表时,HtmlAgilityPack的最新版本为 1.4.6。下载地址:http://htmlagilitypack.codeplex.com/。最新版本支持Linq to Objects ( LINQ to Xml ).
准备:
如果你有安装Nuget的话,可以直接查找安装即可。
下载后解压缩后有3个文件,这里只需要将其中的HtmlAgilityPack.dll(程序集)、HtmlAgilityPack.xml(文档,用于Visual Studio 2008中代码智能提示和帮助说明之用)引入解决方案中即可使用,无需安装任何东西,非常好用。
在C#类文件开头引入using HtmlAgilityPack;就可以使用该命名空间下的类型了。实际使用中,几乎都是以HtmlDocument类为主线的,这一点非常类似于微软.net framework中的XmlDocument类。XmlDocument类是操作的是xml文档,而HtmlDocument类操作的是html文档(其实也可以操作xml文档),它们的操作方式都是基于Dom,所不同的是后者取消了诸如GetElementsByTagName这样的方法,强化了GetElementById方法(在HtmlDocument中可以直接使用,而XmlDocument则不可以)。
HtmlAgilityPack中定位节点基本上都用Xpath表达式,Xpath表达式的参考文档可见:http://www.w3school.com.cn/xpath/xpath_syntax.asp。自行学习。
HtmlAgilityPack是一个基于.Net的、第三方免费开源的微型类库,主要用于在服务器端解析html文档(在B/S结构的程序中客户端可以用Javascript、jquery解析html)。截止到本文发表时,HtmlAgilityPack的最新版本为 1.4.6。下载地址:http://htmlagilitypack.codeplex.com/。最新版本支持Linq to Objects ( LINQ to Xml ).
准备:
如果你有安装Nuget的话,可以直接查找安装即可。
下载后解压缩后有3个文件,这里只需要将其中的HtmlAgilityPack.dll(程序集)、HtmlAgilityPack.xml(文档,用于Visual Studio 2008中代码智能提示和帮助说明之用)引入解决方案中即可使用,无需安装任何东西,非常好用。
在C#类文件开头引入using HtmlAgilityPack;就可以使用该命名空间下的类型了。实际使用中,几乎都是以HtmlDocument类为主线的,这一点非常类似于微软.net framework中的XmlDocument类。XmlDocument类是操作的是xml文档,而HtmlDocument类操作的是html文档(其实也可以操作xml文档),它们的操作方式都是基于Dom,所不同的是后者取消了诸如GetElementsByTagName这样的方法,强化了GetElementById方法(在HtmlDocument中可以直接使用,而XmlDocument则不可以)。
HtmlAgilityPack中定位节点基本上都用Xpath表达式,Xpath表达式的参考文档可见:http://www.w3school.com.cn/xpath/xpath_syntax.asp。自行学习。
相关文章推荐
- .Net解析html文档类库HtmlAgilityPack完整使用说明
- .Net解析html文档使用类库HtmlAgilityPack
- .net HTMLParser详细使用说明 强大的Filter类 解析HTML文档如此简单
- 使用HtmlAgilityPack解析html
- C# HTML解析工具HtmlAgilityPack使用实例(二)--Web页面
- HTML解析组件HtmlAgilityPack使用
- WindowsPhone使用HtmlAgilityPack解析HTML
- Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用
- .net HtmlAgilityPack解析返回的html字符串
- .net HTMLParser详细使用说明 强大的Filter类 解析HTML文档如此简单
- .net HTMLParser详细使用说明 强大的Filter类 解析HTML文档如此简单
- 史林枫:开源HtmlAgilityPack公共小类库封装 - 网页采集(爬虫)辅助解析利器【附源码+可视化工具推荐】
- Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用
- 使用C#和HtmlAgilityPack解析HTML
- C# HTML解析工具HtmlAgilityPack使用简介
- NET 使用HtmlAgilityPack抓取网页数据
- Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用
- 关于HtmlAgilityPack使用的说明
- Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用
- C#中使用HtmlAgilityPack对html进行解析