Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用
2012-09-28 16:17
736 查看
简介
本文介绍net处理html页面元素的工具类(HtmlAgilityPack.dll)的使用,用途比较多的应该是例如采集类的功能,采集到的html字符串要怎样处理是一个头痛的问题,如果是截取就太麻烦了而且容易出错。所有就用到本文的第三方dll来处理了。下载
下载地址:http://htmlagilitypack.codeplex.com/点击“download”按钮直接下载。
使用
1.添加HtmlAgilityPack.dll引用(引用类using HtmlAgilityPack;)。2.简单根据html中input的id获取value代码如下:
// 模拟用户请求 WebClient webClient = new WebClient(); webClient.Encoding = System.Text.Encoding.UTF8; string htmlContext = webClient.DownloadString("http://stone_w.cnblogs.com/"); webClient.Credentials = CredentialCache.DefaultCredentials; // 添加授权证书 webClient.Headers.Add("User-Agent", "Microsoft Internet Explorer"); webClient.Headers.Add("Host", "www.cnblogs.com"); // 获取html元素(htmlContext为html页面字符串) HtmlDocument htmlDoc = new HtmlDocument(); htmlDoc.LoadHtml(htmlContext); // 加载html页面 HtmlNode navNode = htmlDoc.GetElementbyId("id名称"); Response.Write(navNode.Attributes["value"].Value);
总结
HtmlAgilityPack可以根据id查询value,还可以获取单个元素节点,都是HtmlDocument类的内置方法。用它来处理Html还是很方便的下载地址:http://htmlagilitypack.codeplex.com/
点击“download”按钮直接下载。
本文出自 “Zero's Blog” 博客,请务必保留此出处http://zerosoft.blog.51cto.com/679447/1009302
相关文章推荐
- Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用
- Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用
- Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用
- Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用
- Net处理html页面元素工具类(HtmlAgilityPack.dll)的使用
- 处理html页面元素工具类(HtmlAgilityPack.dll)的使用
- HtmlAgilityPack 抓取页面的乱码处理
- HtmlAgilityPack 抓取页面的乱码处理
- 爬虫技术 -- 进阶学习(九)使用HtmlAgilityPack获取页面链接(附c#代码及插件下载)
- 爬虫技术(六)-- 使用HtmlAgilityPack获取页面链接(附c#代码及插件下载)
- C#抓取网页工具类HtmlAgilityPack.dll和ScrapySharp
- 使用ASP.NET expressionBuilders 元素 衍生 处理前端控制页面翻译
- HtmlAgilityPack.dll的使用 获取HTMLid
- HtmlAgilityPack 抓取页面的乱码处理
- 使用HTML页面和一般处理程序模拟ASP.NET WebForms中的事件
- .Net解析html文档类库HtmlAgilityPack完整使用说明
- NET 使用HtmlAgilityPack抓取网页数据
- C# 新闻采集(HtmlAgilityPack.dll)的使用
- 使用HtmlAgilityPack.dll解析html
- HtmlAgilityPack 抓取页面的乱码处理