解决HtmlAgilityPack无法获取form标签子节点的问题
2014-01-02 21:55
357 查看
问题描述
今天使用HtmlAgilityPack提取Form表单下的input节点,发现提取的form节点没有子节点,InnerHtml也是为空,起初以为是标签不全导致,后来分析html代码发现不可能是这个问题,提取div标签正常,偏偏form标签有问题,最终从网上找到了答案。解决方案
在将html转为htmlDoc之前,添加:1 | HtmlNode.ElementsFlags.Remove("form"); |
12 | HtmlNode.ElementsFlags.Remove("form");HtmlDocument doc = new HtmlDocument(); |
参考资料
http://www.crifan.com/htmlagilitypack_html_tag_form_option_no_child_via_sibling_get_innertext/额外收获
发现了另外一个用户html文档解析的工具SgmlReader,抽空了解一下。
到目前为止已经用过了HtmlAgilityPack和Tidy,感觉还是HtmlAgilityPack用起来方便。
相关文章推荐
- 使用HtmlAgilityPack和ScrapySharp抓取网页数据遇到的几个问题解决方法——格式编码问题
- 2012-09-10 23:30 如何解决HtmlAgilityPack得到的InnerText中有残留的script、样式的问题
- 解决json包含html标签无法显示的问题
- HtmlAgilityPack不能解析option标签的解决方法
- 真正解决HtmlAgilityPack抓取网页 中文乱码问题
- 解决JSON包含HTML标签无法显示的问题
- 解决HttpWebRequest和HtmlAgilityPack采集网页中文乱码问题
- 真正解决HtmlAgilityPack抓取网页 中文乱码问题
- 真正解决HtmlAgilityPack抓取网页 中文乱码问题
- 解决Android开发无法解析HTML标签问题
- 解决MultipartEntity无法获取内容数据问题:Multipart form entity does not implement #getContent()
- js无法获取到html标签的属性的解决方法
- Html.BeginForm方法没有生成Form标签的问题
- 解决jquery中动态新增的元素节点无法触发事件问题的两种方法
- 解决TreeView的节点更改NodeFont后无法完全显示节点名的问题
- tomcat startup.bat 无法启动问题解决方法 标签: startup.bat启动脚本tomcatTomcat 2012-12-06 21:52 10904人阅读 评论(0) 收藏 举报
- angularjs select标签使用ng-repeat标签之后,ng-model无法更新问题解决
- 解决 hybird 应用中重复获取 WebView,导致页面元素无法识别的问题
- asp.net无法获取iis目录的问题解决方法
- 解决Vue中mounted钩子函数获取节点高度出错问题