利用HTMLDocument2对HTML文本进行解析
2008-05-04 21:20
639 查看
利用HTMLDocument2对HTML文本进行解析 -|walrus 发表于 2006-8-8 18:34:00 | |
/* * 本示例通过一个html文件来生成HTMLDocuemt2对象(不使用WebBrowser控件),然后对 * 遍历该对象的DOM树。 */ HTMLDocumentClass hc = new HTMLDocumentClass(); IHTMLDocument2 doc2 = hc; string html=""; string filename="..//..//test.htm"; if (!File.Exists(filename)) { Console.WriteLine("文件不存在"); return; } StreamReader sr1 = new StreamReader( (System.IO.Stream)File.OpenRead(filename),System.Text.Encoding.Default); while (sr1.Peek()>-1) { html=html+sr1.ReadToEnd(); } sr1.Close(); doc2.write(html); doc2.close(); //将HTMLDocument2接口转换成HTMLDocument3接口,因为后者可以使用IHTMLDOMNod接口。 IHTMLDocument3 HTMLDocument=(IHTMLDocument3)doc2; IHTMLDOMNode rootDomNode=(IHTMLDOMNode)HTMLDocument.documentElement; TreeNode root=treeView1.Nodes.Add("HTML");//treeview1是TreeView组件。 InsertDOMNodes(rootDomNode,root); //递归方法,用预于遍历DOM树,同时生成一个树 private void InsertDOMNodes(IHTMLDOMNode parentnode,TreeNode tree_node) { if(parentnode.hasChildNodes())//是否有子结点 { IHTMLDOMChildrenCollection allchild = (IHTMLDOMChildrenCollection)parentnode.childNodes; int length = allchild.length; for(int i=0;i<length;i++)//对每个子结点进行处理,首先取出每个子节点的属性,然后进行递归 { IHTMLDOMNode child_node = (IHTMLDOMNode)allchild.item(i); string m_snodeName =child_node.nodeName; object m_onodevalue =child_node.nodeValue; string m_snodetype =child_node.nodeType.ToString(); string m_snodevalue =""; if ( m_onodevalue!=null) m_snodevalue =m_onodevalue.ToString().Trim(); TreeNode tempnode=null; if (child_node.nodeName.Equals("#text")) { if ((m_snodevalue!=null)&& (!m_snodevalue.Equals(""))) tempnode = tree_node.Nodes.Add(m_snodevalue); } else { tempnode = tree_node.Nodes.Add(child_node.nodeName); InsertDOMNodes(child_node,tempnode); } } } } |
相关文章推荐
- Java利用OpenOffice进行将word,excel转化成html解析到界面(下)
- HTML文本载入HTMLDocument2进行解析
- 利用jsoup 对 HTML 文档进行解析和操作
- Java利用OpenOffice进行将word,excel转化成html解析到界面(上)
- 利用com调用ie进行html解析
- 利用com调用ie进行html解析
- 利用lucene和pdfBox对PDF文本进行内容的解析
- 利用Jsoup进行简单的HTML解析
- 用XPath对Html进行解析
- HTML中利用堆栈方式对Table进行行排序
- 微信小程序调用PHP后台接口 解析纯html文本
- SpringMVC中利用@InitBinder来对页面数据进行解析绑定
- 利用贝叶斯分类器进行文本挖掘---笔记
- Java下利用Jackson进行JSON解析和序列化
- 利用dom4j解析.xml之将xml文本信息封装成对象
- 利用文件名进行GetShell---CTF题目的相关知识解析
- ASP.NET中用户输入文本的HTML解析办法[转]
- 解析HTML 文本 性能最高的方法
- Java下利用Jackson进行JSON解析和序列化
- Java注解教程:自定义注解示例,利用反射进行解析