从html中提取纯文本
2012-10-18 21:53
197 查看
using System.Text.RegularExpressions; private string StripHT(string strHtml) //从html中提取纯文本 { Regex regex = new Regex("<.+?>", RegexOptions.IgnoreCase); string strOutput = regex.Replace(strHtml, "");//替换掉"<"和">"之间的内容 strOutput = strOutput.Replace("<", ""); strOutput = strOutput.Replace(">", ""); strOutput = strOutput.Replace(" ", ""); return strOutput; }
相关文章推荐
- 使用HTMLParser 解析html字符串,去除html标签,提取纯文本
- java 正则匹配提取html纯文本
- Java正则表达式提取html纯文本
- 使用Python中的HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies(二)(转)
- 【实例】python中文词频排序 + html提取文本工具下载链接
- VBScript 函数 之 从 HTML 源码中提取文本
- 如何提取html文本中的图片地址
- 简单的将一个html(xml)文本中的img标签(图片)提取出来的方法
- 根据htmlparser写的一个提取页面纯文本的C#程序
- 使用Jsoup.jar写的工具类(java提取Html中的文本)
- 最简洁的从html中提取纯文本的办法
- 黄聪:使用Python中的HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies(二)
- 2007-03-02 |提取HTML文本中的所有超级链接! 20100321
- Java实现从Html文本中提取纯文本的方法
- c#从html中提取文本
- 搜索引擎(2)从html中提取文本内容
- 7 款从 HTML 文档提取文本的工具
- GOOGLE Gadgets 处理远程内容,如何提取和控制远程文本(通常为 HTML)、XML、JSON 和 RSS/Atom 供稿数据。
- 使用Python中的HTMLParser、cookielib抓取和解析网页、从HTML文档中提取链接、图像、文本、Cookies(二)
- 正则表达式提取HTML文本中的图片图片