python 过滤html方法
2016-06-23 10:12
218 查看
原文链接:http://www.cnblogs.com/zhaojia-dream/p/5609669.html
from HTMLParser import HTMLParser class MLStripper(HTMLParser): """ 过滤html方法 """ def __init__(self): self.reset() self.fed = [] def handle_data(self, d): self.fed.append(d) def get_data(self): return ''.join(self.fed) def strip_tags(html): """ 过滤html方法实现 """ if html is None: return "" s = MLStripper() s.feed(html) return s.get_data()
转载于:https://www.cnblogs.com/zhaojia-dream/p/5609669.html
相关文章推荐
- python 过滤html方法
- Python正则表达式过滤或者替换HTML标签的方法
- Python通过正则表达式获取,去除(过滤)或者替换HTML标签的几种方法(本文由169it.com搜集整理)
- Python正则获取、过滤或者替换HTML标签的方法
- Python正则获取、过滤或者替换HTML标签的方法
- python对html过滤处理的方法
- Python使用正则表达式过滤或替换HTML标签的方法详解
- Python实现抓取HTML网页并以PDF文件形式保存的方法
- 【用Python写爬虫】获取html的方法【一】:使用urllib
- python--selenium一种实用的自动生成测试HTML报告方法--HTMLTestRunner
- jquery过滤HTML标签方法
- C#实现过滤html标签并保留a标签的方法
- 过滤所有html标签的几种方法
- ASP.NET过滤HTML字符串方法总结
- jQuery过滤HTML标签并高亮显示关键字的方法
- iOS字符串NSString 过滤HTML标签的两种方法
- 【用Python写爬虫】获取html的方法【四】:使用urllib下载文件
- Python将xml和xsl转换为html的方法
- PHP过滤HTML标签的三种方法
- jQuery过滤HTML标签并高亮显示关键字的方法