您的位置：首页 > 编程语言 > Python开发

python 过滤html方法

2016-06-23 10:12 218 查看

原文链接：http://www.cnblogs.com/zhaojia-dream/p/5609669.html

from HTMLParser import HTMLParser
class MLStripper(HTMLParser):
"""
过滤html方法
"""
def __init__(self):
self.reset()
self.fed = []
def handle_data(self, d):
self.fed.append(d)
def get_data(self):
return ''.join(self.fed)

def strip_tags(html):
"""
过滤html方法实现
"""
if html is None:
return ""
s = MLStripper()
s.feed(html)
return s.get_data()

转载于:https://www.cnblogs.com/zhaojia-dream/p/5609669.html

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

python 过滤html方法
Python正则表达式过滤或者替换HTML标签的方法
Python通过正则表达式获取,去除(过滤)或者替换HTML标签的几种方法(本文由169it.com搜集整理)
Python正则获取、过滤或者替换HTML标签的方法
Python正则获取、过滤或者替换HTML标签的方法
python对html过滤处理的方法
Python使用正则表达式过滤或替换HTML标签的方法详解
Python实现抓取HTML网页并以PDF文件形式保存的方法
【用Python写爬虫】获取html的方法【一】：使用urllib
python--selenium一种实用的自动生成测试HTML报告方法--HTMLTestRunner
jquery过滤HTML标签方法
C#实现过滤html标签并保留a标签的方法
过滤所有html标签的几种方法
ASP.NET过滤HTML字符串方法总结
jQuery过滤HTML标签并高亮显示关键字的方法
iOS字符串NSString 过滤HTML标签的两种方法
【用Python写爬虫】获取html的方法【四】：使用urllib下载文件
Python将xml和xsl转换为html的方法
PHP过滤HTML标签的三种方法
jQuery过滤HTML标签并高亮显示关键字的方法

新的分享

#新闻拍一拍# 微软推出 Pylance，改善 VS Code 中的 Python 体验
跟我学Python图像处理丨5种图像阈值化处理及算法对比
基于Python设计一个具有基本功能的通讯录
liunx上升级python2至python3
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
python常用标准库（时间模块time和datetime）
python之logging日志
python之configparser类的使用
Python常用标准库（pickle序列化和JSON序列化）
MySQL（12） - Python+MySQL读取写入图片
MySQL（11） - Python+MySQL开发新闻管理系统
Python 什么是flask框架？快速入门(flask安装，登录，新手三件套，登录认证装饰器，配置文件，路由系统，CBV)

章节导航