您的位置：首页 > 编程语言 > Python开发

python正则表达式去除html标签

2014-12-01 11:06 661 查看

使用python的re模块，正则表达式去除html标签，代码如下：

import re

html = '<pre class="line mt-10 q-content" accuse="qContent">\
目的是通过第一次soup.find按class粗略筛选并通过soup.find_all筛选出列表中的a标签并读入href和title属性<br><br>\
但是由于目标链接可能有图片链接,而这是我不想要的.请问如何去除?<br></pre>'

reg = re.compile('<[^>]*>')

print(reg.sub('',html))

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

python自带re模块正则表达式去除html标签
Python通过正则表达式获取,去除(过滤)或者替换HTML标签的几种方法(本文由169it.com搜集整理)
python使用正则表达式提取html标签
正则表达式，去除所有HTML标签
java正则表达式去除html标签
利用正则表达式实现去除所有HTML标签代码
[python] 常用正则表达式爬取网页信息及分析HTML标签总结
java代码用正则表达式去除html标签
Python:使用正则去除HTML标签
Java去除掉HTML里面所有标签的两种方法——开源jar包和自己写正则表达式
[转]正则表达式，去除所有HTML标签
python 正则表达式过滤文本中的html标签源代码解析
java使用正则表达式去除字符串的html标签
正则表达式去除html标签
java正则表达式去除html标签
正则表达式，去除所有HTML标签
使用正则表达式去除html标签
正则表达式去除html标签
笔记：JS利用正则表达式实现去除Html标签方法
C# 正则表达式，去除所有HTML标签

新的分享

#新闻拍一拍# 微软推出 Pylance，改善 VS Code 中的 Python 体验
跟我学Python图像处理丨5种图像阈值化处理及算法对比
基于Python设计一个具有基本功能的通讯录
liunx上升级python2至python3
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
python常用标准库（时间模块time和datetime）
python之logging日志
python之configparser类的使用
Python常用标准库（pickle序列化和JSON序列化）
MySQL（12） - Python+MySQL读取写入图片
MySQL（11） - Python+MySQL开发新闻管理系统
Python 什么是flask框架？快速入门(flask安装，登录，新手三件套，登录认证装饰器，配置文件，路由系统，CBV)

章节导航