python实现html转ubb代码(html2ubb)
2014-07-03 00:00
627 查看
这两天在用python写一个采集器,有个功能模块是html代码转换为ubb,网上貌似没有现成程序,就自己写了个函数,顺便锻炼下自己的正则。
使用时直接调用Html2UBB函数,返回值就是ubb码了html转ubb
import re def Html2UBB(content): #以下是将html标签转为ubb标签 pattern = re.compile( '<a href=\"([sS]+?)\"[^>]*>([sS]+?)</a>',re.I) content = pattern.sub(r'2',content) pattern = re.compile( '<img[^>]+src=\"([^\"]+)\"[^>]*>',re.I) content = pattern.sub(r'',content) pattern = re.compile( '<strong>([sS]+?)</strong>',re.I) content = pattern.sub(r'http://www.jb51.net/article/1',content) pattern = re.compile( '<font color=\"([sS]+?)\">([sS]+?)</font>',re.I) content = pattern.sub(r'[http://www.jb51.net/article/1]2[/http://www.jb51.net/article/1]',content) pattern = re.compile( '<[^>]*?>',re.I) content = pattern.sub('',content) #以下是将html转义字符转为普通字符 content = content.replace('<','<') content = content.replace('>','>') content = content.replace('”','”') content = content.replace('“','“') content = content.replace('"','"') content = content.replace('©','©') content = content.replace('®','®') content = content.replace(' ',' ') content = content.replace('—','—') content = content.replace('–','–') content = content.replace('‹','‹') content = content.replace('›','›') content = content.replace('…','…') content = content.replace('&','&') return content
使用时直接调用Html2UBB函数,返回值就是ubb码了html转ubb
相关文章推荐
- python实现html转ubb代码(html2ubb)
- python将html转成PDF的实现代码(包含中文)
- python代码实现md转html
- python将html转成PDF的实现代码(包含中文)
- python调用HTMLTestRunner+unittest实现一次执行多个测试类,并生成与每个测试类对应的测试报告,并不像某些人写的每次只执行一个测试类,具体看代码,附上整个project代码
- [ASP]无限级分类的简单算法实现及代码重点讲解http://bbs.blueidea.com/thread-1982151-1-1.html
- 轻松实现HTML和JS之间的转化的代码
- UBB 转 HTML C#代码
- UBB 转 HTML C#代码
- VBScript 实现 UBB 显示代码([code][/code])附加行号, 正则实现 By Stabx
- 恳求帮助!!!怎么用程序实现:将HTML代码转化为MHTML代码
- HTML--如何实现通过鼠标事件拖动页面图像(代码)
- html表格滚动条的实现代码
- PHP实现HTML转UBB
- HTML--如何实现通过鼠标事件拖动页面图像(代码)
- 将 html 代码写入 js 文件中,然后在网页中引用此 js 文件,实现头模板重用
- 轻松实现HTML和JS之间的转化的代码
- 在html页面中插入jsp代码实现页面导航
- 使用PHP4中的 IntegratedTemplate类实现HTML和PHP代码分离
- asp下实现对HTML代码进行转换的函数