Python基于正则表达式实现检查文件内容的方法【文件检索】
2017-08-30 09:31
906 查看
本文实例讲述了Python基于正则表达式实现检查文件内容的方法分享给大家供大家参考,具体如下:
这个是之前就在学python,欣赏python的小巧但是功能强大,是连电池都自带的语言。平时工作中用Java ,觉得python在日常生活中比java用处要大,首先语法没那么复杂,特别是io的操作,java里要写一大坨没关的代码。还有就是不用编译,而且linux系统默认都会自带。
这次遇到的问题是工作当中想要迁移一个系统中的一个模块,这个时候需要评估模块里的代码有没有对其他代码强依赖,就是有没有import 其他模块的代码。如果通过人肉来坐,少量的文件还好,如果有大量的文件实在是很悲剧。这个时候就想起可以用pytho来检索文件,通过正则表达式分析文件内容,把有问题的文件名打印出来就可以了。
import os import os.path import re packDir='/**/src/main/java/com/hz/yk/auction' p1=re.compile(r"yk\.((?!auction)\w)+\b") p2=re.compile(r"yk\.((?!domain)\w)+\b") p3=re.compile(r"yk\.((?!utils)\w)+\b") def processDirectory(args,dirname,filenames): # print 'Directory',dirname for filename in filenames: if os.path.splitext(filename)[1]=='.java': # print 'file',filename fileObj=open(dirname+ "/"+filename) hasOther=False for line in fileObj: if p1.search(line) and p2.search(line) and p3.search(line): hasOther=True print line if hasOther: print 'file:',filename def search(): os.path.walk(packDir,processDirectory,None) if __name__ == '__main__': search()
因为希望看到应用其他模块的代码,所以排除掉自己的模块名auction和公共的应用domain,utils 。对剩下的符合条件的打印出import这句和文件名sikuli
PS:这里再为大家提供2款非常方便的正则表达式工具供大家参考使用:
JavaScript正则表达式在线测试工具:
http://tools.jb51.net/regex/javascript
正则表达式在线生成工具:
http://tools.jb51.net/regex/create_reg
更多关于Python相关内容可查看本站专题:《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》
希望本文所述对大家Python程序设计有所帮助。
您可能感兴趣的文章:
- Python使用正则表达式获取网页中所需要的信息
- python 正则表达式 re.sub & re.subn
- python使用正则表达式的search()函数实现指定位置搜索功能
- python正则表达式re之compile函数解析
- python爬虫 正则表达式使用技巧及爬取个人博客的实例讲解
- Python基于正则表达式实现文件内容替换的方法
- Python正则表达式非贪婪、多行匹配功能示例
- Python正则表达式分组概念与用法详解
- Python正则表达式常用函数总结
- Python使用正则表达式实现文本替换的方法
- Python正则表达式教程之三:贪婪/非贪婪特性
- Python正则表达式教程之二:捕获篇
- 详解Python中的正则表达式
相关文章推荐
- Python基于正则表达式实现文件内容替换的方法
- python基于BeautifulSoup实现抓取网页指定内容的方法
- python提取网页的特定内容(正则表达式实现)
- 【转载】python计算文件的行数和读取某一行内容的实现方法
- Python实现给文件添加内容及得到文件信息的方法
- Python实现给文件添加内容及得到文件信息的方法
- Python抓取网页&批量下载文件方法初探(正则表达式+BeautifulSoup)
- Python正则表达式实现截取成对括号的方法
- Python实现解析Bit Torrent种子文件内容的方法
- JAVA正则表达式过滤文件的实现方法
- python 多线程 基于正则表达式的多线程文本替换功能实现
- Python实现替换文件中指定内容的方法
- Python实现文件内容批量追加的方法示例
- 使用正则表达式替换文件内容 分类: python 小练习 2013-08-13 15:07 332人阅读 评论(0) 收藏
- python计算文件的行数和读取某一行内容的实现方法
- python计算文件的行数和读取某一行内容的实现方法
- python计算文件的行数和读取某一行内容的实现方法
- python基于BeautifulSoup实现抓取网页指定内容的方法
- python计算文件的行数和读取某一行内容的实现方法
- 使用python实现正则匹配检索远端FTP目录下的文件