Python文本处理常用代码总结(二)
2016-02-18 10:38
686 查看
一、两步在java中调用python
1、在大类中加入这样的一个方法private static boolean CallPython(String string) throws Exception{ Process proc = Runtime.getRuntime().exec(string); proc.waitFor(); return true; }
2、在main函数中直接使用调用语句
CallPython("python py_java/***.py");
二、使用命令行调用python代码:
三、常用常识不再一一列举(按照使用频率排序)
去除多余的空格:strip列表添加.append
替换:replace
循环语句: for a in list: list可以来源于读文件readlines(),也可以是上述.append得到的列表,也可是是range(len(...))
将序列中元素通过制定的字符串连接''.join(list类型)
去重 words=set()
正则表达式中常用 re.match()/re.search() group(); re.sub(old, new, text) re.compile()
如何读取二进制文件存在变量中
去除中文的Python正则表达式:string = re.sub(ur"[^\u4e00-\u9fa5]", " ",string),java是nativeStr.split("[^\\u4e00-\\u9fa5]")
四、排序
dict= sorted(result.iteritems(), key=lambda d:d[1], reverse = True) #返回时列表 for key,val in dict:无items
import operater
sortedClassCount = sorted(classCount.iteritems(), key=operator.itemgetter(1), reverse=True) 返回是矩阵直接去 sortedClassCount[0][0]
五、写NLP任务python程序设计:重要的是设计,这个可以参考kim那篇CNN代码如:变量、参数的设计
相关文章推荐
- 在python官网下载了安装包双击之后没有反应?
- Python的getattr(),setattr(),delattr(),hasattr()
- python之计算器(第四天)
- python之haproxy配置文件操作(第三天)
- python装饰器与递归算法详解
- python语法学习
- python基础: day4作业计算器
- Python 实用技巧
- 转 Selenium+Python+Eclipse网页自动化集成环境配置(附简单的测试程序)
- Python文本处理常用代码总结(一)
- Python渗透测试工具合集
- python基础学习四
- python基础学习七: 列表生成式
- Python利用Nagios增加微信报警通知的功能
- Python 获取Google+特定用户最新动态
- python基础学习七: 迭代
- Python将数组(矩阵)存成csv文件,将csv文件读取为数组(矩阵)
- Python之路【第十一篇续】前端之CSS补充
- Python学习之day4
- python流程控制语法