正则与pandas处理行数据
2019-05-18 16:28
85 查看
4000
[code]#定义一个数组 res_list=[] 循环需要处理的数据 for i in test_1['review']: #对应re res=re.sub("[^a-zA-Z]", " ",i) #将处理后的数据传入新数组 res_list.append(res) #建立新dataframe tab_2=pd.DataFrame(res_list,index=test_1.index,columns=['new_review']) #与原始表合并 tab_3=test_1.join(tab_2) #删除不需要的字段 tab_3=tab_3.drop(['review'],axis=1)
简单的一种方法
[code]import re def re_1(i): res=re.sub("[^a-zA-Z]", " ",i) return res test_1['new_review'] = test_1.apply(lambda x: re_1(x['review']), axis = 1)
相关文章推荐
- pandas处理finance.yahoo股票数据 WTI CL USO OIL
- 数据挖掘 pandas基础入门之缺失值处理
- 如何处理在使用正则表达式抓取数据是栈溢出问题
- 基于curl数据采集之正则处理函数get_matches的使用
- pandas处理丢失数据-【老鱼学pandas】
- pandas数据预处理实训题目(1缺失数据处理,2逐渐合并,3数据标准化)
- python的pandas处理数据第一次
- Pandas 处理丢失数据
- 使用pandas处理数据并绘图的例子
- 在Scala里面如何使用正则处理数据
- 使用Python Pandas处理亿级数据
- python使用pandas处理大数据节省内存技巧(推荐)
- Pyhton科学计算工具Pandas(六)—— 文本数据处理
- php正则处理jsonp数据
- 学习Python大数据处理模块Pandas
- 使用Pandas处理大型数据—节省90%内存的建议
- Pandas数据分析工具快速进阶一(索引的选取和过滤&缺失值的处理&索引的排序)
- Python数据科学之处理数据工具教程2(Pandas前篇)
- 使用Python Pandas处理亿级数据
- 使用pandas对矢量化数据进行替换处理的方法