您的位置:首页 > 编程语言 > Python开发

Python 数据处理实践(1)--遍历文件和map()函数

2017-12-22 17:28 190 查看

遍历文件

这个函数可以用来列出给出路径下所有的文件

def itgf(basicDir): #输入文件路径
list = os.listdir(basicDir)
fileList = []   #使用一个列表存储当前路径下所有的文件
for i in range(0, len(list)):
path = os.path.join(basicDir,list[i])
if(os.path.isfile(path)):
fileList.append(path)
elif(os.path.isdir(path)):
fileList.extend(itgf(path))
return fileList


获取文件路径对应的文件名:

name = os.path.basename(path)


关于os.path , 可以参考os.path

pandas库在数据处理当中非常有用。

对于pandas中的dataFrame,如果要进行大规模的类似的操作,使用for循环进行操作会使得代码块看起来太过繁杂。

因此,使用map函数很有用:

例如,对整列的数据进行操作

#df是一个dataFrame,df['xxx']存储了文件名(含有后缀)
df['xxx'].map(lambda x: ''.join(x.split('.')[:-1]))


这个函数可以获取df[‘xxx’]存储文件名对应不含后缀的文件名
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: