您的位置:首页 > 编程语言 > Python开发

python文件操作+字符串操作 总结(学习记录)

2014-05-16 16:05 831 查看
python 菜鸟 写代码的时候总是需要各种google 查一些python常用函数!!今天下定决心自己总结一份,,方便自己,幸福大家,且看且珍惜!!!!!!!

Python 文件操作函数 总结python中对文件、文件夹(文件操作函数)的操作需要涉及到os模块和shutil模块。

一、其中OS模块主要有以下方法:
1、得到当前工作目录,即当前Python脚本工作的目录路径: os.getcwd()——返回值就是当前工作目录

<span style="font-size:14px;"><span style="font-size:14px;">sil4@debian:~$ python
Python 2.6.6 (r266:84292, Dec 27 2010, 00:02:40) 
[GCC 4.4.5] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> import os
>>> os.getcwd()
'/home/sil4'
>>> current_path = os.getcwd()
>>> current_path
'/home/sil4'
>>> 
</span></span>


2、 返回指定目录下的所有文件和目录名:os.listdir(pathname)
——返回值为指定目录下的所有文件名和目录名

<span style="font-size:14px;"><span style="font-size:14px;">>>> os.listdir('/home/sil4')</span></span>


<span style="font-size:14px;"><span style="font-size:14px;">>>> for name in os.listdir(os.getcwd()):
...     print name
...
</span></span>


这两种使用方法会有不一样的输出效果,,,,可以自己试一下!!!

3、函数用来删除一个文件:os.remove()

<span style="font-size:14px;"><span style="font-size:14px;">>>> os.remove('/home/sil4/pointer')</span></span>
<span style="font-size:14px;"><span style="font-size:14px;">>>> path = "/tmp/log"
>>> path
'/tmp/log'
>>> os.remove(path)</span></span>


4、创建多级目录:os.makedirs(r“c:\python\test”)

<span style="font-size:14px;"><span style="color:#000000;"><span style="font-size:14px;">>>> >>> os.makedirs(r"/tmp/a/b/c")</span></span></span>


删除多个目录:os.removedirs(r“c:\python”)

<span style="font-size:14px;"><span style="font-size:14px;">>>> os.removedirs(r"/tmp/test")</span></span>
创建单个目录:os.mkdir(“test”)

<span style="font-size:14px;"><span style="font-size:14px;">>>> os.mkdir("/tmp/x")</span></span>


5、检验给出的路径是否是一个文件:os.path.isfile()

检验给出的路径是否是一个目录:os.path.isdir()

<span style="font-size:14px;"><span style="font-size:14px;">>>> path = "/tmp/log1"
>>> os.path.isfile(path)
True
>>> os.path.isdir(path)
False
</span></span>


判断是否是链接文件:os.path.islink()

<span style="font-size:14px;"><span style="color:#000000;"><span style="font-size:14px;">>>> os.path.islink(r"/tmp/a")
False</span></span><span style="font-size:14px;">
</span></span>
搜索目录下的所有文件:os.path.walk()

6、检验给出的路径是否真地存:os.path.exists()

判断是否是绝对路径:os.path.isabs()

<span style="font-size:14px;"><span style="font-size:14px;">>>> path = "/tmp/test"
>>> os.path.exists(path)
True
>>> os.path.isabs(path)
True
</span></span>


7、返回一个路径的目录名和文件名:os.path.split()

分离扩展名:os.path.splitext()

获取路径名:os.path.dirname()

获取文件名:os.path.basename()

<span style="font-size:14px;"><span style="font-size:14px;">>>> os.path.split("/tmp/test/test_file.py")
('/tmp/test', 'test_file.py')
</span></span>
<span style="font-size:14px;"><span style="font-size:14px;">>>> os.path.splitext(path)
('/tmp/test/test_file', '.py')
</span></span>
<span style="font-size:14px;"><span style="font-size:14px;">>>> path = "/tmp/test/test_file.py"
>>> os.path.dirname(path)
'/tmp/test'
>>> os.path.basename(path)
'test_file.py'
</span></span>


8、运行shell命令: os.system()

<span style="font-size:14px;"><span style="font-size:14px;">>>> cmdline = "cat /tmp/hello"
>>> os.system(cmdline)
this is test file    //这是文件内容
0         //这是执行成功之后的返回值
</span></span>


9、读取和设置环境变量:os.getenv()
与os.putenv()

<span style="font-size:14px;"><span style="font-size:14px;">>>> print os.getenv('PATH')</span></span>


10、给出当前平台使用的行终止符:os.linesep Windows使用'\r\n',Linux使用'\n'而Mac使用'\r'

<span style="font-size:14px;"><span style="font-size:14px;">>>> os.linesep
'\n'
</span></span>


11、指示你正在使用的平台:os.name
对于Windows,它是'nt',而对于Linux/Unix用户,它是'posix'

12、重命名:os.rename(old,
new)

<span style="font-size:14px;"><span style="font-size:14px;">>>> os.rename("/tmp/test/hello","/tmp/test/test")
</span></span>
13、获取文件属性:os.stat(file)

修改文件权限与时间戳:os.chmod(file)

终止当前进程:os.exit()、os._exit()

获取文件大小:os.path.getsize(filename)

在后台执行程序:osspawnv()

启动新进程:os.exec(), os.execvp()

改变工作目录:os.chdir(newdir)

二、关于文件的操作:

os.mknod("test.txt")
创建空文件

fp
= open("test.txt",w) 直接打开一个文件,如果文件不存在则创建文件

关于open 模式:

w 以写方式打开,

a 以追加模式打开 (从 EOF 开始, 必要时创建新文件)

r+ 以读写模式打开

w+ 以读写模式打开 (参见 w )

a+ 以读写模式打开 (参见 a )

rb 以二进制读模式打开

wb 以二进制写模式打开 (参见 w )

ab 以二进制追加模式打开 (参见 a )

rb+ 以二进制读写模式打开 (参见 r+ )

wb+ 以二进制读写模式打开 (参见 w+ )

ab+ 以二进制读写模式打开 (参见 a+ )

<span style="font-size:14px;">fp.read([size])                     #size为读取的长度,以byte为单位
fp.readline([size])                 #读一行,如果定义了size,有可能返回的只是一行的一部分
fp.readlines([size])                #把文件每一行作为一个list的一个成员,并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数,size是表示读取内容的总长,也就是说可能只读到文件的一部分。
fp.write(str)                      #把str写到文件中,write()并不会在str后加上一个换行符
fp.writelines(seq)            #把seq的内容全部写到文件中(多行一次性写入)。这个函数也只是忠实地写入,不会在每行后面加上任何东西。
fp.close()                        #关闭文件。python会在一个文件不用后自动关闭文件,不过这一功能没有保证,最好还是养成自己关闭的习惯。  如果一个文件在关闭后还对其进行操作会产生ValueError
fp.flush()                                      #把缓冲区的内容写入硬盘
fp.fileno()                                      #返回一个长整型的”文件标签“
fp.isatty()                                      #文件是否是一个终端设备文件(unix系统中的)
fp.tell()                                         #返回文件操作标记的当前位置,以文件的开头为原点
fp.next()                                       #返回下一行,并将文件操作标记位移到下一行。把一个file用于for … in file这样的语句时,就是调用next()函数来实现遍历的。
fp.seek(offset[,whence])              #将文件打操作标记移到offset的位置。这个offset一般是相对于文件的开头来计算的,一般为正数。但如果提供了whence参数就不一定了,whence可以为0表示从头开始计算,1表示以当前位置为原点计算。2表示以文件末尾为原点进行计算。需要注意,如果文件以a或a+的模式打开,每次进行写操作时,文件操作标记会自动返回到文件末尾。
fp.truncate([size])                       #把文件裁成规定的大小,默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大,依据系统的不同可能是不改变文件,也可能是用0把文件补到相应的大小,也可能是以一些随机的内容加上去。</span>


目录操作:

os.mkdir("file")
创建目录

复制文件:

shutil.copyfile("oldfile","newfile")
oldfile和newfile都只能是文件

shutil.copy("oldfile","newfile")
oldfile只能是文件夹,newfile可以是文件,也可以是目标目录

复制文件夹:

shutil.copytree("olddir","newdir")
olddir和newdir都只能是目录,且newdir必须不存在

重命名文件(目录)

os.rename("oldname","newname")
文件或目录都是使用这条命令

移动文件(目录)

shutil.move("oldpos","newpos")

删除文件

os.remove("file")

删除目录

os.rmdir("dir")只能删除空目录

shutil.rmtree("dir")
空目录、有内容的目录都可以删

转换目录os.chdir("path")
换路径

三、shutil模块对文件的操作:

1.复制单个文件:shultil.copy(oldfile, newfle)

2.复制整个目录树:shultil.copytree(r".\setup", r".\backup")

3.删除整个目录树:shultil.rmtree(r".\backup")

临时文件的操作:

1.创建一个唯一的临时文件:tempfile.mktemp() --> filename

2.打开临时文件:tempfile.TemporaryFile()

内存文件(StringIO和cStringIO)操作

[4.StringIO] #cStringIO是StringIO模块的快速实现模块

1.创建内存文件并写入初始数据:f = StringIO.StringIO("Hello world!")

2.读入内存文件数据:print f.read() #或print f.getvalue() --> Hello world!

3.向内存文件写入数据:f.write("Good day!")

4.关闭内存文件:f.close()

Python 字符串操作总结

总体上来说,Python中的字符串用起来还是相当简单。也许最复杂的事情就是在代码中有如此多的方法去编写他们。
1.python字符串通常有单引号('...')、双引号("...")、三引号("""...""")或('''...''')包围,三引 号包含的字符串可由多行组成,一般可表示大段的叙述性字符串。在使用时基本没有差别,但双引号和三引号("""...""")中可以包含单引号,三引号 ('''...''')可以包含双引号,而不需要转义。

<span style="font-size:14px;">单引号:'spa"m'
双引号:"spa'm"
三引号:'''... spam ...''',"""... spam ..."""</span>


在Python字符串中,单引号和双引号是可以互换的:这两种形式都能使用是因为不需要使用\转义字符就可以实现在一个字符串中包含其余种类的引号。

也就是说可以在一个双引号所包含的字符串中嵌入一个单引号字符。

<span style="font-size:14px;">>>> print "HelloWorld"
HelloWorld
>>> print "Hello'World"
Hello'World</span>


Python自动在任意表达式中合并相邻的字符串常量,尽管可以使用+来表明是字符串连接操作。

<span style="font-size:14px;">>>> title = "Hello" "World"
>>> print title
HelloWorld
>>> title = "Hello"+"World"
>>> print title
HelloWorld
</span>


注意:这些字符串之间增加逗号会创建一个元组,而不是一个字符串。而且Python倾向于打印所有这些形式的字符串为单引号,除非字符串内有单引号了。也可以使用\嵌入引号:

<span style="font-size:14px;">>>> title = 'Hello\'World',"Hello\"World"
>>> title
("Hello'World", 'Hello"World')
</span>


2.用(\)对特殊字符转义,如(\)、(')、(")。

转义字符:“s\tp\na\om”

<span style="font-size:14px;">>>> string = "s\np\na\nm"
>>> print string
s
p
a
m
</span>
<span style="font-size:14px;">>>> len(string)   <span style="color:#CC0000;">#这个字符串占了7个字节分别包含了ASCIIs字符、p字符、a字符、m字符和3个换行字符</span>
7
</span>


Python字符串反斜杠字符总结:

\newline 连续

\\ 保留\

\' 保留’

\" 保留”

\a 响铃

\b 倒退

\f 换页

\n 换行

\r 返回

\t 水平制表符

\v 垂直制表符

\xhh 十六进制值

\ooo 八进制值

\0 Null(不是字符串结尾)

Raw字符串抑制转义:

有时候为了引入转义字符而是用适应的反斜杠会带来一些麻烦:

例如:

myfile = open('C:\new\text.dat' , 'w')

通常我们会认为这句的作用是打开C:\new目录下名为text.dat的文件。但是这时候就会出现问题。。。。。问题就是这里面有\n,它会被识别成一个换行字符,\t会被识别称为一个制表符代替。。结果就是这句话就会被翻译成C:(换行)ew(制表符)ext.dat文件。。。而不是我们所期待的结果。。。

这正是我们所需要使用raw字符串所要解决的问题。如果字母r(大或小写)出现在第一个引号前面,将会关闭转义机制,结果就是

python会将\作为常量保持,就像输入那样。因此为了避免文件名错误记得增加字母r.

myfile = open(r'C:\new\text.dat' , 'w')

Raw字符串:r"/tmp/test/hello.py"

<span style="font-size:14px;">>>> string = r"/tmp/test/hello.py"
>>> print string
/tmp/test/hello.py</span>


另一种解决方法就是:使用两个反斜杠。

myfile = open('C:\\new\\text.dat' , 'w')

值得注意的是:当打印一个嵌入反斜杠的字符串时python自身也会使用这种写两个反斜杠的方法:

<span style="font-size:14px;">>>> path = r'c:\new\text.dat'
>>> path
'c:\\new\\text.dat'
>>> print(path)
c:\new\text.dat
</span>
<span style="font-size:14px;">>>> len(path)
15
</span>


一个raw字符串不能以单个反斜杠结尾,因为\会转义后续引用的字符。。。

Byte字符串:b'sp\x01am'+--

<span style="font-size:14px;">>>> print b'sp\x01am'</span>


仅在Python2.6中使用的Unicode字符串:u'eggs\u0020spam'

3.常用字符串函数

<span style="font-size:14px;">1)str.count() //返回该字符串中某个子串出现的次数
2)str.find()   //返回某个子串出现在该字符串的起始位置
3)str.lower() //将该字符串全部转化为小写
4)str.upper() //转为大写
5)str.split() //分割字符串,返回字串串列表,默认以空格分割
6)len(str)     //返回字符串长度</span>


3、三重引号编写多行字符串块(输入的什么,得到的就是什么)
>>> mantra = ''' always look
...  on the bright
... side of life
... .'''
>>> mantra
' always look\n on the bright\nside of life\n.'
>>> print mantra
always look
on the bright
side of life
.
三重引号字符串常用于文档字符串——侵入多行错误信息或在原文件中编写html、xml代码。也可以用来废除一些代码。如果希望让一些代码行不工作然后在继续运行代码,可以简单的在这几行代码前后加入三重引号,这样比在每一行加#方便一些。

参考:/article/4598375.html

纯手写,不正之处欢迎纠正。。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: