您的位置:首页 > 编程语言 > Python开发

Python学习笔记--字符串操作string

2013-07-29 03:32 513 查看
        Python中的字符串可以使用单引号,双引号,三引号表示。

        单引号(')与双引号(")代表的意思相同,但要注意配对着用。并不分成单引号代表一个字符,双引号代表一个字符串,实际上Python中没有char。

        三引号('''...''' or """...""")相比于前两者的的优势是,三引号内部可以自由使用单引号与双引号,可以用于描述一段对话中(因为里面很多引号),或者对一个函数的描述(因为可以指示一个多行的字符串,可以直接敲回车,而不用手写\n)。

        转义符及'\'(表示当前行未结束,下一行继续)与C语言相同。

        值得注意的是自然字符串与Unicode字符串。自然字符串可以将转义符取消掉,如:str=r'1 \n 2', print的结果为 “1 \n 2”,其中'\'与'n'表示两个字符,len(str)=6。 Unicode用于对非英文字母的处理,虽然str=u'1 \n 2', print的结果也为 “1 \n 2”,但'\n'还是表示换行符,只是并没有被直接转义,len(str)=5。

        Python中,字符串也是不可以直接通过赋值改变的,想要对字符串进行某些修改时,要用到字符串相关的一些函数(注意:修改完后,原字符串仍未改变,需要将改变后的结果存到另一个字符串变量中):

        len(str): 获取str的长度。

        enumerate(str): 返回str的index与value组成的元组。

        str.append(value): 在字符串str最后添加数据value。与str.pop()结合可以实现stack与queue

        str.pop(index): 从str中弹出位于index的数据,默认为最后一个,实现stack时,使用str.pop()表示栈顶数据弹出,实现queue时,使用str.pop(0)表示队列数据弹出。

        str.upper(), str.lower(), str.swapcase(): 全部大写,全部小写,大小写转换。

        str.find(subStr, start, end), str.rfind(subStr, start, end): 字符串搜索函数,分别表示从左往右与从右往左搜索,start与end是可选参数,默认值分别为0与-1,find()是从start到end, rfind()是从end到start. 当可以找到substr时,函数返回值为发现的第一个subStr的下标(不论是find()还是rfind()函数,字符串下标均是从左往右),如果未找到,则返回-1,不是0(这点,写if-else的时候需要注意)。

        str.count(subStr): 也是搜索函数,找到str中的substr的数目。

        str.replace(oldSub, newSub, maxReplaceTimes): 字符串替换函数,如果可以在str中找到oldSub,则将oldSub替换为newSub,否则不替换。maxReplaceTimes为可选参数,表示替换的次数,默认为替换所有可找到的oldSub。

        str.strip(subStr): 从字符串开始与结尾处分别搜索,直到未遇到subStr中的任何单个字符,停止;如果遇到,则删除,并继续搜索。如str='ababcabab'; str.strip('abc') 结果为''。subStr也是可选参数,默认值为空白符('\n', '\r', '\t', ' ')。类似的有lstrip()与rstrip()函数,分别表示从左往右与从右往左搜索。经常用于读文件中:

for line in file.readlines: # 或者 for line in file:
line_new=line.strip() #由于readlines函数不去除每行结束时的换行符,需要手动去除。将line.strip()改为line.strip().split()则可得到每个单词
       str.split(subStr): 字符串截断函数,将字符串以subStr为分界线分开变为一个由子字符串组成的list(subStr分开后消失)。subStr默认值为空格。

       str.join(list): 将str加在list每相邻的两个item之间,返回一个新的string,list中的item必须都是string。一个主要用处是对list的items加空格,并变成一句话。

       还有一些判断函数(如以is开头,返回bool型):str.islower(), str.isupper(), str.startswith(subStr), str.endswith(subStr), str.isalpha(), sub.isdigit() 等。

       最后,Python也支持八进制(oct),十六进制(hex),及ascii码转换(chr(), ord()). 这两个函数并不是字符串方法,而是Python的内建函数,所以使用的时候,是传递参数,而不是像str.method() 这样来使用。如:

>>> chr(112) #ascii码转数字或字符,输入为0<=value<=255
'p'
>>> ord('p') #数字或字符转ascii码,参数为str
112
>>> hex(11) #十进制转16进制,结果为str
'0xb'
>>> oct(11) #十进制转8进制,结果为str
'013'
>>> unichr(112) #unicode码值转数字或字符
u'p'
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  Python Unicode 字符串