python字符串倒排
2013-12-24 15:18
281 查看
对字符串中的所有单词进行倒排。
说明:
1、每个单词是以26个大写或小写英文字母构成;
2、'-‘做为单词连接符使用时,视为单词的一部分,例如“aa-bb”是一个单词;但连续出现2个’-’及以上时视为单词间隔符,如“aa--bb”中的“--”视为间隔符,是2个单词“aa”和“bb”;
3、非构成单词的字符均视为单词间隔符;
4、要求倒排后的单词间隔符以一个空格表示;如果原字符串中相邻单词间有多个间隔符时,倒排转换后也只允许出现一个空格间隔符;
5、每个单词最长20个字母;
例如,输入:I am a--student;输出:student a am I
输入:inputSeq。
输出:outputSeq。
'''
import re
class Demo:
def converseWords(self, inputSeq):
word_pattern = re.compile(r"([a-zA-Z]+-?[a-zA-Z]+)|([a-zA-Z]+)")
#[a-zA-Z]表示大小写字母,+表示多个,?表示-可能没有
word_list = word_pattern.findall(inputSeq)#
word_list = [x[0] or x[1] for x in word_list] # 防止出现-abc的情况
word_list.reverse() #倒排
return " ".join(word_list) # 用空格来区分各个结
说明:
1、每个单词是以26个大写或小写英文字母构成;
2、'-‘做为单词连接符使用时,视为单词的一部分,例如“aa-bb”是一个单词;但连续出现2个’-’及以上时视为单词间隔符,如“aa--bb”中的“--”视为间隔符,是2个单词“aa”和“bb”;
3、非构成单词的字符均视为单词间隔符;
4、要求倒排后的单词间隔符以一个空格表示;如果原字符串中相邻单词间有多个间隔符时,倒排转换后也只允许出现一个空格间隔符;
5、每个单词最长20个字母;
例如,输入:I am a--student;输出:student a am I
输入:inputSeq。
输出:outputSeq。
'''
import re
class Demo:
def converseWords(self, inputSeq):
word_pattern = re.compile(r"([a-zA-Z]+-?[a-zA-Z]+)|([a-zA-Z]+)")
#[a-zA-Z]表示大小写字母,+表示多个,?表示-可能没有
word_list = word_pattern.findall(inputSeq)#
word_list = [x[0] or x[1] for x in word_list] # 防止出现-abc的情况
word_list.reverse() #倒排
return " ".join(word_list) # 用空格来区分各个结
相关文章推荐
- python2.X 打印输出时如何不换行
- Python:sql_for_inline_foreign_key_references() takes 4 positional arguments but 5 were given
- python模拟新浪微博登陆功能(新浪微博爬虫)
- python 字典的 setdefault用法
- Python 的VIM 的简单设置
- python调用mrjob实现hadoop的mapreduce日志解析
- Python基础教程---读书笔记五
- python爬虫抓站的一些技巧总结
- python的文件类型
- Python一个很好玩的特性decorator
- mysql 数据库dump ----python之mysqldump
- [原创]python高可用程序设计方法
- 给基于bosh安装的cloudfoundry添加python支持
- 老鸟的Python入门教程
- 做图服务器测试脚本——实习笔记
- python 遇到 syntaxerror: non-ascii character '/xd6' in file
- python的lamda表达式
- /usr/lib64/python2.6/site-packages/pycurl.so: undefined symbol: CRYPTO_set_l
- Python+wsgi环境配置及其安装
- 对Python中文分词模块结巴分词算法过程的理解和分析