《自然语言处理实战入门》 第二章:NLP 前置技术----正则表达式
2020-02-17 23:11
387 查看
文章大纲
简介
一个正则表达式(或RE)指定了一集与之匹配的字符串;模块内的函数可以让你检查某个字符串是否跟给定的正则表达式匹配(或者一个正则表达式是否匹配到一个字符串,这两种说法含义相同)。
正则表达式是处理字符串的强大工具,拥有独特的语法和独立的处理引擎。
我们在大文本中匹配字符串时,有些情况用str自带的函数(比如find, in)可能可以完成,有些情况会稍稍复杂一些(比如说找出所有“格式类似邮箱”的字符串,所有和python相关的句子),这个时候我们需要一个可根据模式提取字串的工具,这个时候正则表达式就派上用场了。
python 字符串操作
在 Python 中处理文本数据是使用 str 对象,也称为 字符串。 字符串是由 Unicode 码位构成的不可变 序列。 字符串字面值有多种不同的写法:
-
单引号: ’ 允许包含有 “双” 引号’
相关文章推荐
- 《自然语言处理实战入门》 ---- 第三章 :中文分词原理及相关组件简介 之 汉语分词领域主要分词算法、组件、服务(下)
- 《自然语言处理实战入门》 ---- 第三章 :中文分词原理及相关组件简介 之 分词算法原理
- 如何优雅地打印一个Java对象?
- 教妹学Java(七):究竟什么是JVM?
- Lambda 表达式入门,看这篇就够了
- 教妹学Java(八):初识Java变量
- StackOverflow上87万访问量的问题:什么是“找不到符号”?
- 老哥,Java 中 final 和 effectively final 到底有什么区别?
- 强烈推荐 10 款珍藏的 Chrome 浏览器插件
- 神书《笛卡儿几何》读后感
- 2020 年区块链最具影响力人物 Top 20,孙宇晨也上榜了
- 大地震!某大厂“硬核”抢人,放话:只要AI人才,高中毕业都行!
- Julia 语言可重用性高竟源于缺陷和不完美?
- 移动端AI应用太抢手,高通这次要送开发者20万+的SUV
- 病毒详解及批处理病毒制作:自启动、修改密码、定时关机、蓝屏、进程关闭...
- 清华博导尹首一, 带你吃透 AI 芯片来龙去脉!
- 爱荷华大选 App 投票酿闹剧的反思:为什么我们在软件工程方面如此糟糕?
- 微软开源深度学习优化库 DeepSpeed 连登 GitHub 趋势榜!
- 隔离是否有效?北大面向新冠疫情的数据可视化分析与模拟预测
- 最想学 Go、Python,全栈开发者紧缺!分析了 11 万条程序员数据后有了这些发现...