您的位置:首页 > 其它

《自然语言处理实战入门》 第二章:NLP 前置技术----正则表达式

2020-02-17 23:11 387 查看

文章大纲

简介

一个正则表达式(或RE)指定了一集与之匹配的字符串;模块内的函数可以让你检查某个字符串是否跟给定的正则表达式匹配(或者一个正则表达式是否匹配到一个字符串,这两种说法含义相同)。

正则表达式是处理字符串的强大工具,拥有独特的语法和独立的处理引擎。

我们在大文本中匹配字符串时,有些情况用str自带的函数(比如find, in)可能可以完成,有些情况会稍稍复杂一些(比如说找出所有“格式类似邮箱”的字符串,所有和python相关的句子),这个时候我们需要一个可根据模式提取字串的工具,这个时候正则表达式就派上用场了。

python 字符串操作

在 Python 中处理文本数据是使用 str 对象,也称为 字符串。 字符串是由 Unicode 码位构成的不可变 序列。 字符串字面值有多种不同的写法:

  • 单引号: ’ 允许包含有 “双” 引号’

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐