您的位置：首页 > 编程语言 > Python开发

Python自然语言处理NLTK（1.1-1.3）

2015-10-10 19:54 525 查看

使用python中的nltk包处理自然语言时可以调用很多自带的函数：

text1.concordance("monstrous") ：查找文本中出现参数单词的上下文

text1.similar("monstrous") ：查找文本中出现与参数单词相近的上下文

len(text):获取文本text的长度

set(text):获取text的词汇表

sorted(set(text)):对text的词汇表进行排序

text.index('word'):获取word在text中第一次出现的索引位置

text[a:b]：从a到b的切片

fdist = FreqDist(text):统计text中每个单词出现的频率次数

text.collocations():找文本中的连词

fdist.items()：统计词长度和每个词出现的次数

fdist.max():统计词长度出现最多频率最多的

增加样本
fdist.inc(sample)

计数给定样本出现的次数
fdist['monstrous']

给定样本的频率
fdist.freq('monstrous')

样本总数
fdist.N()

以频率递减顺序排序的样本链表
fdist.keys()

以频率递减的顺序遍历样本
fdist: in sample for

数值最大的样本
fdist.max()

绘制频率分布表
fdist.tabulate()

绘制频率分布图
fdist.plot(）

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航