nltk的简单应用
2016-06-15 00:00
363 查看
简单例子
演示使用NLTK让计算机学习如何通过名字识别性别
# -*- coding: utf-8 -*- """ http://www.nltk.org/ 首页示例 """ import nltk # Tokenize and tag some text: sentence = "At eight o'clock on Thursday morning Arthur didn't feel very good." tokens = nltk.word_tokenize(sentence) print tokens tagged = nltk.pos_tag(tokens) print tagged[0:6] # Identify named entities: entities = nltk.chunk.ne_chunk(tagged) print entities # Display a parse tree: from nltk.corpus import treebank t = treebank.parsed_sents('wsj_0001.mrg')[0] t.draw() # NLTK中文语料库 sinica_treebank from nltk.corpus import sinica_treebank sinica_text = nltk.Text(sinica_treebank.words()) print sinica_text for (key, var) in sinica_treebank.tagged_words()[:8]: print '%s%s' % (key, var), # NLTK中文句法树 sinica_treebank.parsed_sents()[15].draw()
演示使用NLTK让计算机学习如何通过名字识别性别
# -*- coding: utf-8 -*- """ 演示使用NLTK让计算机学习如何通过名字识别性别。 """ import nltk # 定义学习方法 def gender_features(word): return {'last_letter':word[-1]} # 导入学习的姓名性别名单 from nltk.corpus import names import random names = ([(name, 'male') for name in names.words('male.txt')] + [(name, 'female') for name in names.words('female.txt')]) random.shuffle(names) # 开始学习 f = [(gender_features(n), g) for (n, g) in names] trainset, testset = f[500:], f[:500] c = nltk.NaiveBayesClassifier.train(trainset) # 测试 print c.classify(gender_features('Neo')) print c.classify(gender_features('Trinity'))
相关文章推荐
- 特征工程 vs. 特征提取
- 导数与微积分
- flume+kafka+storm+mysql架构设计
- 机器学习实用整理
- 登陆pl/sql developer
- Angular2 RC1 在vs2013下的环境搭建
- 手把手入门神经网络系列(1)_从初等数学的角度初探神经网络
- 使用Pig对手机上网日志进行分析
- HBase Shell常用命令
- 雅虎开源CaffeOnSpark:基于Hadoop/Spark的分布式深度学习
- Mapreduce读写DB数据
- Hadoop目前只是“穷人的ETL”
- 淘宝吴雪军:自然语言处理技术在搜索和广告中的应用
- python机器学习之神经网络(二)
- Java神经网络的框架Neuroph 2.5 with Neuroph Studio 测试
- 常用IT网址整理
- 神经网络Tips 和Tricks
- 抓包工具Fidder详解(主要来抓取Android中app的请求)
- VMware Workstation网络连接的三种模式
- 特征选择(三)-K-L变换