您的位置：首页 > 编程语言 > Python开发

python下结巴中文分词

2015-04-27 15:39 225 查看

http://blog.csdn.net/pipisorry/article/details/45311229

jieba中文分词的使用

import jieba
sentences = ["我喜欢吃土豆","土豆是个百搭的东西","我不喜欢今天雾霾的北京", 'costumer service']
# jieba.suggest_freq('雾霾', True)
# jieba.suggest_freq('百搭', True)
words = [list(jieba.cut(doc)) for doc in sentences]
print(words)

[['我', '喜欢', '吃', '土豆'],
 ['土豆', '是', '个', '百搭', '的', '东西'],
 ['我', '不', '喜欢', '今天', '雾霾', '的', '北京'],
 ['costumer', ' ', 'service']]

[https://github.com/fxsjy/jieba]

from:/article/1480558.html

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

结巴分词(Python中文分词组件)
Python 中文分词工具 ——结巴分词的使用方法总结
“结巴”中文分词：做最好的 Python 中文分词组件
python中文分词：结巴分词
Python结巴中文分词工具使用过程中遇到的问题及解决方法
python中文分词：结巴分词
Python分词模块推荐:结巴中文分词
python中文分词工具：结巴分词jieba
对Python中文分词模块结巴分词算法过程的理解和分析
python中文语音识别后-结巴分词以及停用词过滤时遇到的转码问题
PYTHON 结巴中文分词工具的基础使用
结巴中文分词使用学习（python）
对Python中文分词模块结巴分词算法过程的理解和分析
python中文分词，使用结巴分词对python进行分词
Python 中文分词工具 ——结巴分词的使用方法总结
Python分词模块推荐：结巴中文分词
python中文分词,使用结巴分词对python进行分词(实例讲解)
结巴分词 0.19 发布 Python 中文分词组件
python 中文分词：结巴分词
Python中文分词模块结巴分词算法过程的理解和分析

新的分享

#新闻拍一拍# 微软推出 Pylance，改善 VS Code 中的 Python 体验
跟我学Python图像处理丨5种图像阈值化处理及算法对比
基于Python设计一个具有基本功能的通讯录
liunx上升级python2至python3
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
python常用标准库（时间模块time和datetime）
python之logging日志
python之configparser类的使用
Python常用标准库（pickle序列化和JSON序列化）
MySQL（12） - Python+MySQL读取写入图片
MySQL（11） - Python+MySQL开发新闻管理系统
Python 什么是flask框架？快速入门(flask安装，登录，新手三件套，登录认证装饰器，配置文件，路由系统，CBV)

章节导航