您的位置:首页 > 编程语言 > Python开发

Py之jieba:Python包之jieba包——中文分词最好的组件——Jason niu

2018-03-14 20:24 417 查看
python的第三方包里,jieba应该算得上是分词领域的佼佼者,想要使用python做文本分析,分词是必不可少的一个环节。
(1)支持三种分词模式:
  (1)精确模式:试图将句子最精确的切开,适合文本分析。
  (2)全模式:把句子中所有可以成词的词语都扫描出来,速度非常快,但是不能解决歧义。
  (3)搜索引擎模式:在精确模式的基础上,对长词再次切分,提高召回率,适合用于搜索引擎分词。
(2)支持繁体分词

(3)支持自定义词典
jieba包的安装:pip install jieba





好啦,大功告成,开始使用吧!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: