Python 结巴分词(2)关键字提取
2016-07-18 20:37
387 查看
提取关键字的文章是,小说完美世界的前十章;
我事先把前十章合并到了一个文件中;
然后直接调用关键字函数;
关键字结果:
我事先把前十章合并到了一个文件中;
然后直接调用关键字函数;
import sys sys.path.append('../') import jieba import jieba.analyse from optparse import OptionParser#引入关键词的包 from docopt import docopt data_path = "C:\\Users\\wangyuguang\\Desktop\\work_data\\profect_world\\" topK = 10 withWeight = False content = "" for i in range(1,2): Data_path = data_path + "he"+".txt" content ="".join(open(Data_path, 'rb').read()) # print content tags = jieba.analyse.extract_tags(content, topK=topK, withWeight=withWeight)#直接调用 if withWeight is True: for tag in tags: print("tag: %s\t\t weight: %f" % (tag[0],tag[1])) else: print(",".join(tags))
关键字结果:
Building prefix dict from the default dictionary ... Loading model from cache c:\users\wangyuguang\appdata\local\temp\jieba.cache Loading model cost 0.386 seconds. Prefix dict has been built succesfully. 小不点,孩子,族长,石云峰,石村,凶禽,青鳞鹰,凶兽,一群,石昊
相关文章推荐
- 【python】lamda表达式,map
- skyeye-1.3.5运行提示python: undefined symbol: PyFloat_Type 和 undefined symbol: PyUnicodeUCS2_FromUnicode
- 【python】pathlib库
- Python学习--JSON
- 【python】argparse模块
- 原型聚类总结
- 【python】filter()
- python编码-2
- 简单的python2.7基于bs4和requests的爬虫
- python 读写方式 r , r+ , w , w+ , a , a+
- Python3在Windows下安装scrapy
- 用pyenv和virtualenv搭建单机多版本python虚拟开发环境-命令
- Debian8下python3和python2同时安装如何使用pip
- Python单元测试——unittest
- 树莓派+串口墨水电子屏幕+温度湿度传感器打造专属时钟
- 浏览器 user agent
- python数据分析工具安装集合
- python数据分析工具安装集合
- Python字符串内建处理函数
- 文成小盆友python-num11-(1) 线程 进程 协程