doc2vec 利用gensim 生成文档向量
2016-05-30 22:17
211 查看
利用gensim 直接生成文档向量
def gen_d2v_corpus(self, lines): with open("./data/ques2_result.txt", "wb") as fw: for line in lines: fw.write(" ".join(jieba.lcut(line)) + "\n") sents = doc2vec.TaggedLineDocument("./data/ques2_result.txt") model = doc2vec.Doc2Vec(sents, size = 50, window = 5, alpha = 0.015) model.train(sents) corpus = model.docvecs np.save("./output/d2v.corpus.npy", corpus) return np.asarray(corpus)
相关文章推荐
- Java:基于LinkedList实现栈和队列
- wampserver中Apache启动不了的问题
- use prebuild static lib on another android project
- iOS 多线程篇10—NSOperation基本操作
- 第8章:线性时间排序
- 获取spring容器要小心的坑
- 获取spring容器要小心的坑
- 如何在集合中筛选出满足条件的元素——org.apache.commons.collections4的使用
- VMware 设置开机自启动
- Retrofit + RxJava 业务状态重定向及分离
- html----01----html基础
- 第二阶段冲刺(第四天)
- 关于Threadlocal
- 开始写blog了
- [bzoj4570][scoi2016]妖怪 二分区间
- 手把手教你:用Qt做一个漂亮的电子时钟(纯代码)
- 替代图片+文字按钮问题
- centos6.5 搭建RTSP流媒体服务器(Darwin Streaming Server)
- Leetcode之unique-binary-search-trees
- JavaScript创建对象方式总结