您的位置:首页 > 其它

doc2vec 利用gensim 生成文档向量

2016-05-30 22:17 211 查看
利用gensim 直接生成文档向量

def gen_d2v_corpus(self, lines):

with open("./data/ques2_result.txt", "wb") as fw:
for line in lines:
fw.write(" ".join(jieba.lcut(line)) + "\n")

sents = doc2vec.TaggedLineDocument("./data/ques2_result.txt")
model = doc2vec.Doc2Vec(sents, size = 50, window = 5, alpha = 0.015)
model.train(sents)

corpus = model.docvecs
np.save("./output/d2v.corpus.npy", corpus)

return np.asarray(corpus)
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: