您的位置：首页 > 编程语言 > Python开发

python word2vec

2017-08-16 13:46 204 查看

from gensim.models import Word2Vec
from gensim.models.word2vec import LineSentence

def gen_embeddings(in_file, out_file, size=100):
corpus = LineSentence(in_file)
model = Word2Vec(
sentences=corpus, size=size, alpha=0.025, window=5, min_count=5,
max_vocab_size=None, sample=1e-3, seed=1, workers=3, min_alpha=0.0001,
sg=0, hs=0, negative=5, cbow_mean=1, hashfxn=hash, iter=5, null_word=0,
trim_rule=None, sorted_vocab=1
)
model.wv.save_word2vec_format(out_file, binary=False)

gen_embeddings('seg.txt','model')

model=Word2Vec().wv.load_word2vec_format('LianCheng', binary=False)

y2 = model.most_similar("供热", topn=10)  # 10个最相关的
for item in y2:
print (item[0], item[1])

model.wv["供热"]

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

word2vec的python应用
gensim实现python对word2vec的训练和计算
【word2vec】之训练模型结果的结构探究模型改造 python gensim
gensim实现python对word2vec的训练和计算
python 下的 word2vec 学习笔记
python 环境下gensim中的word2vec的使用笔记
wiki_word2vec_python实验
python——word2vec
Python版的Word2Vec -- gensim 学习手札中文词语相似性度量 V1.1
word2vec python使用
Python Tensorflow下的Word2Vec代码解释
python实现word2vec训练结果bin文件转txt文件
Python Tensorflow下的Word2Vec代码解释
python 下的 word2vec 学习笔记
Python中gensim库word2vec的使用
【python gensim使用】word2vec词向量处理英文语料
Word2Vec的Python版Gensim的使用
python初步实现word2vec
gensim中word2vec python源码理解（一）
【python gensim使用】word2vec词向量处理英文语料

新的分享

#新闻拍一拍# 微软推出 Pylance，改善 VS Code 中的 Python 体验
跟我学Python图像处理丨5种图像阈值化处理及算法对比
基于Python设计一个具有基本功能的通讯录
liunx上升级python2至python3
es的查询、排序查询、分页查询、布尔查询、查询结果过滤、高亮查询、聚合函数、python操作es
python常用标准库（时间模块time和datetime）
python之logging日志
python之configparser类的使用
Python常用标准库（pickle序列化和JSON序列化）
MySQL（12） - Python+MySQL读取写入图片
MySQL（11） - Python+MySQL开发新闻管理系统
Python 什么是flask框架？快速入门(flask安装，登录，新手三件套，登录认证装饰器，配置文件，路由系统，CBV)

章节导航