Gensim库的使用——Doc2vec段落嵌入

使用方法:
地址:models.doc2vec – Doc2vec paragraph embeddings — gensim
1、初始化与训练模型
from gensim.test.utils import common_texts
from gensim.models.doc2vec import Doc2Vec, TaggedDocument

#将common_tests中的文本读入,并给其进行标号
documents = [TaggedDocument(doc, [i]) for i, doc in enumerate(common_texts)]
#将文本集合传入模型,进行定义
model = Doc2Vec(documents, vector_size=5, window=2, min_count=1, workers=4)
2、保存模型
from gensim.test.utils import get_tmpfile
fname = get_tmpfile("my_doc2vec_model")
model.save

Gensim库的使用——Doc2vec段落嵌入最先出现在Python成神之路

版权声明:
作者:cc
链接:https://www.techfm.club/p/12578.html
来源:TechFM
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>