Gensim库的使用——Doc2vec段落嵌入
使用方法:
地址:models.doc2vec – Doc2vec paragraph embeddings — gensim
1、初始化与训练模型
from gensim.test.utils import common_texts
from gensim.models.doc2vec import Doc2Vec, TaggedDocument
#将common_tests中的文本读入,并给其进行标号
documents = [TaggedDocument(doc, [i]) for i, doc in enumerate(common_texts)]
#将文本集合传入模型,进行定义
model = Doc2Vec(documents, vector_size=5, window=2, min_count=1, workers=4)
2、保存模型
from gensim.test.utils import get_tmpfile
fname = get_tmpfile("my_doc2vec_model")
model.save
共有 0 条评论