В spacy, как использовать собственную модель word2vec, созданную в gensim?

Subigya Upadhyay спросил: 28 апреля 2018 в 09:52 в: model

Я обучил свою собственную модель word2vec в gensim, и я пытаюсь загрузить эту модель в spacy. Во-первых, мне нужно сохранить его на своем диске, а затем попытаться загрузить init-модель в spacy, но не в состоянии выяснить, как именно.

gensimmodel
Out[252]:
<gensim.models.word2vec.Word2Vec at 0x110b24b70>import spacy
spacy.load(gensimmodel)OSError: [E050] Can't find model 'Word2Vec(vocab=250, size=1000, alpha=0.025)'. It doesn't seem to be a shortcut link, a Python package or a valid path to a data directory.

1 ответ

Ali Zarezade ответил: 04 мая 2018 в 03:01

Как поясняется здесь, вы можете импортировать пользовательские векторы слов, которые прошли обучение с использованием оригинальной реализации word2vec от Gensim, Fast Text или Tomas Mikolov, создав модель, используя:

wget https://s3-us-west-1.amazonaws.com/fasttext-vectors/word-vectors-v2/cc.la.300.vec.gz
python -m spacy init-model en your_model --vectors-loc cc.la.300.vec.gz

, тогда вы может загрузить вашу модель, nlp = spacy.load('your_model') и использовать ее!

Также см. аналогичный вопрос, который ответил здесь .