初心者向けにgensimとWord2Vecの利用方法と、類似単語の可視化を解説します。
Word2Vecは、自然言語処理の一つで大量のテキストデータを解析し、各単語の意味をベクトル表現をする手法です。単語の意味の近さや類似度などを計算することが出来ます。
主な機能としては、fastText、Word2vec、Doc2vec、潜在意味解析(LSI/LSA)、トピックモデル(LDA)、TF-IDFなどです。ライセンスはLGPLです。
gensim公式:https://radimrehurek.com/gensim/index.html続きを読む
Word2Vecは、自然言語処理の一つで大量のテキストデータを解析し、各単語の意味をベクトル表現をする手法です。単語の意味の近さや類似度などを計算することが出来ます。
Gensimとは
gensimは、統計的機械学習を使用した、教師なしトピックモデリングと自然言語処理のためのオープンソースライブラリです。無料で使えるPython向けライブラリです。主な機能としては、fastText、Word2vec、Doc2vec、潜在意味解析(LSI/LSA)、トピックモデル(LDA)、TF-IDFなどです。ライセンスはLGPLです。
gensim公式:https://radimrehurek.com/gensim/index.html