新規事業のつくり方

新しいことを学ぶことが好きです。今は機械学習や自然言語処理に興味があります。

カテゴリ: 人工知能

初心者向けにgensimとWord2Vecの利用方法と、類似単語の可視化を解説します。

Word2Vecは、自然言語処理の一つで大量のテキストデータを解析し、各単語の意味をベクトル表現をする手法です。単語の意味の近さや類似度などを計算することが出来ます。

Gensimとは

gensimは、統計的機械学習を使用した、教師なしトピックモデリングと自然言語処理のためのオープンソースライブラリです。無料で使えるPython向けライブラリです。

主な機能としては、fastTextWord2vecDoc2vec潜在意味解析(LSI/LSA)トピックモデル(LDA)TF-IDFなどです。ライセンスはLGPLです。

gensim公式:https://radimrehurek.com/gensim/index.html
続きを読む

「人工知能開発を独学で学びたい」「人工知能をいざ学ぼうと思っても何から手を付けたらよいのか分からない」 という方向けに、最短でAI開発を習得する方法を書きました。

学びなおしの必要性が高まる

日本政府が「リカレント教育(社会人が学校に戻って学び直すこと)」推進のため、2019年度から約5000億円の予算を投入する方針を発表しました。

確かに、人工知能が専門家の仕事を代替しつつあるため、誰もが学び直し、新しいスキルを習得することが求められる時代となりました。技術的失業による1億学生時代です。

しかし、年功序列企業で忙しく働く日本のサラリーマンが、大学などの教育機関に戻ることが本当にできるのでしょうか。現実的には、独学で習得するケースも多くなることが想定されます。

いずれにせよ、サラリーマンにとって、"勉強"という単語がもう一度求められてくることは間違いなさそうです。
続きを読む

みなさんは「AI人材」という言葉をご存知でしょうか。

第4次産業革命とも言われる人工知能ブームは、文字通り急激な変化を起こしました。企業は必死で戦略を見直しているものの、そもそも見直すだけの知識を持つ人材が社内におらず袋小路です。見直せる人材がいないので、必要な人材像を定義出来ず、とりあえず「AI人材」とビジネス界隈でよく利用されています。

とにかく今、圧倒的な人材不足です。ではこの「AI人材」にどしたらなれるのでしょうか。

※本記事には、マイナビのプロモーションを含みます。

関連記事:人工知能(AI)ブームに乗りたい人に切符を提供してみる
続きを読む

人工知能ブームがますます過熱感を帯びています。先週アルファ碁ゼロが、ルールを覚えさせるだけで人間を超えたというニュースが出ました。顧客や上司から説明を求められ、強化学習と教師あり学習の違いを解説したAI担当者も多かったのではないでしょうか。

先月上場したPKSHA Technologyが、時価総額1600億円を超えました。PER700倍、PBR170倍という信じられないような指数が付いています。少しでも株を知っている人なら、この指数がどれほど期待値を織り込んでいるか理解できると思います。

今の人工知能ブームは踊り場はありません。人工知能株式会社は、グローバルで国と企業を巻き込み信じられないスピードで進化し続けています。技術進歩が他の技術の進歩を生み出すことで、指数関数的に進歩しているからです。

本記事では、人工知能開発に携わる著者が、人工知能の最前線をご紹介し、ビジネスパーソンの生き残り方法を提案してみます。

過去記事:これだけは知っておけ!PythonでAI開発の基礎まとめ

続きを読む

ロジスティック回帰分析は、2値の分類モデルを作るアルゴリズムです。そして、分類結果の発生確率を予測できます。例えばある人が「ガンである確率 90%」 のような予測ができます。

また、モデルの中身を数式として理解できるので、ディープラーニングのようにブラックボックスになりません。つまり、どの説明変数がモデルの判定に重要かが人間でも分かります。

一方、ロジスティック回帰は、線形分離可能なクラスに対してのみ高い性能が発揮されます。非線形の問題はうまく学習できないという重回帰分析と同じ問題を抱えています。
加えて、ロジスティック回帰の説明変数は、数量データのみ利用可能です。カテゴリデータは基本的に推奨されません。

過去記事:ランダムフォレストで特徴量の重要度を評価する
続きを読む

↑このページのトップヘ