新規事業のつくり方

新しいことを学ぶことが好きです。今は機械学習や自然言語処理に興味があります。

カテゴリ: 人工知能

人工知能ブームがますます過熱感を帯びています。先週アルファ碁ゼロが、ルールを覚えさせるだけで人間を超えたというニュースが出ました。顧客や上司から説明を求められ、強化学習と教師あり学習の違いを解説したAI担当者も多かったのではないでしょうか。

先月上場したPKSHA Technologyが、時価総額1600億円を超えました。PER700倍、PBR170倍という信じられないような指数が付いています。少しでも株を知っている人なら、この指数がどれほど期待値を織り込んでいるか理解できると思います。

今の人工知能ブームは踊り場はありません。人工知能株式会社は、グローバルで国と企業を巻き込み信じられないスピードで進化し続けています。技術進歩が他の技術の進歩を生み出すことで、指数関数的に進歩しているからです。

本記事では、人工知能開発に携わる著者が、人工知能の最前線をご紹介し、ビジネスパーソンの生き残り方法を提案してみます。

過去記事:これだけは知っておけ!PythonでAI開発の基礎まとめ

続きを読む

「今年中にあなたが結婚できる確率は4%です。しかし英会話スクールに入ることで、結婚できる確率が2%上がります。」
「あなたは3年後にリストラされる確率は65%です。しかし今からpythonを学ぶことで、リストラされる確率が30%下がります。」

ロジスティック回帰分析は、分類モデルを作るアルゴリズムです。そして、分類結果の発生確率を予測します。例えば「ガンになる確率 30%」 のような予測ができます。

また、モデルの中身を数式として出力できるので、ディープラーニングのようにブラックボックスになりません。そのため、企業データの分析レポートなどでは、ロジスティック回帰とディープラーニングの2種類の手法で分析して比較するということがよく見られます。

一方、ロジスティック回帰は、線形分離可能なクラスに対してのみ高い性能が発揮されます。非線形の問題はうまく学習できないという重回帰分析と同じ問題を抱えています。

過去記事:これだけは知っておけ!PythonでAI開発の基礎まとめ続きを読む

機械学習界隈で、最強アルゴリズムの一角を占めていたランダムフォレスト。ディープラーニングが登場した後急速に存在感をなくすものの、その利便性と強力さから多くのデータサイエンティストが現役利用中。

scikit-learnでのランダムフォレスト、分類モデルと重要度評価の実装方法まとめました。

決定木の問題点

決定木は、上から順に条件分岐を作って分類モデルを作る手法です。ルールが可視化できる、正規化や標準化などのデータ加工が不要など、素晴らしいアルゴリズムです。
しかし、決定木は過学習を起こしやすいという問題点がありました。

前の記事:人工知能できのこ派とたけのこ派を予測する【python決定木】続きを読む

きのこ派とたけのこ派を予測する人工知能を作りましたのでご活用ください。pythonとscikit-learnで決定木を作りました。

決定木分析は、機械学習界隈で一番利用されているアルゴリズムです。決定木は、条件分岐のツリーを作り、階層的にデータを分割することで、モデルを作ることができます。

過去記事:AIエンジニアが教えるゼロから機械学習の勉強法続きを読む

データサイエンスや機械学習では、グラフ作成ツールとしてmatplotlibが大変利用されています。なぜmatplotlibを使うのか、なぜグラフを作成するのか、その理由とグラフの作成方法をまとめました。

過去記事
※pandas編:python機械学習でなぜpandasが利用されているのか
※scikit-learn編:python機械学習(AI)のデータ処理(pandas/scikit-learn)

matplotlibとは

matplotlibは、グラフ描画のためのpython用ライブラリです。データをいろんなグラフで可視化することが出来ます。折れ線グラフや散布図などたくさんのグラフが用意されています。

グラフの持つ力はすごいです。グラフは事実を分かりやすく人に伝えることが出来ます。例えば、横軸にビタミンCの摂取量、縦軸に肌の健康度を取り、棒グラフを作成したところ、右肩上がりなグラフができたとします。そのグラフを広告で大々的に打てば、明日には女性陣がビタミンCを買い込んですぐに売り切れてしまうでしょう。事実を目で見える形で示すこと、これがグラフの持つ力です。

matplotlibは、そんなグラフを簡単に無料で作ることが出来ます。
続きを読む

↑このページのトップヘ