新規事業のつくり方

新しいことを学ぶことが好きです。今は機械学習や自然言語処理に興味があります。

ここ数年間、AI開発の良質な学習コンテンツが増えました。

インターネットに、良質な解説記事が増えました。特にディープラーニングの解説記事周辺は、これでもかというくらい分かりやすく解説されています。

書籍では、松尾先生の「人工知能は人間を超えるか」を皮切りに、「python 機械学習プログラミング」と「ゼロから作るDeep Learning」が出版され、CONNPASS周辺で多くの勉強会が開催されました。

また、事前知識ゼロでも機械学習を学べる「pythonではじめる機械学習」が出版され、機械学習のハードルが大きく下がりました。これらの良質な書籍は、機械学習ブームの影の立役者でしょう。


そしてまた、機械学習を学ぶ上で最高の教材が発表されました。Udemyの「Pythonで機械学習:scikit-learnで学ぶ識別入門」です。

続きを読む

この記事を読んでほしい方
・人工知能の仕事に興味がある方
・AIエンジニアになりたい方

先日「SEから機械学習エンジニアに転職したい場合、どこの転職サイトに登録すれば良いか」と質問を受けました。

確かに、世の中にはたくさんの転職サイトがあって、どれに登録すればいいか迷うこともあると思います。私自身も結構悩みました。なので今回は、転職サイトの選び方を考えてみます。

参考記事:AI人材の年収が高い理由は?|SEがAIエンジニアに転職すべき2つの理由
続きを読む

人工知能や機械学習の未経験から、"AI人材"として転職する方法を解説します。

結論から書くと、「人工知能未経験の方は、AI企画人材になりましょう」というお話です。

本記事が想定する読者層
・人工知能未経験からAI人材になりたい方
・現在ビジネス系職種でAIに興味がある方
・今のAIブームに乗りたい方

AI市場の成長はデータ量が増えているから

IDC Japanが、国内のAIシステム市場は5年で16倍に急成長すると発表しました。2021年の市場規模は、2016年比で16倍となる2500億円とのこと。ビジネス領域でのAI活用がいよいよ本格化するそうです。

なぜこんなに市場が成長するのでしょうか。ハードウェアやディープラーニングの進化も理由にあげられますが、一番の理由はデータ量が増えたからでしょう。

2020年に世界のデータ量は、44兆GBになると言われています。この44兆GBのデータを、世界中のAIエンジニアが分析するわけです。しかもデータ量は、年間40%とかで増えていきます。そりゃ人材不足になるのも当たり前かもしれません。1GBのデータの分析でも相当きついですからね。

この44兆GBのデータを、いかに自社で集め、いかに活用していくかが今後の企業戦略のカギでしょう。そしてデータ活用の主役はAIです。

ではAI時代のキャリア戦略として、どのようなポジショニングがあるか解説いたします。

関連記事:AI営業職がAI時代の主役になるかもしれない続きを読む

みなさんは「AI人材」という言葉をご存知でしょうか。

第4次産業革命とも言われる人工知能ブームは、文字通り急激な変化を起こしました。企業は必死で戦略を見直しているものの、そもそも見直すだけの知識を持つ人材が社内におらず袋小路です。見直せる人材がいないので、必要な人材像を定義出来ず、とりあえず「AI人材」とビジネス界隈でよく利用されています。

とにかく今、圧倒的な人材不足です。ではこの「AI人材」にどしたらなれるのでしょうか。

関連記事:人工知能(AI)ブームに乗りたい人に切符を提供してみる
続きを読む

人工知能ブームがますます過熱感を帯びています。先週アルファ碁ゼロが、ルールを覚えさせるだけで人間を超えたというニュースが出ました。顧客や上司から説明を求められ、強化学習と教師あり学習の違いを解説したAI担当者も多かったのではないでしょうか。

先月上場したPKSHA Technologyが、時価総額1600億円を超えました。PER700倍、PBR170倍という信じられないような指数が付いています。少しでも株を知っている人なら、この指数がどれほど期待値を織り込んでいるか理解できると思います。

今の人工知能ブームは踊り場はありません。人工知能株式会社は、グローバルで国と企業を巻き込み信じられないスピードで進化し続けています。技術進歩が他の技術の進歩を生み出すことで、指数関数的に進歩しているからです。

本記事では、人工知能開発に携わる著者が、人工知能の最前線をご紹介し、ビジネスパーソンの生き残り方法を提案してみます。

過去記事:これだけは知っておけ!PythonでAI開発の基礎まとめ

続きを読む

ロジスティック回帰分析は、2値の分類モデルを作るアルゴリズムです。そして、分類結果の発生確率を予測できます。例えばある人が「ガンである確率 90%」 のような予測ができます。

また、モデルの中身を数式として理解できるので、ディープラーニングのようにブラックボックスになりません。つまり、どの説明変数がモデルの判定に重要かが人間でも分かります。

一方、ロジスティック回帰は、線形分離可能なクラスに対してのみ高い性能が発揮されます。非線形の問題はうまく学習できないという重回帰分析と同じ問題を抱えています。
加えて、ロジスティック回帰の説明変数は、数量データのみ利用可能です。カテゴリデータは基本的に推奨されません。

過去記事:ランダムフォレストで特徴量の重要度を評価する
続きを読む

機械学習界隈で、最強アルゴリズムの一角を占めていたランダムフォレスト。ディープラーニングが登場した後急速に存在感をなくすものの、その利便性と強力さから多くのデータサイエンティストが現役利用中。

scikit-learnでのランダムフォレスト、分類モデルと重要度評価の実装方法まとめました。

決定木の問題点

決定木は、上から順に条件分岐を作って分類モデルを作る手法です。ルールが可視化できる、正規化や標準化などのデータ加工が不要など、素晴らしいアルゴリズムです。
しかし、決定木は過学習を起こしやすいという問題点がありました。

前の記事:Pythonの決定木分析できのこ派とたけのこ派を予測する続きを読む

「決定木」は、おそらく世界で最も利用されている機械学習アルゴリズムです。教師ありの学習データから、階層的に条件分岐のツリーを作り、判別モデルを作ることができます。

今回は決定木の活用例として、きのこ派とたけのこ派を予測する人工知能を作りました。プログラム言語は、Pythonとscikit-learnです。

過去記事:AIエンジニアが教えるゼロから機械学習の勉強法続きを読む

データサイエンスや機械学習では、グラフ作成ツールとしてMatplotlibが大変利用されています。なぜMatplotlibを使うのか、なぜグラフを作成するのか、その理由とグラフの作成方法をまとめました。

過去記事
※scikit-learn編:Python機械学習(AI)のデータ処理(pandas/scikit-learn)

Matplotlibとは

Matplotlibは、グラフ描画のためのPython用ライブラリです。データをいろんなグラフで可視化することが出来ます。折れ線グラフや散布図などたくさんのグラフが用意されています。

グラフの持つ力はすごいです。グラフは事実を分かりやすく人に伝えることが出来ます。例えば、横軸にビタミンCの摂取量、縦軸に肌の健康度を取り、棒グラフを作成したところ、右肩上がりなグラフができたとします。そのグラフを広告で大々的に打てば、明日には女性陣がビタミンCを買い込んですぐに売り切れてしまうでしょう。事実を目で見える形で示すこと、これがグラフの持つ力です。

matplotlibは、そんなグラフを簡単に無料で作ることが出来ます。
続きを読む

機械学習ではPandasが非常に利用されています。なぜPandasを使うのか、その理由とpandasの基礎的なデータ処理をまとめました。

Pandasとは

Pandasは、エクセルのようにデータを加工したり解析できるPython向けライブラリです。Pythonのスクリプトコードの先頭行でインポートすると、Pandasを利用することが出来ます。

Pandas の基本的なデータ構造はDataFrame(データフレーム)です。DataFrameとは、Excelと同じデータ構造で、二次元のテーブルのことです。つまり行と列をもった配列データです。DataFrameの列データに付与するラベルをカラム(columns)と呼びます。

過去記事:AIエンジニアが教えるゼロから機械学習の勉強法

続きを読む

↑このページのトップヘ