August 29, 2017 Pythonの決定木分析できのこ派とたけのこ派を予測する 「決定木」は、おそらく世界で最も利用されている機械学習アルゴリズムです。教師ありの学習データから、階層的に条件分岐のツリーを作り、判別モデルを作ることができます。今回は決定木の活用例として、きのこ派とたけのこ派を予測する人工知能を作りました。プログラム言語は、Pythonとscikit-learnです。過去記事:AIエンジニアが教えるゼロから機械学習の勉強法続きを読む
August 26, 2017 【Python】Matplotlibでグラフ作成すればデータサイエンティストの仲間入り データサイエンスや機械学習では、グラフ作成ツールとしてMatplotlibが大変利用されています。なぜMatplotlibを使うのか、なぜグラフを作成するのか、その理由とグラフの作成方法をまとめました。過去記事※scikit-learn編:Python機械学習(AI)のデータ処理(pandas/scikit-learn)MatplotlibとはMatplotlibは、グラフ描画のためのPython用ライブラリです。データをいろんなグラフで可視化することが出来ます。折れ線グラフや散布図などたくさんのグラフが用意されています。グラフの持つ力はすごいです。グラフは事実を分かりやすく人に伝えることが出来ます。例えば、横軸にビタミンCの摂取量、縦軸に肌の健康度を取り、棒グラフを作成したところ、右肩上がりなグラフができたとします。そのグラフを広告で大々的に打てば、明日には女性陣がビタミンCを買い込んですぐに売り切れてしまうでしょう。事実を目で見える形で示すこと、これがグラフの持つ力です。matplotlibは、そんなグラフを簡単に無料で作ることが出来ます。続きを読む
August 21, 2017 Python機械学習でなぜPandasが利用されているのか 機械学習ではPandasが非常に利用されています。なぜPandasを使うのか、その理由とpandasの基礎的なデータ処理をまとめました。PandasとはPandasは、エクセルのようにデータを加工したり解析できるPython向けライブラリです。Pythonのスクリプトコードの先頭行でインポートすると、Pandasを利用することが出来ます。Pandas の基本的なデータ構造はDataFrame(データフレーム)です。DataFrameとは、Excelと同じデータ構造で、二次元のテーブルのことです。つまり行と列をもった配列データです。DataFrameの列データに付与するラベルをカラム(columns)と呼びます。過去記事:AIエンジニアが教えるゼロから機械学習の勉強法 続きを読む
August 02, 2017 機械学習(AI)勉強の最初のステップはPythonに触れる事です 機械学習のハードルは、どんどん下がっています。理由は、pythonとscikit-learnが簡単だからです。機械学習の第一歩は、pythonの理解です。この記事では、完全初心者向けに、よく利用するpythonの関数をご紹介します。いわば機械学習のSTEP1です!参考記事:AIエンジニアが教えるゼロから機械学習の勉強法pyhonとはpythonはシンプルなプログラミング言語です。最も習熟しやすい言語のひとつです。また便利なライブラリがたくさんあります。pandas:pandasは、エクセルのようにデータを処理したり分析できる。NumPy:高速で行列計算ができるライブラリ。リストと勘違いしやすいので注意。行ごとに列数が異なるような2 次元配列などは扱えません。scikit-learn:機械学習の機能が豊富。続きを読む
June 22, 2017 交差検定(クロスバリデーション)など機械学習の評価方法まとめ 本記事では、機械学習モデルの評価方法を解説します。機械学習モデルの評価は「ホールドアウト法」と「交差検定(クロスバリデーション)」と「混合行列」が分かれば大丈夫です。Pythonとscikit-learnのコードと合わせて見ていきます。関連記事:AIエンジニアが教えるゼロから機械学習の勉強法続きを読む
June 13, 2017 scikit-learnのディープラーニング実装簡単すぎワロタ ディープラーニングを、世界一簡単に実装する方法を見つけましたのでご報告します。参考書籍[第2版]Python 機械学習プログラミング 達人データサイエンティストによる理論と実践 (impress top gear)Vahid Mirjaliliインプレス2018-03-16ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装 [単行本(ソフトカバー)]斎藤 康毅オライリージャパン2016-09-24続きを読む
June 05, 2017 人工知能(AI)入門 ~機械学習でできることを解説~ 人工知能が出来ることを、前提知識がない方向けに解説しました。参考書籍ITエンジニアのための機械学習理論入門中井 悦司技術評論社2015-10-17続きを読む
April 30, 2017 実務で使うとこだけ!Python機械学習(AI)のデータ処理(Pandas/scikit-learn) 機械学習のデータ処理周りの実務で、よく使う関数をまとめました。目次 はじめに Pandasとは scikit-learnとは NumPyは使わないの? 機械学習の言語はpythonでいいの? 機械学習(AI開発)の流れ 1.データの準備 データフレームを定義する(DataFrame) csvファイルを読み込む(read_csv) 2.データの前処理 <欠損値編> 欠損値をカウントする(isunull) 欠損値を削除する(dropna) 欠損値を補完する(Imputer) <文字列編> 文字列データを数値に変換する(map) <外れ値編> グラフを作成する(plot) 列の平均値/中央値を出力する(mean/median) 列の最大値/最小値を確認する(max/min) 3.データの基礎分析 データから特定の列だけを選択する(iloc/ix) データフレームに列を追加する(’カラム名’) 4.特徴量設計 データを標準化する(StandardScaler) 相関係数を出力する(corr) 特徴量データと出力データに分割する(iloc) 学習データとテストデータに分割する(train_test_split) 続きを読む
April 01, 2017 事業開発担当者向け記事一覧 このブログでは、IT業界で新規事業開発に携わっている著者が、これまで山ほど失敗して学んだ事業開発のコツを公開しています。新規事業とは何か知りたい・新規事業とは何か ・【事業開発担当必見】おすすめのビジネス書をランキング形式で紹介する ・これから「新規事業」の本当の話をしよう ・大企業の新規事業は社内政治が8割という現実続きを読む
March 29, 2017 人工知能(AI)ブームに乗りたい人に切符を提供してみる この記事は、以下の方向けに執筆しています。・とにかくAIブームに乗りたい方 ・転職してAI案件に携わりたい方 ・AIに必要な知識だけをざっくり身に付けたい方 関連記事:AI人材になるにはスキルよりまず職種を選択しよう続きを読む