本の感想「ビジネスパーソンのための人工知能入門」
先週巣籠さんの公演を伺って、AIエンジニアリングスキルを身につけよう、と思い立ったので、早速読んでみた。この後はDeep Learningモデルを本読みつつ実装してみる。あまり気を張らずに、のんびり趣味として取り組もう〜
- 人工知能の歴史
現在の人工知能ブームは第3次。これまでは
1960-70年代:第一次ブーム:推論・探索(思考が早い人工知能)
1980-90年代:第二次ブーム:知識表現(博識な人工知能)
2000-10年代:第三次ブーム:機械学習(学習する人工知能)
- 機械学習の種類
3つに大別され、用途によって使い分ける。
教師あり学習(= Supervised Learing)
教師なし学習(= Unsupervised Learning)
強化学習(=Reinforcement Learing)
- Supervised Learning
y=f(x)のうち、(x,y)のパターンがあることは判明しており、その上で関係性fを調べたい時に用いる
つまり、「何をもとに」「何を知りたいのか」が明確な場合に適当。例えば、ヒット商品の特徴(x)をもとに、新商品が売れるかどうか(y)を知りたい場合。
- Unsupervised Learning
y=f(x)のうち、xは判明しているが、yは見つかっていない時に用いる
Machineが関係性fを調べる点は、Unsupervised Learningにおいても同じ。yもLearningによって導き出されるが、そのyがどんな意味を持つかはMachineでは判断できないので、人間が読み解く必要がある。
例えば、ECサイトのユーザ購買履歴(x)からユーザがどんな属性・性格に分類される人か調べたい時に、Machineがf関係性を調べユーザを分類することは可能だが、そのユーザがどんな属性・性格かは人がyの内容をみて整理する
「ある与えられた環境で、ある状態の時に、どう行動すれば良いか」を学習する手法
一連の行動に報酬(=得点)を与え、ある時点での行動と報酬の相関性をみることで、自ら評価する
y=f(x)でいうと、自分の行動(x)と、それに対する報酬yという関係性
- AIプロジェクトで成果を出すポイント
「課題」「手法」「データ」この三点をバランスよく意識すること
例えば、様々な手法を試したところで、そのインプットデータが誤っていると手法の評価は適切にできない
- 機械学習の評価の仕方
そもそもの前提として、機械学習は「未知の問題に対して、機械が自力で学習し、どのパターンに該当しそうなのか、見分けられるようになること」を目的としている
そのため、機械学習の結果が正しいかどうかは、未知の問題のため判断が難しい
じゃあどうするか? 擬似データを用いて、テストする
- 機械学習の評価指標
正解率(=Accuracty):全データのうち、どれだけ予測が当たっていたか割合
適合率(=Precision):予測が正のデータのうち、実際に正だった割合
再現率(=Recall):実際が正のデータのうち、予測でも正だった割合
以上3つの指標をもとに、本当に目的に沿った予測ができているか判断する計算式
F値:2 * 適合率 * 再現率 / (適合率 + 再現率)
F値が高くなるほど、正確に予測できていると言える
- 深層学習(=Deep Learning)の概要
ISLVRCの画像認識コンペで、ぶっちぎり優勝してhotになり、今や画像認識分野においては、人間よりも精度が高くなった
y=f(x)のfをものすごく複雑に設定できるようにしたもの
深層学習で用いられるモデルは、Artificial Neural Network
特徴は、「層」構造になっていること。入力(x)が持つ特徴を、抽象的なものから具体的なものへ、段階的に処理する。たくさんの関数が組み合わさることで、結果として全体のfはとても複雑な関数になる