本の感想「ビジネスパーソンのための人工知能入門」

先週巣籠さんの公演を伺って、AIエンジニアリングスキルを身につけよう、と思い立ったので、早速読んでみた。この後はDeep Learningモデルを本読みつつ実装してみる。あまり気を張らずに、のんびり趣味として取り組もう〜

現在の人工知能ブームは第3次。これまでは

1960-70年代：第一次ブーム：推論・探索（思考が早い人工知能）

1980-90年代：第二次ブーム：知識表現（博識な人工知能）

2000-10年代：第三次ブーム：機械学習（学習する人工知能）

3つに大別され、用途によって使い分ける。

教師あり学習(= Supervised Learing)

教師なし学習(= Unsupervised Learning)

強化学習(=Reinforcement Learing)

y=f(x)のうち、(x,y)のパターンがあることは判明しており、その上で関係性fを調べたい時に用いる

つまり、「何をもとに」「何を知りたいのか」が明確な場合に適当。例えば、ヒット商品の特徴(x)をもとに、新商品が売れるかどうか(y)を知りたい場合。

y=f(x)のうち、xは判明しているが、yは見つかっていない時に用いる

Machineが関係性fを調べる点は、Unsupervised Learningにおいても同じ。yもLearningによって導き出されるが、そのyがどんな意味を持つかはMachineでは判断できないので、人間が読み解く必要がある。

例えば、ECサイトのユーザ購買履歴(x)からユーザがどんな属性・性格に分類される人か調べたい時に、Machineがf関係性を調べユーザを分類することは可能だが、そのユーザがどんな属性・性格かは人がyの内容をみて整理する

「ある与えられた環境で、ある状態の時に、どう行動すれば良いか」を学習する手法

一連の行動に報酬（＝得点）を与え、ある時点での行動と報酬の相関性をみることで、自ら評価する

y=f(x)でいうと、自分の行動(x)と、それに対する報酬yという関係性

「課題」「手法」「データ」この三点をバランスよく意識すること

例えば、様々な手法を試したところで、そのインプットデータが誤っていると手法の評価は適切にできない

そもそもの前提として、機械学習は「未知の問題に対して、機械が自力で学習し、どのパターンに該当しそうなのか、見分けられるようになること」を目的としている

そのため、機械学習の結果が正しいかどうかは、未知の問題のため判断が難しい

じゃあどうするか？　擬似データを用いて、テストする

正解率(=Accuracty)：全データのうち、どれだけ予測が当たっていたか割合

適合率(=Precision)：予測が正のデータのうち、実際に正だった割合

再現率(=Recall)：実際が正のデータのうち、予測でも正だった割合

以上3つの指標をもとに、本当に目的に沿った予測ができているか判断する計算式

F値：2 * 適合率 * 再現率 / (適合率 + 再現率)

F値が高くなるほど、正確に予測できていると言える

ISLVRCの画像認識コンペで、ぶっちぎり優勝してhotになり、今や画像認識分野においては、人間よりも精度が高くなった

y=f(x)のfをものすごく複雑に設定できるようにしたもの

深層学習で用いられるモデルは、Artificial Neural Network

特徴は、「層」構造になっていること。入力(x)が持つ特徴を、抽象的なものから具体的なものへ、段階的に処理する。たくさんの関数が組み合わさることで、結果として全体のfはとても複雑な関数になる

^u^の備忘録