^u^の備忘録

備忘録 印象深い日々の出来事や、気付き等を記す

本の感想「ビジネスパーソンのための人工知能入門」

 

ビジネスパーソンのための人工知能入門

ビジネスパーソンのための人工知能入門

 

 

先週巣籠さんの公演を伺って、AIエンジニアリングスキルを身につけよう、と思い立ったので、早速読んでみた。この後はDeep Learningモデルを本読みつつ実装してみる。あまり気を張らずに、のんびり趣味として取り組もう〜

 

現在の人工知能ブームは第3次。これまでは

1960-70年代:第一次ブーム:推論・探索(思考が早い人工知能

1980-90年代:第二次ブーム:知識表現(博識な人工知能

2000-10年代:第三次ブーム:機械学習(学習する人工知能

 

3つに大別され、用途によって使い分ける。

教師あり学習(= Supervised Learing)

教師なし学習(= Unsupervised Learning)

強化学習(=Reinforcement Learing)

 

  • Supervised Learning

y=f(x)のうち、(x,y)のパターンがあることは判明しており、その上で関係性fを調べたい時に用いる

つまり、「何をもとに」「何を知りたいのか」が明確な場合に適当。例えば、ヒット商品の特徴(x)をもとに、新商品が売れるかどうか(y)を知りたい場合。

 

  • Unsupervised Learning

y=f(x)のうち、xは判明しているが、yは見つかっていない時に用いる

Machineが関係性fを調べる点は、Unsupervised Learningにおいても同じ。yもLearningによって導き出されるが、そのyがどんな意味を持つかはMachineでは判断できないので、人間が読み解く必要がある。

例えば、ECサイトのユーザ購買履歴(x)からユーザがどんな属性・性格に分類される人か調べたい時に、Machineがf関係性を調べユーザを分類することは可能だが、そのユーザがどんな属性・性格かは人がyの内容をみて整理する

 

「ある与えられた環境で、ある状態の時に、どう行動すれば良いか」を学習する手法

一連の行動に報酬(=得点)を与え、ある時点での行動と報酬の相関性をみることで、自ら評価する

y=f(x)でいうと、自分の行動(x)と、それに対する報酬yという関係性

 

  • AIプロジェクトで成果を出すポイント

「課題」「手法」「データ」この三点をバランスよく意識すること

例えば、様々な手法を試したところで、そのインプットデータが誤っていると手法の評価は適切にできない

 

そもそもの前提として、機械学習は「未知の問題に対して、機械が自力で学習し、どのパターンに該当しそうなのか、見分けられるようになること」を目的としている

そのため、機械学習の結果が正しいかどうかは、未知の問題のため判断が難しい

じゃあどうするか? 擬似データを用いて、テストする

 

正解率(=Accuracty):全データのうち、どれだけ予測が当たっていたか割合

適合率(=Precision):予測が正のデータのうち、実際に正だった割合

再現率(=Recall):実際が正のデータのうち、予測でも正だった割合

 

以上3つの指標をもとに、本当に目的に沿った予測ができているか判断する計算式

F値:2 * 適合率 * 再現率 / (適合率 + 再現率)

F値が高くなるほど、正確に予測できていると言える

 

ISLVRCの画像認識コンペで、ぶっちぎり優勝してhotになり、今や画像認識分野においては、人間よりも精度が高くなった

y=f(x)のfをものすごく複雑に設定できるようにしたもの

深層学習で用いられるモデルは、Artificial Neural Network

特徴は、「層」構造になっていること。入力(x)が持つ特徴を、抽象的なものから具体的なものへ、段階的に処理する。たくさんの関数が組み合わさることで、結果として全体のfはとても複雑な関数になる