人工知能とは ⑦ ディープラーニングの手法4
What is Artificial Intelligence?
強化学習
ある行動での報酬|スコアの合計をもっともたくさん獲得することを目的として、行動を学習していくモデルです。
■利用例
ロボットの行動制御学習
深層強化学習
2013年、DeepMind社がCNNを組み合わせた強化学習でボロック崩しゲームを行う動画をは発表して大きな注目を浴びました。
2015年からDeepMind社のAlphaGo|アルファ碁がプロ棋士に勝利して大きな話題となった。棋譜の学習して、CNNを状態や行動評価に利用して、モンテカルロ探索で手を考えています。
2017年に完全自己対局のみで学習するAlphaGo Zeroが発表され、AlphaGoを破っています。
DQN|Deep Q-learnig
ディープラーニングとQ学習|Q learningに組み合わせており、この発展形として以下がある。
・Double DQN
・Dueling Network
・Categorical DQN
・Rainbow
深層生成モデル
主に認識や識別タスクで発展してきた機械学習ですが、最近は生成タスクでも応用されています。
■データを元に、新しくなにかを生成したい
識別モデルの延長です。活用例としては、1次元の畳み込みのCNNを利用して音声生成を行うWaveNetがあります。
■データそのものを生成したい
生成モデルと言われ、元データの分布を学習して新しいものを生成します。この方法とディープラーニングを組み合わせたものを深層生成モデルと言います。
画像生成モデル
・変分オートエンコーダ|Variational AutoEncoder|VAE
オートエンコーダで平均と分散を学習する統計分布に変換して、そこからランダムに散布サンプリング、デコードして、新しいデータを生成します。
・敵対性生成ネットワーク|generative Adversarial Network|GAN
潜在空間をランダムベクトルとして入力し、画像を生成するジェネレータと画像が本物か、偽物かを予測して出力するディスクリミネータで構成されている。予測結果はジェネレータにフィードバックされます。偽物を作る学習と見破る学習をすることで、本物のような画像を作成することができるようになります。
・DCGAN|Deep Convolutional GAN
CNNを用いたGAN
日本ディープラーニング協会
JDLA監修
ディープラーニングG
ジェネラリスト検定
・公式テキスト
・公式問題集