強化学習とは何か?

前に書いた記事で、強化学習が盛り上がっているとのことだったので、少し整理。
読書記録:AI研究「次の10年」を読み解く(雑誌 MIT Technology Reviewより)

強化学習の概要

機械学習を整理した記事などを見ると、主に3種類の学習方法があると言われている。

  • 学習データと正解が必要なもの
    • 教師あり学習
    • 強化学習
  • 学習データだけ必要なもの
    • 教師なし学習

教師あり学習と強化学習の違いは、教師あり学習はデータに対してラベル(自然言語処理のQ&Aタスクに対する正解・不正解、など)があるのに対して、強化学習は、ある状態の時にある行動を起こすと、最終的に報酬が高くなるように学習する手法。

なんで注目されているか

一番大きく注目されたのは、GoogleのAlphaGoが大きい。
囲碁は盤面が大きいので、機械が人間に勝つのはなかなか難しいと言われていたが、2015年に人間との対局に勝利したことで脚光を浴びた。

その性質から、よくゲームを学習させる動画やプログラミング記事が見られる。
ただ、ゲーム以外にもロボット、自動運転などにも使われている。

シミュレーションさえ出来れば、学習データを集める、追加する、という作業が不要で、自動でAIが学習してくれるのが強み。
一方、内容によっては、シミュレーション出来る環境を用意すること自体が大変(自動運転は観測できる場所がなければ、一般的にはできない)になる場合もある。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です