研究概要



<強化学習 (Reinforcement Learning)>

近年,深海や宇宙空間などの人の手が及びにくい未知環境を開拓するための 一手法として自律型ロボットが注目されつつある. 一般にそのような未知環境においては,手取り足取り正解を教えてくれるような 教師を想定することはできない. そのためロボットは試行錯誤を繰り返し, 結果的に良かったか悪かったかという情報のみから学習しなければならない. ここではそのような情報を総称して報酬と呼ぶ. 強化学習とは,この報酬という特別な入力を手がかりに環境に適応した 行動決定戦略を追求する教師なし機械学習である.
これまで行ってきた強化学習に関する研究の概要を こちらに示します.

<経験強化型学習 Exploitation-oriented Learning (XoL)>

強化学習は,未知環境に対する学習手法として非常に斬新かつ興味深いものであるが, キラーアプリケーションと呼べるような応用例が極めて少ないのも事実である. これには主として次のふたつの点が関係していると私は考えている.
第一に,学習に時間がかかりすぎる点, 第二に,適切な学習をさせるための報酬の設計指針が存在しない点,である.
これに対し私は, 経験強化型学習「Exploitation-oriented Learning (XoL)」と呼ばれる接近法を提唱している.
これまで行ってきたXoLに関する研究の概要を こちらに示します.

<科目分類支援システム(CCS)に関連した研究>

学位授与事業のための科目分類支援システムに関する研究を行っている.
これまで行ってきたCCSに関する研究の概要を こちらに示します.

宮崎和光のホームページへ