Profit Sharingに基づく強化学習システム


 
はじめに


Profit Sharing (PS)に基づく強化学習システムに関して, 以下のような解析的な研究成果が存在する.

  1. PSの合理性定理

  2. マルチエージェント環境下のでの合理性について

  3. PSの不完全知覚環境下への拡張

  4. 合理的政策形成アルゴリズムの連続値入力への拡張


 
公表論文


  1. 宮崎和光,山村雅幸,小林重信:強化学習における報酬割当ての理論的考察,人工知能学会誌,Vol.9, No.4, pp.580-587 (1994).
    宮崎和光,木村元,小林重信:Profit Sharingに基づく強化学習の理論と応用,人工知能学会誌,Vol.14, No.5, pp.800-807 (1999).

  2. 宮崎和光,荒井幸代,小林重信:Profit Sharingを用いたマルチエージェント強化学習における 報酬配分の理論的考察, 人工知能学会誌, Vol.14, No.6, pp.1156-1164 (1999).

  3. 宮崎和光,小林重信:Profit Sharingの不完全知覚環境下への拡張: PS-r*の提案と評価,人工知能学会論文誌, Vol.18, No.5, pp.286-296 (2003).

  4. 宮崎和光,木村元,小林重信:合理的政策形成アルゴリズムの連続値入力への拡張,人工知能学会論文誌, Vol.22, No.3, pp.332-341 (2007).

ひとつ前のページに戻る