Profit Sharingに基づく強化学習システム

　

はじめに

Profit Sharing (PS)に基づく強化学習システムに関して，以下のような解析的な研究成果が存在する．

PSの合理性定理
マルチエージェント環境下のでの合理性について
PSの不完全知覚環境下への拡張
合理的政策形成アルゴリズムの連続値入力への拡張

　

公表論文

宮崎和光，山村雅幸，小林重信：強化学習における報酬割当ての理論的考察，人工知能学会誌，Vol.9, No.4, pp.580-587 (1994).
宮崎和光，木村元，小林重信：Profit Sharingに基づく強化学習の理論と応用，人工知能学会誌，Vol.14, No.5, pp.800-807 (1999).
宮崎和光，荒井幸代，小林重信：Profit Sharingを用いたマルチエージェント強化学習における報酬配分の理論的考察, 人工知能学会誌, Vol.14, No.6, pp.1156-1164 (1999).
宮崎和光，小林重信：Profit Sharingの不完全知覚環境下への拡張： PS-r*の提案と評価，人工知能学会論文誌, Vol.18, No.5, pp.286-296 (2003).
宮崎和光，木村元，小林重信：合理的政策形成アルゴリズムの連続値入力への拡張，人工知能学会論文誌, Vol.22, No.3, pp.332-341 (2007).

ひとつ前のページに戻る