2.3 数理解析手法 目次(第2章)へ
2.3.1 ゲームの理論
ゲームの理論(game theory)は,1944年以降開発された作戦計画研究の成果の一つで,ゼロサムゲーム(zero-sum game:ある者が勝てば,相手は負けるような分配の争い)に勝つための最適決定を支援する方法の一つである.
大豆の播種の前に砕土作業を行うか行わないかという意思決定について考えてみよう.
A農家の地域では,砕土作業の時期に雨が降ると砕土をせずにすぐに播種作業を行うほうがよく,雨が降らないときのみ砕土作業を行ってから播種作業を行うほうがよいといわれている.したがって,
1) 気象情報が十分の場合: いま雨が降っていれば,A農家は間違いなく砕土作業をしない.
2) 気象情報が不十分な場合: あとで雨が降り出すという天気予報に対し,砕土作業をするかどうかは各農家の感じ方によってその判断は異なるであろう.
A農家が砕土作業を行うことに対する満足度の尺度を表2.1のように,晴天(雨が降らないこと)で砕土作業をする満足度は12であるのに対し,晴天で作業をしないのは不満足であって満足度は−10である.
表2.1 A農家の砕土作業の満足度
天 候 | 晴天 | 雨天 |
その確率 | 1−p | p |
砕土作業をする | 12 | −5 |
砕土作業をしない | −10 | 8 |
一方,雨天のとき砕土作業をするのは土がこねられ播種しにくくその満足度は−5であるのに対し,雨天で作業をしないのは満足度8である.また,雨天であるという天気予報の的中率をpとすると,雨天である確率はp,晴天の確率は1−pと考えてよい.
図2.1 A農家の満足度
●ソフトウェア MMAX_W.exe
A農家が砕土作業を行うという意思決定をX 1 ,砕土作業を行わないという意思決定をX 2 ,で表すと,それぞれの意思決定に対する満足度の期待値は,
X1:12(1−p)+(−5)p = 12−17p eq. 2.3
X2:−10(1−p)+8p=18p−10 eq. 2.4
したがって,A農家は,X 1 ,X 2 の期待値が大きいほうmax(12−17p,18p−10)の意思決定を行うであろう.すなわち意思決定がX 1 であるための条件は,
12 - 17p > 18p - 10 eq. 2.5
∴ p < 22/35 ≒= 0.63
A農家は図2.1のように雨天の確率が0.63以下のとき砕土を行い,0.63以上のとき砕土作業なしで播種作業を行うであろう.
3) 気象情報がまったくない場合: 通常,最悪の場合の不満足度(損失)を最小にしようとする.すなわち,A農家が砕土作業を行うと最悪な場合(雨天のとき)−5の満足度であり,砕土作業を行わないときは最悪の場合(晴天のとき)−10の満足度であり,A農家はこの二つの場合の満足度の大きいほうである砕土作業を行うという意思決定をするであろう.
表 2.2 満 足 度
天 候 | 晴天 | 雨天 |
意思決定 | (1) | (2) |
X1 | a11 | a12 |
X2 | a21 | a22 |
これを式で表わすと,
max{min(12,−5), min(−10, 8)}
= max{−5,−10}=−5 eq. 2.6
一般に満足度を表2.2のように表すと,
max{min aij} eq. 2.7
i j
また,これを不満足度で表すと,
min{max (-aij)} eq. 2.8
i j
これを先の問題に適用すると,
min{max(-12, 5), max(10, -8)} eq. 2.9
= min{5, 10}= 5
このように,いくつかの選択が考えられる場合,それぞれを選択したときの損失(不満足度)の最大値を求めて比較し,その最小のものを選択するという意思決定を行う.これをミニマックスの原理(minimax principle)という.