技術とか戦略とか

IT技術者が技術や戦略について書くブログです。

利得を代表する評価値の選定方法

ゲーム理論で分析する際、利得をどのように数値化するかが問題となります。
「勝率」や「金額」といった、数値化された絶対的な基準で利得を求めるのが理想ですが、ごく簡単な状況でない限りこのような形で正確に利得を求めることはできず、多くの場合は主観で「だいたいこれぐらいの勝率」「だいたいこれぐらいの金額」といった形で決めることになります。
しかし、これでは心理的なバイアスの影響を受ける可能性がありますし、人間の代わりにプログラムで利得を求めることもできなくなります。
 
そこで、利得を代表する評価値を選定し、その評価値を利得として扱うという手段が有効になります。
評価値は、ゲームのルールを分析し、そのルールから各プレイヤーが取る行動を導き出し、その行動の良し悪しを代表する指標を見つけることで、選定することができます。
 
ポケモン対戦を例に挙げて、評価値の選定方法を具体的に見ていきます。
 
何も知らない人向けにポケモン対戦のルールをざっくり説明すると、以下の通りになります。

  • 2人のプレイヤーが勝敗を競うゲームである
  • お互いに同時に意思決定を行うゲーム(同時進行ゲーム)である
  • お互い3匹ずつのポケモンを所持し、一度に1匹のポケモンを場に出せる
  • 各々のポケモンには相性関係があり、基本的にはじゃんけんで言うグー・チョキ・パーに該当するポケモンをお互いに持つ
  • 1ターンの中で攻撃か交代を選択することができ、交代は攻撃よりも先に行われる
  • 攻撃すると相手のポケモンのHPを減らすことができ、HPが0になるとそのポケモンは使えなくなる
  • 全てのポケモンのHPが0になると負けとなる
  • 相性関係で有利なポケモン(例:グーに対するパー)の攻撃はHPを大きく削ることができ、相性関係で不利なポケモン(例:グーに対するチョキ)の攻撃はHPをあまり削ることができない

このルール下では、相性関係で有利なポケモンに攻撃されるのを防ぐのが肝要になります。
よって、以下のような行動が定石となります。

  • 相手のポケモンに対して相性関係で有利(もしくは互角)な場合は攻撃する(例:相手がグー、自分がパーの場合は攻撃する)
  • 相手のポケモンに対して相性関係で不利(もしくは互角)な場合は、相性関係で有利なポケモンに交代する(例:相手がグー、自分がチョキの場合は、パーに交代する)
     

しかし、相性関係で有利なポケモンで相手のポケモンの攻撃を受けるとしても、何回か交代で出している内にHPはじわじわと削れていき、最終的にはHPが0になり倒れてしまいます。
先にHPが0のポケモンを出してしまうとその後の展開は非常に不利になり、大抵の場合は敗北します。
つまり、「交代で出せる回数」を相手よりも多く確保することが重要となります。
この「交代で出せる回数」は交代を繰り返すポケモンの対戦で有利・不利を決定づける重要な指標となり、また勝率よりもかなり容易に算出できることから、評価値として適している指標となります。
 
なお、参考文献は以下となります。ポケモン対戦の専門的な文献です。
今回の記事はポケモン対戦を知らなくてもイメージできるように書いていますが、ポケモン対戦を経験した方ならこちらの文章の方が正確に理解できます。

 

・徒然なる雑記 - 役割解析
 http://vento.blog3.fc2.com/blog-entry-127.html