余談

　実は当初、このレポートの副題は「確率論的推論 vs 時系列的推論」であった。以下はその時設定した、時系列的推論プレイヤーの概要である。

時系列的推論モデル

　注目する要素として二つの次元を考え、各々の次元に二つのバリエーションを設定した。

　以下、各戦略の（あくまで大まかな）説明。

　それ以前のある一定回数のゲームにおける、自分の最終的カード合計を評価する。
　具体的には、

　それ以前のある一定回数のゲームにおける、自分とディーラーのカード合計の差を評価する。
　具体的には、

　それ以前のある一定回数のゲームにおける、自分の各種イベント発生頻度を評価する。
　具体的には、

ゲーム終了状況	状況評価
バストした	不調
ブラックジャックだった	（大）好調

　それ以前のある一定回数のゲームにおける、ディーラーの各種イベント発生頻度を評価する。
　具体的には、

ゲーム終了状況	状況評価 (*)
ブラックジャックだった	（大）不調
バストした	好調

(*) ここでの好／不調は、プレイヤー自身にとっての評価である。

　定式化は困難（あるいは不可能）である。設定者の主観により定める。

　p型、q型の二つを設定した。

　こうして情報収集で４種類、プレイヤーの行動で２種類のタイプが設定され、合計８種類（＝４×２）の戦略が定義できた。しかしＡα、Ａβ、Ｂαの各タイプは自分自身も常時プレイに参加している必要があるので、ゲームを離脱する可能性のあるｑ型にはなれない。従ってその３つを除いた、５つの戦略が定義される。

　これらの戦略の定式化にあたり、すぐに以下の諸問題点に突き当たった。

情報選択法

どの情報を好調／不調の指標とするのか。カード合計や、ブラックジャックとバストの頻度とするのは、筆者の主観に過ぎない。（ただし一般のプレイヤーがやるのは、このどちらかが殆どだろうが。）
何ゲーム前までの情報を利用するのか。あまり以前まで遡ると「流れ」自体が均質化してしまうし、プレイヤーの負担も増える。適当な基準はあるのか。

情報利用法

仮に流れに貢献している要素が特定できたとしても、その貢献の法則性までは未知のままである。情報をどのように加工して、プレイヤーの意志決定という形に乗せるのか。（具体的には、どのように数式を立てるのか）

　また実際にプログラムを試作し動かしてみたところ、さらに以下の問題点に気付いた。

推論の再帰性: 例えばＡαｐ型プレイヤーの場合、以前の自分の戦績を参照した上で今回の戦略を立てるわけだが、参照したその戦績自体、やはりさらに以前の自分の戦績を反映したものである。つまり自身の判断材料の中に、既に自身の判断結果が含まれてしまっている。

　以上の問題点は、今回の限られた時間内では解決できなかった。しかし生身のプレイヤーが、これらを意識的／無意識的にクリアしているのも現実である。