ブラックジャックにおける情報処理戦略 p.5

ルール上の相違点

　本稿はシミュレーションの都合上、現実のカジノルールとはあえて異なったルールを採用している。従って今回のシミュレーション結果は、あくまでここでのルールに沿った上で、という条件はつけなくてはならない。ただしシミュレーション結果とその考察を、現実への適用性という点で本質から覆すような相違は少ないと思われる。以下でルールの相違点とその影響を考察する。

使用デック数: 本来は最低でも４～６デックが使用されるところを、カードカウンティングの効果を引き出す意図で、１に限った。デック数が増えるにつれ、まず第一にプレイヤーの記憶力への負担増、第二にシューにあるバリュー比率の安定化という問題がある。いずれもカードカウンティングの効果を減殺するものであり、現実のゲームでは今回以上にカードカウンティングの効果が現れにくい事が考えられる。
扱わなかったテクニック: 　本稿は、ブラックジャックのルール（が許すテクニック）を全てシミュレーションに盛り込んだわけではない。（「方法」の「使用ルール」を参照。）特にダブルダウンとスプリットは、中級以上のプレイヤーがポピュラーに使うテクニックであり、現実のゲームでも勝敗の鍵になることがある。ただしこれらは必ずしも発生頻度の高いイベントではない。
強制的な参加: 　本稿ではプレイヤーは毎ゲームごとに強制的に参加させられたが、これは現実のルールには無い。普通のプレイヤーは（自分を見失わない限り）少なくとも調子の悪いときはゲームを降り、しばらく観戦者になるだろう。そしてディーラーの調子が下向いたときを狙って（つまり相手の逆目を狙って）再度ゲームに加わる。この離脱／再戦のタイミングをいかに巧みに見極めるかが、本文冒頭で述べた時系列的推論の本質であり、ブラックジャックに限らず賭博全般で要求されるセンスである。
　しかしこれは、今回のようなコンピュータ・シミュレーションではかなり扱いにくい問題であった。まず場の状況の何をもって調子の善し悪しの指標とするのか（例えばブラックジャックやバストの回数、頻度）、さらにその情報をどのように処理するのか（何ゲーム前までの情報をどのように演算処理するのか？）という点で、プログラミングの為の数理的根拠のあるモデルは立て難い。プレイヤーの成績の時間経過を見る限り、直感的には確かに好調・不調の波がある事が分かる。しかしそれが何に起因するかの因果関係を定式化し、プレイヤーのふるまいとしてプログラム上に記述することは、かなりの試行錯誤が必要だと感じられた。

モデル上の問題点

　シューにある残りカードという情報をどのように処理・利用するかについて、本稿ではＡ、Ｂ、Ｃ型という三つの推論モデルを立て、Ｃ型がもっとも優れているという結果を得た。もちろん、これがありうる全ての推論モデルだとは限らない。しかし筆者としては、これら以上に効果的なモデルは少々考え難いと思っている。

　一方α、β、γという情報収集モデルについては、数理的な裏付けはともかく、生身の人間のパフォーマンスとして現実性を欠いている、という指摘はありうるだろう。
　第一に、シューの内容を逐一把握する、情報収集能力そのものについて。おそらく多くの人にとって、βタイプ以上のカードカウンティングを行なうことは、たとえカードが１デックしかなくても難しいだろう。今回設定したαタイププレイヤーの存在はあくまで机上の設定でしかない、という点はいえるかもしれない。
　第二に、（実際はこちらの方がクリティカルなのだが、）収集した情報の処理について。残りカードの内容という情報が詳細になるほど、それを処理する計算も複雑になる。従ってαタイプは言うに及ばず、現実にはβタイプの情報ですら、普通の人間には正確に扱いかねるのではないかと思われる。ただし若干の誤差を許容するなら、あくまで直感的な範囲でこの程度の推論を行なえるプレイヤーは、必ずしも少なくないと思う。またα、βタイププレイヤーの情報処理が効果を挙げなかった事を示した今回のシミュレーション結果は、上の問題点を（結果的にではあるが）退けることができる。単に始めからγタイプを採用すれば良かっただけの話なのだ。

　以上を勘案したならば、推論の有効性、情報収集とその計算処理コストという二点から、本シミュレーション中ではＣγタイプの戦略が、最も現実への適用度の高いモデルだったと結論できそうだ。

稼ぎそのものについて

　最後に、上に示された戦略と、ゲームの最終目的との関係を考察しておく。すなわち今回の各プレイヤーの戦略が、最終的なチップ獲得額へどの程度貢献したか検証しておきたい。このゲームの場合プレイヤーのチップのやりとりは、ブラックジャックによるか、ディーラーとのカード合計比較、という二種に限られる。後者にはプレイヤーの戦略の入る余地があるが、前者は純粋に確率的なイベントであり、どのプレイヤーにも同等のチャンスがある、すなわちプレイが長期的にわたるほど無視して良い要素といえる。今回のゲーム回数は、ブラックジャックの影響力を無視できるほどに十分だったろうか。表５を見る限り、高度な戦略をとるプレイヤーほどチップの獲得額が上昇する、という傾向があるようだが。

　各プレイヤー10000ゲームのデータをまとめ、[ブラックジャックの頻度]、[ブラックジャックでなかったときの勝率] を説明変数、[チップの総獲得額] を基準変数とする重回帰分析を行なったところ、以下のような結果を得た。

r(cb)= .815 : チップの総獲得額と、ブラックジャックの頻度b(0≦b≦1)との相関係数
r(cw)= .981 : チップの総獲得額と、ブラックジャックでなかったときの勝率w(0≦w≦1)との相関係数
C = (32272.3 * b) + (32358.7 * w) - 17094.3 : チップの総獲得額の予測値Ｃを求める重回帰式

　10000ゲームが終了した時点において、ブラックジャックの偶然的な頻度・プレイヤーの戦略の優劣のいずれも、チップの総獲得額と強い相関を見せている。しかし後者のほうが前者より、かろうじてより多くチップの獲得額に貢献していた。ただしゲーム数が少なくなるほど、両者の貢献度はより強く逆転してくることが予想される。またプレイヤーの能力が伯仲すれば、やはり勝敗はより偶然的な要素に頼ることであろう。

参考文献

POWER BOMB編　「カジノPLAY BOOK」　新星出版社
笠原一浩、山本美孝　「Visual Basic 4.0入門（基礎編、活用編）」　ソフトバンク

資料 : 自作シミュレータのソースコード（Visual Basic）

課題レポート類