まえおき |
LoTT の歴史 (1) Jean-René Vernes |
LoTT の歴史 (2) Larry Cohen |
LoTT の歴史 (3) Matthew Ginsberg |
問題点 |
自分流の LoTT 分析 |
Ginsberg の研究を追試する |
2本立ての分析 |
細かい注意 |
スート 対 スート |
ノートランプ 対 スート |
LoTT は HCP に依らず成立する |
―― はい。これまで ちょっと気にかかっていたことが ありました。
そこで,ソフトウェアを一つ書いて 調べました。その結果 得られた内容を
ここに書こうと思います。
およそのことは既に (前篇に) 書いたのですが,
ここできちんと報告しましょう。
―― その前に, LoTT の歴史をざっと復習しておきましょう。
―― 今の形式のコントラクトブリッジが成立したのは,ものの本によると, 1925 年です。そして 1940 年代には,ポイント・カウント法の導入により, ブリッジは急速に普及しました。
LoTT が提唱されたのが 1966年。
今から 約 50年前のことです。今となっては,どちらも昔のことと言えるでしょう。
Larry Cohen が強調しているように,ポイント・カウントと LoTT は,どちらも 今のブリッジに
欠かせない要素です。
LoTT の歴史を辿ると,3 人の名前が挙がります。
Jean-René Vernes, | Larry Cohen, | Matthew Ginsberg. |
(1966) | (1992) | (1996) |
―― はい。 縦の棒線が「エラー・バー」と呼ばれるもので, 平均誤差を表します。切り札の枚数が 20 以上だと誤差が大きくなりますが,これは,そういうディールのサンプルが少ない (頻度 Frequency が低い,稀にしか出現しない) ためです。
―― はい。 ここから先は,私の気にかかる点を挙げて,
私なりに それをどう解決したかを説明していきましょう。要するに,Ginsberg の統計的検証を精密化したいのです。
細かいことまで挙げると キリがないので,大きな点を 2 つ挙げます。
(1) 上のグラフは,確かによく合っています。でも,ここで 「切り札」として 何を採用しているかが問題です。 Ginsberg は 面倒なので,最長スートを 切り札としました。上の結果は,そうして得られたものです。つまり,LoTT 公式として
―― (2) ノートランプ (NT) に関して,次の 2 つの問題があります。
(2-1) NT の場合の LoTT 公式が未検証である。
(2-2) NT をビッドする可能性を排除して,全てのハンドがスートをビッドするとして取り扱った。
―― 有難いことに,Ginsberg は,自分の論文と同時に,717,102 個のディールと
そのダブルダミー分析結果とを ライブラリ・ファイル (18 MB) として 彼のサイトに
残しました。
これを使えば,誰でも,自分流の LoTT 分析ができます。
―― はい。その通りです。
何かの研究をする場合,これまでの他の人の結果を
再現できることが,まず第 1 に必要です。つまり,追試しなければいけません。
追試に当たっては,Ginsberg と同じ条件を設定します。すなわち,
(1) 双方とも,最長スートを切り札とする。
(2) ノートランプの可能性を,全く考えない。
たとえば,6NT できるハンドが スートでは 2 しか
できない場合,コントラクトを 2 として, の枚数を公式 [B] に当てはめる。
―― 確かに乱暴ですが,さっきのグラフは,この設定で得られたのです。
ともかく,この設定で,私のソフトウェア (LoTTanalyzer) を実行して,
Ginsberg の結果と比較しました (グラフによる比較では不十分なので,数値を比較します)。
左側は,Ginsberg の論文の値そのものです。
右側は,私の結果です。
(ここで,サンプルのサイズが Ginsberg の
446,741 と合わないのが,不思議 です。Ginsberg が論文で使ったライブラリは,別物だったのでしょうか)
LoTTanalyzer による Ginsberg の結果の再現 | |||||||
Ginsberg (total.ps.gz) | LoTTanalyzer ( Ginsberg + Length Option) | ||||||
長さ | ハンド 個数 | ずれの 平均値 | 平均 誤差 | 長さ | ハンド 個数 | ずれの 平均値 | 平均 誤差 |
14 | 46,944 | −0.15 | 0.63 | 14 | 75,608 | −0.15 | 0.63 |
15 | 47,281 | −0.14 | 0.64 | 15 | 75,592 | −0.14 | 0.64 |
16 | 120,525 | 0.10 | 0.70 | 16 | 193,690 | 0.10 | 0.70 |
17 | 102,184 | 0.02 | 0.75 | 17 | 163,632 | 0.02 | 0.75 |
18 | 69,792 | −0.01 | 0.83 | 18 | 111,997 | −0.01 | 0.83 |
19 | 37,561 | −0.22 | 0.87 | 19 | 60,416 | −0.21 | 0.86 |
20 | 15,845 | −0.50 | 0.99 | 20 | 25,545 | −0.50 | 1.00 |
21 | 5,041 | −0.89 | 1.20 | 21 | 8,123 | −0.89 | 1.20 |
22 | 1,286 | −1.31 | 1.48 | 22 | 2,035 | −1.28 | 1.46 |
23 | 237 | −1.78 | 1.83 | 23 | 396 | −1.83 | 1.87 |
24 | 45 | −2.22 | 2.27 | 24 | 68 | −2.22 | 2.25 |
合計 | 446,741 | −0.05 | 0.75 | 合計 | 717,102 | −0.05 | 0.75 |
―― はい。驚くほど良く一致します。
なお,ここでは Ginsberg の追試をするため,HCP に制限を設けず,全てのディールを分析の対象としました。しかし,HCP の差が大きければ, 現実には,競り合いは発生しません。
そこで,以下の分析では,両者の HCP を 15〜25 HCP の範囲に限定します。このため,分析の対象となるディールが減少します。
―― さっきのような乱暴はやめて,NT の方が有利なら,そちらを選んでやりましょう。
つまり,ハンドを [Suit vs Suit] と [NT vs Suit] のどちらかに分類します。
ただし,NT で 5 トリックしか取れないような バランス・ハンドまで [NT vs Suit] に
分類するのは,どう考えても不自然です。そこで,2 つの条件をつけて分類します.
[1] NT コントラクトで 7 トリック以上取れる。
[2] NT でのスコア スートでのスコア
―― それが,自然なビッド経過に合致します。
スートの長さではなしに,コントラクトの スコアを
基準にしてプログラムを作ると,上のような分類が可能になります。
こうして,717,102 個のハンドが 501,591 + 215,511 個に分別されます。
このように スコアを判断基準にすると,前に触れた例( 4 と 4 の
どちらも可能で の方が長い場合) では,4 が自然に選択されます。
―― プログラムを作りながら考えていくと,簡単そうに見えていた作業が複雑になっていきます。 でも,基本は,スコアを基準にして,なるべく自然なビッド経過に合わせたいのです。
―― はい。では,二本立ての片方から …。
―― はい。 上に説明したように いろいろと工夫したのが,下表の右側の数字です。
左側は,さっきと同じ Ginsberg の数字です。ここでは,切り札枚数により分けずに,
全体について数字を挙げました。
ここで ずれ (deviation) と書いているのは,
ずれ = 合計トリック数 − 切り札の合計枚数
です。 Ginsberg の場合には,もちろん
ずれ = 合計トリック数 − 最長スートの合計枚数
です。これをすべてのディールについて平均したものが,Average deviation (ずれの平均値) です。
Ginsberg と LottAnalyzer の結果を比較 | ||
Ginsberg (total.ps.gz) | LoTTanalyzer (Standard) | |
+1 トリックのずれ | 22.4% | 31.5% |
0 トリックのずれ | 40.0% | 38.8% |
−1 トリックのずれ | 24.5% | 14.9% |
ずれの平均(tricks) | −0.05 | +0.37 |
平均誤差(tricks) | 0.75 | 0.79 |
標本サイズ | 446,741 | 389,908 |
―― LoTT が期待するよりも,実際に取れるトリックが多いということですから, LoTT の評価が過少だという意味です。
―― 統計データを見るときには,データの ばらつき具合に注目することが大切です。
統計から出るのは あくまでも何かの平均です。平均として何かの結論が出たとしても,データの ばらつきが大きければ,それを平均しても,
あまり意味がありません (統計学の言葉を使えば,有意でない)。それに対して,ばらつきが小さければ,(たとえば,何かの
直線,曲線の上にデータ点が良く載っていれば),そこから得られる結論は有意です (大いに意味がある)。
―― もうちょっとだけ続けると …
このばらつきを表すのが,ここでは,
平均誤差です。
その定義は 簡単です。「ずれ」の絶対値を すべてのディールについて平均したものが,平均誤差です。
絶対値を平均するので,+ にずれても − にずれても,平均誤差は大きくなります。
―― 2 つの異なる結論を比較する際には,そのばらつきを比較します。
ばらつきの小さい方が信頼性が高い。大きい方が信頼性が低い。この判断基準は,
後にも出てきます。
今の場合は,左の 0.75 の方が 右の 0.79 より小さいので,左の方が少しだけ信頼性が高いと言えます。
でも,0.75 と 0.79 はほとんど同じ数値ですから,両者の信頼性はほぼ同等と考えてよいでしょう。
―― そういうわけで,この比較に関する限り,私の努力は,あまり報われませんでした。
―― 上にも書いたように,左では NT を完全に無視して,どのハンドもスートで
ビッドすると仮定している; 切り札の選定にも不自然さがある ―― こういう欠点を
克服すれば,何かばらつきの小さい (もっと信頼性の高い) 結論が得られるのではないか … というのが,
この作業に手を染めたきっかけです。
あっ,ちょっと脱線気味ですね。
―― では,両方のグラフを並べて見ましょう。
グラフの縦軸と横軸の意味は,さっき説明しました。ただし,この図に書き込まれているように, 左では,横軸に Total Length (最長スートの合計枚数) を取り,右では,横軸に Total Trumps (切り札の合計枚数) を取っている ―― これが,大きな違いです。
―― はい。その通りです。
左側については,さっき説明しましたが,繰り返すと,× マークが傾き 45° の直線上に非常によく載っていることから分かるように,
LoTT 公式として [B] を使えば (使えれば) ,《平均的に見て》 調整の必要は全くありません。
―― さきほど説明したように,統計分析の結果というのは,平均だけを主張します。 つまり,「平均として調整を要しない」という表現の意味は,プラスに調整することもあれば, マイナスに調整することもありうる ―― でも,それを何回もすると,平均はゼロである … という 意味です。
―― でも,統計というのは,本来そういうものなのです。人口の統計でも, 経済の統計でも …。
―― これは統計的な分析ですから,いちいちのハンド・ビッド状況については, 何も言うことができません。上の表から分かることは, 公式 [B] を出発点とすれば,全く補正しないハンドが 40.0%, +1 の補正を必要とするハンドが 22.4%, −1 トリックの補正を必要とするハンドが 24.5% の確率で,それぞれ現れます。
―― はい。右の場合には,普通の LoTT 公式 [A] を出発点として
判断する。
そのとき,+1 トリックの補正を必要とするハンドが,−1 トリックの補正を
必要とするハンドの 約 2 倍出現する。そこで,《平均的に見て》 +0.37 の補正が
必要になる。+2 以上とか −2 以下の場合は,この表では省略されています。
―― 答は (ちょっと物理屋さんの用語をお借りして) 《相補的》complimentary
です。つまり,互いに補いあって,どちらも意味を持ちます。
Cohen は,その 2 冊の著書の中で,adjustments の必要性を強調しています (これは,
LoTT の創始者である Vernes も同じです)。 ハンド例を挙げて,いろいろの
正負大小の調整理由を述べています。ハンド毎にひとつひとつ調整の必要性を判断します。
その話が細かくなると,ちょっとついて行けないような印象も受けます。
一方,Ginsberg や私の分析では,調整理由は不明ですが,
統計的に見て, どういう頻度でどういう調整をするのがよいかを教えてくれます。
たとえば,右側の場合 (すなわち,本来の LoTT 公式 [A] を額面通りに使う場合),+1 の調整を要するハンドは,−1 の調整を必要とするハンドの 2 倍現れる。
39% のハンドでは,調整を要しない。これらは《統計的に確実な》ことです。このような数字は,Cohen の分析からは得られません。
以上が,Suit-Suit の場合について得られた結果です。
次に,ノートランプの場合に話を進めましょう。
―― はい。 ここで 右辺に 3 個の数値が書かれているのは,スート側がサイド・スートに ボイド, シングルトン,ダブルトン をそれぞれ持つ場合に対応します。
―― はい。Vernes は,はっきりと そう書いています。
ダミーに ボイド,シングルトン があれば,ラフ により トリック数が増える。
ディクレアラーに ボイド,シングルトン があっても,トリック数は
増えない … それにも拘らず,上の LoTT 公式には この両方を含めてカウントします。
―― 分かったのですが,どちらも,あまり良くない結果です。
そこで,Vernes の公式 [D] にちょっと手を加えて,
―― さっきも説明したように,平均誤差を見る必要があるので,グラフではなしに, 数値の比較をしましょう。
Results of LoTTanalyzer for Notrump Contracts | |||
Law Formula | Cohen [C] | Vernes [D] | Modified Vernes [E] |
+2 trick deviation | 13.5% | 21.5% | 5.0% |
+1 trick deviation | 32.5% | 40.8% | 21.5% |
0 trick deviation | 37.3% | 25.4% | 40.8% |
−1 trick deviation | 11.4% | 5.9% | 25.4% |
Average Deviation | 0.62 tricks | 0.95 tricks | 0.05 tricks |
Average Error | 0.87 tricks | 1.09 tricks | 0.73 tricks |
Sample Size | 145,140 | 145,140 | 145,140 |
―― はい。そういう結論が出て,ほっとしたところです。
右のグラフは,[E] の場合です。
このグラフから,公式 [E] を使えば 《平均として》補正を必要としないことが,分かります。
念のために書き加えておくと,[E] を使って補正を必要としないハンドは, 確率 40.8% で
発生します。[E] から +1 トリックの補正を必要とするハンドは,確率 21.5% で発生し,
−1 トリックの補正を要するハンドは,それとほぼ等しい確率 25.4% で発生する … と
いうのが,ここでの結論です。
サンプルのサイズが非常に大きいので (145,140個) これらの確率の数値は
非常に正確だと考えてよいでしょう。
―― いいえ。私の結論は,そうではありません。
―― はい,それは その通りです。
でも ブリッジのビッドを実践する立場から考えると,それではあまりにも単純すぎる (機械的すぎる)。
私のお勧めは,Cohen 公式 [C] です。これは簡単な形をしています。
それに 7 という数字は
何となく覚えやすい。ノートランプの場合には,これを原点にして考える。
そして,状況に応じて,補正を加える。そのとき,[E] のようなことも
頭の中にチラッっと思い浮かべる (ときには,自信を持って +2 トリックの補正を加える) … それくらいが ちょうどいい。
ブリッジのビッドというのは,何かのシステムや公式に頼って機械的にするものでは
ありません (LoTT が普及し始めた頃は,この認識に欠けることがあったように思います)。
Cohen がその著書で強調しているように,LoTT は一つの道具であって,これをうまく
使えるかどうかは,各人の判断 (judgement) にかかっています。主題が LoTT だからと言っても,
判断がキーポイントであることに変わりはありません。
―― 同じように考えます。
基本は LoTT 公式 [A] です。
これは,単純で記憶しやすい。
スートの場合には,これを原点にして考える。
そして,状況に応じて,補正を加えます。そのとき,[B] のようなことも
頭の中にチラッっと思い浮かべる … それくらいが ちょうどいい。
―― なってしまうかどうかは,これを読んだ人がどう考えるかに依るでしょうね。
Result of LoTTanalyzer (for suit contracts)
under the Four Requirements for HCP | ||||
HCP range | 0 − 40 | 15 − 25 | 17 − 23 | 0-14, 26-40 |
+2 trick deviation | 9.7% | 9.5% | 9.3% | 10.2% |
+1 trick deviation | 31.5% | 31.5% | 31.5% | 31.0% |
0 trick deviation | 38.4% | 38.8% | 39.2% | 37.0% |
−1 trick deviation | 15.2% | 14.9% | 14.9% | 16.0% |
Average Deviation | 0.36 tricks | 0.37 tricks | 0.36 tricks | 0.34 tricks |
Average Error | 0.79 tricks | 0.79 tricks | 0.78 tricks | 0.82 tricks |
Sample Size | 506,581 | 389,908 | 280,383 | 116,673 |