2017年3月31日金曜日

日程が操作されている可能性はどの程度か?という話

「99.999%」JリーグがFC東京のために日程を操作したことが判明鹿島アントラーズデータブログ)というブログ記事がFC東京サポーター界隈でちょっと話題になっている。
今は昔の1999年、J2参入初年度にナビスコカップ(現在のルヴァンカップ)準決勝で鹿島と対戦し国立で引き分けた時、「あの鹿島に引き分けられるとは!」と感動した身としては、この記事を見て隔世の感を覚え、東京も鹿島から妬まれるほどの立場になったのだなあと感慨にふける次第である。

が、本ブログはTech Memorandumであって科学技術の話をすべきであろう(そうだったか?)。

元記事の論旨

当該記事においては、AFCチャンピオンズリーグ(ACL)に出場するJリーグ4チームが特に他国強豪クラブと対戦する直前または直後の週末に、東京との対戦が組まれているという点に疑問を呈している。詳しく書くと、以下の日程で4チームすべてACLの直前または直後に東京との対戦がある、ということである。(当該記事で掲載された日程表に、ACLの対戦カードには引用者が[ACL]と付記し、またJリーグの部分には節を付記した)。
鹿島アントラーズ
2/21 蔚山現代[ACL]→2/25FC東京(第1節)
4/22磐田(第8節)→4/26蔚山現代[ACL] →4/30鳥栖(第9節)
浦和レッズ
3/10甲府(第3節)→3/15上海上港[ACL](→3/19G大阪(第4節))
4/7仙台(第6節)→4/11上海上港[ACL]→4/16FC東京(第7節)
川崎フロンターレ
3/10柏(第3節)→3/14広州恒大[ACL]→3/18FC東京(第4節)
4/8甲府(第6節)→4/12広州恒大[ACL]→4/16札幌(第7節)
ガンバ大阪
3/11FC東京(第3節)→3/15江蘇舜天[ACL](→3/19浦和(第4節))
4/7広島(第6節)→4/11江蘇舜天[ACL]→4/16C大阪(第7節)

さて、当該記事ではそのような日程が「たまたま」組まれる確率として
(3/14)×(3/14)×(4/14)×(3/14)=0.001%
という計算式を示している。式の導出過程は示されていないが、たとえば鹿島については強豪蔚山との対戦前後にリーグ戦が第1・8・9節の3日分あり、そこで対戦し得るACL不参加チーム14のうち東京が入る確率(=3/14)、ということを表しているのであろうと推察される。

元記事の計算における問題点

まず、左辺の計算結果は0.00281...となり、パーセント表記すると0.281%である。この辺はケアレスミスであろうが、タイトルからして違ってきてしまう(上記結果に基づけば操作された確率は99.999%ではなく99.72%である)。
第2に、浦和とG大阪の直接対決をなぜか組み合わせから除外しているが、この対戦は事前に決まっているわけではないので、ここに東京が入る可能性も考慮すべきだし、逆に他の節でも直接対決が起こる可能性を考慮すべきである(14チームでなく17チームで見る)。これであれば、例えば鹿島と東京の対戦が第1・8・9節のいずれかになる確率は3/17となり、それ自体は確率として正しいと言える。
しかし、たとえ個別の対戦について3/14でなく3/17という確率で求めたとしても、上記の計算式はそれを単純に乗じており、すなわち4チームとの対戦をすべて「独立」であるものとして扱っているのでまずい。実際には、たとえば3/11のJリーグ第3節にG大阪と対戦するのであれば、同じ第3節に浦和や川崎と対戦する可能性はなくなるので、そのようなパターンを除外する必要があるのだが、独立を仮定すると同日に対戦することを許してしまう。このように、単純な掛け算で求めた結果は正しいとは言えない。

正しい確率の求め方

ではどのように求めるべきか。ACLグループリーグはJリーグの前半戦(第1~17節)に行われるので、鹿島・浦和・川崎・G大阪のそれぞれに(重複しないよう)1~17から4つの数字を選んで割り振ることを考える。これで東京がACL出場4チームと「第何節に対戦するか」のリストができるが、これは高校で扱う順列に相当し、そのパターンは
17P4=17×16×15×14=57120通り
である。このようなパターンのうち、鹿島と1・8・9節のいずれかで対戦し、かつ浦和・川崎・G大阪の3チームすべてと3・4・8・9節のいずれかで対戦するパターンは
4P3=3×(4×3×2)=72通り
である。したがって、FC東京の対戦順序が全くランダムに決められる場合、「たまたま」元記事が指摘するような対戦日程になる確率は
72/57120=0.00126...(パーセント表記だと0.126%)
と考えるのが妥当ではないだろうか。

おまけ:0.126%って高いの?低いの?

さて、本稿では確率計算に関する誤りの指摘と、正しいと思われる数値の導出を行った。蛇足ではあるが、「じゃあ0.126%ってのはほとんどありえない確率なの?」という点についても書いておこう。サイコロを投げて1の目が4回続けて出る確率は0.00077...=0.077%で、これよりは大きい。コインを投げて10回連続表になる確率が0.00098...=0.098%で、これよりも大きい。つまり、「サイコロで1の目が4回も連続するなんてありえない!このサイコロは細工されている!」と考える人にとっては、大きいとは言え近い確率なのでまあ操作の可能性を疑う余地もあるのかなあ、と思うが、これはまた別項にて。

英語配列のノートPCで日本語配列設定にしちゃった時に、アンダースコアを入力するTips

US配列のLG gram SuperSlimを購入した。で、Windowsの初期セットアップを始めたところ、最初に選択できるキー配列はMicrosoft IME(まあ要するに日本語配列)だけ。で、その後に「追加のキー配列」を選択できるのだが、後でやればいいやと思ってスルーしてしま...