そこじゃない
ねぇテイモン、そろそろ統計について勉強しようと思うんだけど
いいね!ボートレースの分析には統計の知識が役に立つからね
いや、私はただクマホンキャンペーンでどの商品に応募したらいいか調べたかっただけだよ
アナタの本業は懸賞を当てることではないんだけど…
統計学を学ぼう
統計クエストシリーズは、統計学を学んでボートレースの分析に役立てようという企画です。
先の『コラボでGO!』シリーズでは、競争成績や番組表、レーサー期別成績やオッズデータを取得してきました。これらのデータをもとに、統計学の力を借りてボートレースの傾向を分析しましょう。
統計クエストⅠ(ワン)では、確率と期待値、平均・分散・標準偏差、視覚化(グラフ作成)などを取り扱う予定です。
それでは、テイモンとキョーコと一緒に長い冒険の旅に出発しましょう!
確率の基本
世の中に確実だと言えるものはあるでしょうか?
あなたの目の前に映る景色は現実には存在しないかもしれません、、、という哲学的な話題は置いておいて(笑)、ここでは確実性を数字で表すことについて考えてみましょう。
確実に起こるなら1、絶対に起こらないなら0としたとき、起こりやすさ(確からしさ)の程度を0~1の間で表現したものが確率(Probability)です。
ある事象Aが起こる確率$P\left( A\right)$は次の式で計算できます。
$$P\left( A\right) =\dfrac{k}{N}$$
Nは「すべての場合の数」、kは「事象Aが起こる場合の数」です。
子供の頃のテイモンは、数式があまり好きではありませんでした。理由は単純で、使われているアルファベットがどこから来たのか分からなかったからです。成長してから移動する点PはPoint、原点OはOriginだと分かって感激したものです。
まずはサイコロで1の目が出る確率を考えてみましょう。
サイコロには1~6の目があるので、すべての場合の数Nは6通りです。1の目が出る場合の数kは1通りですので、1の目が出る確率$P\left( A_{1}\right)$は
$$P\left( A_{1}\right) =\dfrac{1}{6}$$
となります。サイコロは細工がなければどの目が出る確率も同じです。ボートレースもサイコロと同じように考えることができるでしょうか?
ボートレースの当たる確率
さて、ここからが本題です。
ボートレースは6艇によるレースです。つまり1着に入る場合の数は6通りで、これはサイコロの面の数と同じですね。たまに「ボートレースは6分の1の確率で当たる」という言葉を耳にしますが、これは正しいのでしょうか?
結論から言うと誤りです。正しくは「ボートレースで1着が当たる確率は賭ける艇によって異なる」です。確率を求める式はサイコロと似ていますが、変数が異なります。
$$P\left( A\right) =\dfrac{k}{n}$$
nは「試行回数」、kは「事象が起きた回数」です。ボートレースの当たる確率は過去のデータを使い発生頻度で計算します。これを「統計的確率」と言います。
サイコロのように場合の数で計算するものは「数学的確率」と言います。ボートレースで数学的確率を使ってもよいのですが、ボートレースが6分の1の確率で当たらないことはこれを読んでいる皆さんは経験的にご存知ですね。
次の表は、2019年9月1日~2020年8月31日までの1年間(*)で1着に入った艇番をカウントし、それをもとに1着になる確率を%で表したものです。対象レースは54357で、不成立・中止・特払いのレースは除いています。
1号艇 | 2号艇 | 3号艇 | 4号艇 | 5号艇 | 6号艇 | 合計 | |
1着の回数 | 30034 | 7851 | 6478 | 5408 | 2887 | 1699 | 54357 |
1着になる確率(%表記) | 55.25% | 14.44% | 11.92% | 9.95% | 5.31% | 3.13% | 100.00% |
サイコロで各面が出る確率 | 16.67% | 16.67% | 16.67% | 16.67% | 16.67% | 16.67% | 100.00% |
(*)1年分を集計することで季節偏重を抑えることができますが、より精度を高めるにはデータのランダムサンプリングが必要です。これについてはまた別の機会に説明します。
上の表を見ると、実に半数以上のレースで1号艇が1着になってますね。2~6号艇はサイコロよりも確率が低いので、サイコロを振って決めるくらいなら1号艇に賭けた方がよいかもしれません。
余談ですが、賭け事は数学的確率と統計的確率を使い分ける必要があります。トランプやサイコロを使うものは数学的確率、競馬やボートレースは統計的確率を使うといった具合いです。じゃんけんは両方を使うべきかもしれません。じゃんけんそのものは数学的確率で、相手が出す手の傾向は統計的確率で計算します。
期待値の基本
期待値とは、投資に対するリターンのことです。投資額との差分ではなく、リターン全体を指します。
例えば、100万円を投資すれば1年後に150万円になって戻ってくる投資話があったとします。ちょっと怪しいですが(笑)、この場合は150万が期待値です。差益の50万ではないことに注意してください。
期待値は「起こりうる値の平均値」を計算することで求められます。具体的には、起こりうるすべての値$xi$とそれらが起こる確率$pi$を掛けてすべて足したものになります。
$$E\left(X\right)=\sum ^{n}_{i=1}x_{i}\times p_{i}$$
$E\left(X\right)$のEは期待値(Expectation)、Xは確率変数と言って起こりうる値全体を指します。Σ(シグマ)は全部足すという意味で、上の式はiを1からn回繰り返して$x_{i}\times p_{i}$の結果を全部足すことを意味します。
例えば、サイコロを投げて出た目の数×100円がもらえるゲームがあったとします。このゲームを1回やるときの期待値を計算してみましょう。
出目 | 1 | 2 | 3 | 4 | 5 | 6 |
もらえる金額 | 100 | 200 | 300 | 400 | 500 | 600 |
確率 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 | 1/6 |
$$E\left(X\right)=100\times\dfrac{1}{6}+200\times\dfrac{1}{6}+300\times\dfrac{1}{6}+400\times\dfrac{1}{6}+500\times\dfrac{1}{6}+600\times\dfrac{1}{6}=350$$
このゲームの期待値は350円ですが、さてここで問題です。このゲームは1回いくらだったらやるべきでしょうか?
これに正解はありません。なぜなら、どこまでリスクを取れるかは人によって異なるからです。仮にこのゲームが1回500円だったとしても、600円もらえる可能性があるならやる!という人がいるかもしれません。
期待値はあくまで投資を判断する指標であり、実際に投資するかどうかは自分自身で決めなければなりません。ギャンブルでもビジネスでも、人生でも同じことですね。
ボートレースの期待値
ボートレースにおける期待値とは「賭け金に対する払戻金の平均値」です。具体的には賭け金の75%と言われています。
この数字は、公営ギャンブルは売上金の75%が払戻金になるところから来ています。残りの25%は収益金として競技の運営や地方自治体の財政資金として利用されます。
この75%という割合はオッズで調整されているため(ほぼ)変化することはないでしょう。実際、舟券を購入した人をランダムに抽出して、その人たちの回収率を平均すると75%になると考えらえます。
ただ、平均すると75%になるだけで、100%を超えるケースもあるはずです。その100%を超える特徴を捉えようとするところに面白さがあり、それが我々がボートレースを分析する理由というわけです。
それでは確率を計算したときに利用したデータを用いて、1~6艇にそれぞれ単勝で100円を賭けた場合の期待値を考えてみましょう。
単勝の払戻金はレースによって異なりますので、ここでは平均値を取ります。例えば1号艇が1着になった場合の払戻金の平均値は164円でした。これに1号艇が1着になる確率を掛けることでおおよその期待値を得ることができます。
1号艇 | 2号艇 | 3号艇 | 4号艇 | 5号艇 | 6号艇 | 合計 | |
1着の回数 | 30034 | 7851 | 6478 | 5408 | 2887 | 1699 | 54357 |
1着になる確率 | 55.25% | 14.44% | 11.92% | 9.95% | 5.31% | 3.13% | 100.00% |
払戻金の合計 | 4,913,000 | 4,073,810 | 4,072,230 | 3,957,920 | 3,161,890 | 2,073,930 | 22,252,780 |
払戻金の平均 | 164 | 519 | 629 | 732 | 1,095 | 1,221 | 409 |
おおよその期待値 | 90 | 75 | 75 | 73 | 58 | 38 | 68(*) |
(*)全体の期待値を計算する場合は全艇に賭けることになるので、投資額が600円になることに注意してください。払戻金の平均を600円で割って確率100%を掛けて求めます。各艇の期待値を平均しても同じ値になります。
1号艇に賭けた場合の期待値が最も高く90円という結果になりました。投資額の75%よりは高いですが、この期待値をさらに上げることが重要です。何らかの基準で賭けるレースを限定していくことが有効かもしれません。
まとめ
この章では、ボートレースの確率と期待値をサイコロと比較して学びました。
過去1年分のデータから、ボートレースは1号艇が1着になる確率が55.25%であること、1号艇に単勝で100円を賭けた場合のおおよその期待値が90円であることが分かりました。
この結果は、2つのレースを選んで1号艇に単勝で賭けた場合どちらかのレースが当たり、200円の投資に対して180円が戻ってくる可能性があることを示しています。20円のマイナスはレースを楽しんだ分だと割り切れば、ボートレースはコスパのよい賭け事と言えるかもしれませんね。
次の章では、ボートレーサーの特徴を平均などを使って分析したいと思います。
統計学の入門書はこちら~