オークス、日本ダービー、ジャパンカップと主要G1が開催される東京芝2400mコース。内枠は本当に有利なのか統計的な手法で確かめる

先週のNHKマイルを皮切りに東京競馬場5週連続G1開催がついにスタートしました。

一年が巡るのは早いもので、オークスまで残り2週、そして日本ダービーまで残り3週間を切りました。

個人的に今年のダービーはどの馬が来るのかいまだに絞り切れなくて困っている状態ですが、みなさんはいかがでしょうか?

さて、オークスと日本ダービーが開催される東京芝2400mコース、内枠に入った馬は有利というのはわりと有名な話です。

はたして本当にそうなのか、まずは2010年以降に開催された東京芝2400mレースの枠順ごとの勝率、複勝率を見てみましょう。

枠順ごとの勝率(1着)

頭数 1着 2着
以下
勝率
1 257 29 228 11.3%
2 272 33 239 12.1%
3 286 23 263 8.0%
4 297 19 278 6.4%
5 315 24 291 7.6%
6 331 16 315 4.8%
7 380 22 358 5.8%
8 397 20 377 5.0%

枠順ごとの複勝率(3着以内)

頭数 3着
以内
4着
以下
勝率
1 257 65 192 25.3%
2 272 76 196 27.9%
3 286 60 226 21.0%
4 297 57 240 19.2%
5 315 80 235 25.4%
6 331 66 265 19.9%
7 380 82 298 21.6%
8 397 70 327 17.6%

たしかに1枠と2枠が勝率、複勝率ともに他の枠に比べ高い傾向があります。

しかしこの勝率、複勝率の高さだけから本当に内枠は有利と言い切ってしまってよいのでしょうか?

統計的に見てもこれは信用してもよいデータなのでしょうか?

内枠の着順が良いという結果が偶然に偏っただけなのかどうかを統計的に確かめる方法として、カイ二乗検定という手法があります。

カイ二乗検定の計算は足し算、引き算などの四則演算だけで出来る上に、Rというプログラミング言語を使用すれば、たった1行の命令を書くだけで行うことができます。

「統計」、「カイ二乗検定」、「プログラミング」・・・慣れない人にとってはとても面倒くさそうな印象を受ける字面ばかりですが、やり方は簡単です。

この検証を実際に自分で試してみたい方は、パソコンで以下の手順を行うだけですぐに試すことができます。

別に興味ないという方はこちらをクリックして結論まで飛んでください。

1. こちらのページの「Download R (バージョン) for Windows」というリンクをクリックしてRをダウンロード(Macの場合、「R-(バージョン).pkg」というリンクをクリック)

Rのダウンロードページ

2. ダウンロードしてきたexeファイルを実行して、後はひたすら「次へ」を連打してインストール完了。

3. 「R i386 3.4.0」と「R x64 3.4.0」というアイコンがデスクトップに作成されるので、「R i386 3.4.0」をクリックしてRを起動。

Rのでストップアイコン

以上で準備は完了です。

それでは先ほどの枠ごとの勝率(1着)の表のデータを使用して、内枠有利の結果が偶然の産物なのかどうかを確かめてみましょう。

やることは以下の一行の命令をコピーしてから、R画面上で「編集」->「ペースト」してエンターキーを押すだけです。

chisq.test(matrix(c(29, 228, 33, 239, 23, 263, 19, 278, 24, 291, 16, 315, 22, 358, 20, 377), ncol=2, byrow=T))

Rのダウンロードページ

一応命令について説明すると、まずchisq.testは カイ二乗検定を実行するという意味です。

続いてmatrix(c(数字の羅列 …))という記述がありますが、これは枠ごとの勝率(1着)の表のデータを「1枠の1着回数, 1枠の2着以下回数, 2枠の1着回数・・・8枠の2着以下回数」という形式で記述したものです。

ncol=2byrow=Tはmatrix内のデータが「1着回数」と「2着以下回数」の2列で出来ている表であることをRに教えていてます。

命令を実行すると以下のような文字列が表示されるかと思います。

X-squared = 23.196, df = 7, p-value = 0.001576

この中のp-valueの値に100を掛けた0.1576という数値が内枠の着順が良いのは偶然偏った結果である確率を示してます。

つまり内枠の着順が良かったという結果が偶然であった確率は約0.1576%ということになります。

逆に言えば約99.9%の確率で、内枠の着順が良いという結果には何かしらの必然性があるという意味になります。

さらに枠順ごとの複勝率(3着以内)のデータでもカイ二乗検定を行ってみましょう。

次のような結果になります。

命令

chisq.test(matrix(c(65, 192, 76, 196, 60, 226, 57, 240, 80, 235, 66, 265, 82, 298, 70, 327), ncol=2, byrow=T))

結果

X-squared = 16.175, df = 7, p-value = 0.02357

勝率のデータ同様に97%以上と高い確率で内枠有利という考え方は統計的に正しいという結果になりました。

では内枠は有利という結果が必然であるならば、その理由はいったい何なのでしょうか?

まず真っ先に思うのは、内枠のほうが好きな位置取りを選びやすいからでしょうか。

2010年以降の日本ダービーを見直してみましたが、内枠の先行馬が悠々と直進しているのに対して、大外枠の先行馬がラチに向かって慌てた勢いで斜めに走っていく姿を見るとやはり不利に感じます。

中段から攻める馬も内側が渋滞するせいで、第1コーナーから第2コーナーを外外と走らされて他の馬に比べて約20~30m以上余計に走らされるというのも不公平な話です。

しかしそれが理由だとしたら他の競馬場でも内枠はすべて有利という話になるはずです。

「今週のレースの枠順だけど内枠って位置取り的にやっぱ有利じゃん? で今大人気の×××が走るけど、勝てば競馬が盛り上がるし、競馬人気回復のためにも勝ってほしくない? 別に普通に走らせても勝ちそうだけど、そう念のためにね・・・じゃあ、そういうことで内枠にはキタサ」

他に考えられるとすれば枠順抽選の際、強くて人気のある馬を意図的に内枠に集めているからでしょうか。

もしそうであれば勝率が高くなるのは必然ですが、さすがにこれは無いはずでしょうから、結局のところ自分には答えがわからず終いでした。

とはいえ、いずれにせよ「東京芝2400mコースの内枠有利」は統計的に見ても使える予想ファクターであるということがお分かりいただけたかと思います。


余談

以上の検証は枠ごとの馬の質がトータルすると同じである前提でのものとなっています。

意図的にではないにせよ内枠に強い馬が偏っている可能性も考慮しなくていいものかと統計を仕事にしている人にこの件を確認しましたが、枠順決定がランダムであれば枠ごとの馬の質はある程度均一化されるはずだし、一定の割り切りは必要との答えをいただきました。

あと現役最強馬を不謹慎な例で使ってしまいファンの方すみませんでした。

とはいえ内枠多くない?

昨年のジャパンカップでの逃げ勝ちは、コース適正やコース固有の有利脚質を信じている自分にとって少し予想外の結果でした。

以降の有馬記念、大阪杯、天皇賞春の結果を見れば、自分の見る目がなかっただけと思い知った次第ですが。

現時点で走れない条件がもはや存在しないのではと思えるほどで、個人的には凱旋門賞に出走したとしても充分結果を期待できると思っています。

いずれにせよ、今後も注目していきたい一頭です。

おすすめ記事

ブックマークでいつでも見れるように

PR