1.競馬の期待値と過去レース結果の分析方法
競馬におけるオッズと期待値
競馬で長期的にプラス収支を実現するためには、期待値が高い馬を見つけることが最も重要です。
そのためには、過去のデータを分析し、過小評価されている馬を見つける必要があります。
このページでは、データを分析のポイントをや、期待値の高い馬を見つけ出すための方法を解説します。
当てるために1番人気を買っているうちは勝てない
馬券を買う多くの人は、「収支をプラスにしたい」と思いながらも、気づけば「馬券を的中させたい」と考えてしまいます。
しかし、競馬のオッズは賭けられた金額に応じて変動します。必ずしも実力通りのオッズとはなるわけではありません。
この代表的な例が、1番人気馬の過剰人気です。
集計期間:2018年~2022年
対象レース:全レース
こちらは人気順位別に見た単勝回収率のグラフです。
単勝馬券は控除率が20%のため、平均の回収率は80%となります。しかし、実際には1番人気の回収率は低く、5~6番人気の回収率が高くなっています。
それだけ、「当てたい」と思って1番人気の馬券を購入する人が多く、過剰人気になっているということです。
期待値を上げるためには過小評価の馬を探す
当然ながら、馬券が当たらなければ収支がプラスになることはありません。
しかし、競馬はさまざまな偶然性が影響するため、必ずしも能力通りに決着するわけではありません。
それは過去のレース結果についても同様です。
前走大敗した馬であっても、一概に能力が低いとは限りません。
出遅れ等のわかりやすい不利だけではなく、スローペースで後方に控えていた等のレース展開における不利などもあります。
その馬にとって有利な展開でレースを運ぶことができた場合は過剰評価になりやすく、逆に不利な展開でレースを運ぶこととなってしまった場合は過小評価になりやすくなります。
オッズが2倍の馬であっても、過大評価されており実際の勝率は30%であれば、収支の期待値はマイナスです。
一方で、オッズが10倍の馬であっても、過小評価されており実際の勝率が15%あれば収支の期待値はプラスです。
この場合、馬券が当たりやすいのは勝率30%の馬ですが、長期的に見て収支がプラスになるのは勝率15%の馬となります。
「当てたい」と考えることをやめ、過小評価されており期待値が高い馬を探そうと考えることが回収率100%を超える第一歩です。
競馬の過去の統計データ入手法
競馬の分析には長期にわたる過去の統計データが不可欠です。具体的な統計データの入手方法は主に次の3パターンです。
- Webスクレイピングによる入手
- データ配信サービスを利用
- JRA公式ソフトを利用
①や②については、そもそもプログラミング知識が必要であったり、自分でデータの整理や分析を行うための仕組み作りが必要となります。
そのため、これらの方法で入手する情報だけでデータ分析を行うことは推奨しません。
このサイトでは、③のJRA公式ソフトである「TARGET frontier JV(ターゲット)」を使用することを前提として説明をさせていただきます。
TARGETとは
競馬のデータ分析において、最も多くの方に使用されているソフトが、「TARGET frontier JV(ターゲット)」です。
このソフトは、JRAの子会社が提供しているサービスですので、JRA公式のデータ集計・分析ソフトです。
過去30年分以上のデータを、様々なファクターから分析が可能となっており、競馬AIを作成するためには必須のソフトといえます。
なお、こちらのソフトを使用するためには、「JRA-VANデータラボ」の会員となる必要があり、月額2,090円(2023年11月時点)の費用が掛かります。
毎月2千円の出費は、安いとは言えない金額です。しかし、このソフトを使用しない場合は、高度なプログラミングやデータ加工・分析の知識、そして何よりも非常に多くの時間が必要となります。
競馬AIを作成するためには、JRA公式ソフトであるTARGETの利用は必須といえます。
TARGETの基本的な操作方法
TARGETを用いることで、過去のデータについて様々な条件およびファクターで分析することが可能です。
例として、人気順位毎の成績を調べてみましょう。
集計項目:人気順
集計期間:2023年11月23日から2022年10月29日
こちらの画面から、例えば1番人気の馬の勝率は33.0%、単勝回収率(単回値)79%、複勝回収率(複回値)83%など、様々な情報を読み取ることが可能です。
人気順以外にもさまざまなファクターによる分析画面が標準で用意されています。
今走の情報だけではなく、前走の情報も多くあります。例えば「前走から騎手が乗り替わりの場合」や、「前走から距離延長の場合」などの期待値も簡単に調べることが可能です。
ファクターの組み合わせ分析
分析結果は単一のファクターのみではなく、複数のファクターを組み合わせて確認することも可能です。
例えば、芝のレースにおいて、「馬場状態」毎に「枠番」別のデータを確認してみましょう。
「芝・良」の項目上で右クリックを押下し、「該当データの一覧」を選択することで、芝良馬場のデータのみを抽出できます。
その後、集計項目「枠番」を選択することで、芝・良馬場時の枠番毎の成績が確認できます。
同様に、馬場状態が稍重時の枠番毎のデータを確認してみましょう。
画像は稍重の場合の集計結果です。
抽出した良馬場・稍重の2つのデータを比較しやすくするために、グラフにしてみましょう。
TARGETでの分析結果及び上記グラフから、次のことがわかります。
- 良馬場の際は、内側から中央の枠番の勝率及び回収率が高い
- 稍重の際は、外枠の勝率及び回収率が高い
このような傾向は「枠番」という一つのファクターを見ているだけでは気付けません。複数のファクターを組み合わせることで新たな傾向が見えてきます。
様々なファクターを掛け合わせ、どのような条件で優位性が発生するのか検証してみてください。
外部指数の活用
TARGETには標準で様々なファクターによる分析機能が備わっています。
しかしながら、TARGETを使用するユーザーの数も多いため、標準で確認できるファクターについては既に有利不利の情報が広く知られているものも多くあります。
そのため、TARGETに標準で搭載されているファクターを利用するだけでは、回収率が100%を超えるロジックを構築することは困難です。
回収率が100%を超えるためには、他の人が気づいていないファクターを用いて検証をする必要があります。
TARGETに標準で備わっていない情報を取り込んで分析する方法として、「外部指数」と呼ばれる独自の指数データを利用することが可能です。
例として、調教の最終追切ラスト1Fタイムを外部指数として取り込んだ結果をお見せします。
(外部指数は小数点以下を表記できないため、×10された値となっています)
この分析結果を見ると、外部指数の値が小さい、つまりは最終追切のラスト1Fタイムが速いほうが勝率も回収率も高い値となっています。特に、11.4秒以下(画像では114以下)のタイムでは回収率が大きく上昇しています。
TARGETでは、レース結果の分析画面で1週前追切や最終追切の数値毎の成績は確認することができません。
そのため、多くの方は最終追切のラスト1Fタイムが勝率や回収率にどの程度影響しているかを正確に把握しておらず、感覚的にしか理解できていません。
こうしたデータを外部指数として取り込み分析することで、他の馬券購入者に対して優位性を発揮することが可能になります。
今回、最終追切ラスト1Fタイムのデータについては、競馬道データ会員の配信データを使用しました。このように、TARGET以外のデータであってもTARGETを使用して分析することが可能です。
なお、このデータは、調教コースを問わずラスト1Fのタイムを抽出したものです。
実際には、栗東と美浦、ウッドと坂路等でパターンを分けて分析することで、より正確な評価を行うことが可能となります。
外部指数の機能を活用し、標準で用意されている集計項目以外の様々なデータを用いて分析を行ってみましょう。
外部指数の設定手順については、以下の記事で詳しく説明しています。
様々なファクターを分析することで収支はプラスに
長期的に見た競馬の収支をプラスにするためには、勝率ではなく期待値を意識して馬券購入を行う必要があります。
期待値が高い馬とは過小評価されている馬です。
JRA公式のデータ分析ソフトであるTARGETを活用し、各ファクターの値毎の回収率をしたり、さらには複数のファクターを掛け合わせた分析を行うことで、多くの馬券購入者が気づいていない条件や正確に評価ができていない情報を簡単に調べることが可能となります。
そうした各ファクターの評価を積み重ねることで、過小評価されている馬・過小評価されている馬が見えてきます。
膨大な過去データを正しく分析し、長期的に馬券収支をプラスにつなげていきましょう。