予想ファクター作成、回収率分析の評価手法

予想ファクター作成、回収率分析の評価手法

予想ファクターの回収率分析に使用するデータ

回収率分析による「予想ファクター」や「予想ファクターの組み合わせ」の評価方法について、私の評価方法をまとめました。

投資競馬の回収率分析の際に使用するデータ」に書きましたが、分析に使用するデータは、複勝オッズ16倍未満の馬を推奨します。
(CrossFactor使用時は補正回収率分析が可能なので全馬のデータも使用可能ですが、大穴馬は期待値の面からも馬券対象から除外すべきなので、複勝オッズ16倍未満の馬に絞ることを推奨します。)

上記のデータを使用することで、シンプルに80%を基準として加減点評価ができます。

では今回は私が予想ファクターどのように評価しているかを書きたいと思います。

回収率の評価方法

まず仮説を立て、データで検証する

「なんとなくデータ分析を行い、回収率が高い条件を抽出する」という方法は失敗します。

理由は簡単で、そういった方法で導かれた条件には「再現性」が低いからです。

私達は過去データを分析し、そこから未来の確率を予測して馬券を購入しています。

つまり「再現性」が高いデータが必要なのです。

ここを意識して予想ファクターを作成しましょう。

どうしてもデータから先に見る場合は、回収率が高くなる理由、低くなる理由を説明できるデータである場合のみ、予想ファクターとして採用するようにしましょう。

回収率80%を基準として「1%=1点」で加減点評価する

1%で1点というのはシンプルにわかりやすさを重視したものです。

上記の評価方法だと、下記のとおりとなります。

  • 回収率(補正回収率)80%の予想ファクターで加減点なし
  • 回収率(補正回収率)83%の予想ファクターで3点加点
  • 回収率(補正回収率)72%の予想ファクターで8点減点

1ファクターにつき上・下限値を決める

回収率分析をしていると、回収率140%とかなり高いデータや、逆に回収率40%とかなり低いデータなどもたくさん出てきます。

そのデータがかなり独自性が高く、かつ信憑性も高い場合はそのままその数値を得点化して大丈夫です。

ただそうでない場合は、特定のファクターが効きすぎないように上限値・下限値を決めておき、それを採用することをおすすめします。

その数値をそのまま加減点評価してしまうと、そのファクターの影響度が強くなりすぎて、その他の細かい得点ファクターの効果を打ち消してしまうからです。

ですので私は、1ファクターあたりの加減点の上限値を95%(+15点)、下限値を65%(-15点)と設定しています。

似たようなファクターや、相関関係のあるファクター

似たようなファクターや、相関関係のあるファクターは、どちらか片方のみを採用するか、複数ファクターの加減点を小さくすることで調整しています。

例えば、複勝回収率85%のスピード指数が3種類あったとして、それらはほとんど同じような算出方法であれば、それぞれ+5点ずつ加点してしまうのは、明らかに過剰得点になります。

ですので同じような計算方法で算出される「スピード指数」は、トラック・距離区分ごとに最も相性の良いものを1つだけ選ぶようにしています。

「テン指数(前半3Fタイムを指数化したもの)とペース指数(残り3F地点までのタイムを指数化したもの)」は、レース距離によって非常に似たデータになります。

また、「馬王Zの予想脚質とJRDBの予想脚質」も似たようなデータになります。

こういった似通ったファクターを評価する場合は、どちらか片方のみ採用するか、両方のデータの評価点を半分ずつにするなどの調整を行い、加減点評価を行います。

データ件数が少ないファクターは採用しない

データ件数が少ない場合、信頼性・再現性に乏しいデータと判断し、採用しません。

私の場合の目安は100件です。

ただし根拠とデータグラフの相関関係が明確だと感じられる場合は、件数が少ない場合でも採用したりもします。

このあたりは臨機応変です。

データ件数に応じて得点にも重み付けを行う

私はデータ件数100件の得点データと、300件の得点データは、同じ重みで評価していません。

私は下記のようにして得点データを重み付けしています。

件数 重み付け
0~99 0.0
100~149 0.1
150~199 0.2
200~249 0.3
250~299 0.4
300~349 0.5
350~399 0.6
400~449 0.7
450~499 0.8
500~549 0.9
550~ 1.0

ファクターごとに適した分析条件で分析する

例えば「騎手」で分析する場合、私は「トラック(芝・ダート)別、距離区分別」で分析を行います。

芝のマイル(1400~1699m)での騎手毎の回収率を調べたり、ダートの短距離(1000~1399m)での騎手毎の回収率を調べたりします。

「スピード指数」を分析する場合、私は「コース(競馬場・トラック・距離)別」に分析を行います。

コースによってスピード指数が活きるコース、活きないコースがあるためです。

上記のように、ファクター毎に最適な分析条件で分析を行うことが大切です。

  • 全データで分析するファクター
  • トラック(芝・ダート)別に分析するファクター
  • トラック・距離別に分析するファクター
  • コース(競馬場・トラック・距離)別に分析するファクター
  • トラック・馬齢別に分析するファクター

などなど、ファクターによって条件を分けて分析しています。

コース別にすると件数が一気に減ってしまいますが、コース別に分析すべきファクターはコース別に分析し件数が少ないものは重み付けで対応したり加減点しない、という方法で分析しています。

まとめ

以上が私が行っている基本的な予想ファクターの評価方法です。

まとめると、

  • まず仮説を立て、データで検証する
  • 80%を基準として、回収率1%につき1点
  • 1ファクターにつき上・下限値を決める
  • 相関関係のあるファクターは、加減点に調整が必要
  • データ件数が少ないファクターは採用しない
  • データ件数に応じて得点にも重み付けを行う
  • ファクターごとに適した分析条件で分析する

私は上記のようなルールで回収率分析、予想ファクター作成を行っています。

参考にしていただければ幸いです。

それでは、素敵な競馬ライフを!