【高精度な回収率分析】補正回収率分析と信頼度

高精度な回収率分析-補正回収率分析と信頼度

精度が高い回収率分析を実装しています

そもそも回収率って?

回収率とは、馬券収支の「勝ち・負け」を表す指標。
100%以上であればプラス、100%未満はマイナスを意味する。

回収率(%)= 払戻金額 ÷ 購入金額 × 100

例)125% = 100万円 ÷ 80万円 × 100

回収率分析における回収率

回収率分析における回収率は、下記のとおりです。

特定の条件において、買い続けた場合の収支を表す。

その条件で買い続けていた場合にプラス収支になるのか、マイナス収支になるのかがわかる。

んー、とても便利ですね。

回収率分析における問題点

穴馬の影響を受けすぎる

回収率分析は、「均等買い」すなわち「一定の金額(例えば100円)」で買い続けた場合の収支になります。

均等買いで買い続けた場合の回収率は、高配当馬券の有無によって回収率が大きく変わってしまいます。

例えば、下記のようなデータだとどうでしょうか?

対象データ数 : 100件
的中件数 : 1件
配当 : 15000円

単勝的中率 : 1%
単勝回収率 : 150%

回収率だけで判断してしまうと、こういった条件も良いと判断してしまいますが、この1件の的中がなければ回収率は0%です。
このように、通常の回収率分析だと人気薄の馬の成績の影響が大きすぎます。

対象データ数 : 100件
的中件数 : 2件
平均配当 : 6000円

複勝的中率 : 2.0%
複勝回収率 : 120%

複勝の場合も同様です。
この的中している複勝2件のうち、1件でもこなかったら回収率は60%になってしまいます。

古いデータと新しいデータを同じレベルで分析している

執筆現在は2021年ですが、2016年のデータと2020年のデータを同じレベルで分析すべきではありません。

騎手の騎乗能力の年齢による変化や、馬券術や競馬予想AIの進化によるオッズの変動などを加味すべきで、より新しいデータ(この場合2020年)の方が信頼度が増します。

オッズ(人気)による回収率の違い

オッズ(人気)によって、回収率にバラつきが見られます。

2016~2020年のオッズ別回収率の回収率データです。

単勝オッズ別の単勝回収率

単勝オッズ別の単勝回収率

単勝オッズが100倍以上になると、回収率が一気に下がっています。

複勝オッズ別の複勝回収率

複勝オッズ別の複勝回収率

複勝オッズが17倍以上になると、回収率が一気に下がっています。

単複どちらにも言えるのは、

  • 人気が低い馬が予想以上に来ていないため回収率が下がっている
  • 人気が低い馬が実力以上に過剰に買われていてオッズが下がっているたね回収率が下がっている

ということです。

CrossFactorによる補正回収率分析

競馬ソフトCrossFactorでは、上記の課題を補正した補正回収率の分析が可能です。

以下で、その機能について簡単に説明させていただきます。

期間別の重み付け補正

期間別の重み付け設定

CrossFactorでは、データ分析の際に期間別の重み付け補正を行うことができます。

画像では、2011年~2020年にかけて、1~10の割合で重み付け補正を行っています。

オッズによる回収率の違いを補正

オッズ補正係数

CrossFactorでは、単複それぞれにおいて、オッズ範囲ごとに配当補正を加味することが可能です。

こうすることで、すべてのデータを使うことができます。

均等払い戻しによる分析

CrossFactorの補正回収率分析では、均等買いではなく、均等払い戻しによる分析を行っています。

均等買いと均等払い戻しの違い

均等買いは、「すべての馬券を同じ金額(例えば100円)で買った場合の回収率」となります。

均等払戻は、「すべての馬券を同じ払戻金額(例えば10000円)で買った場合の回収率」となります。

つまり、オッズが低い馬券は多くの金額を、オッズが高い穴馬券には少ない金額をベットしたと仮定して回収率分析を行っています。

こうすることで、オッズが高い穴馬券のベットが少なくなるため、人気薄の馬が回収率分析に与える影響度を下げて調整しています。

単複両方に対応

補正回収率分析は、単複それぞれ別で行われるため、どちらを主として狙いたいかによって単複どちらの回収率分析の結果データを使用するか選ぶことができます。

基準は回収率分析と同じ「80」

単複の回収率分析を行う際、控除率20%を除いた「80」を基準にされていると思います。

ですので、その感覚をそのまま使えるように、CrossFactorの補正回収率分析も「80」を基準としています。

80より大きいか小さいか、で判断することが可能です。

信頼度について

データ分析において「データ件数」というのはその信憑性に大きな影響があります。

データ件数が多ければ多いほど信憑性や再現性が高いと考えられるからです。

CrossFactorでは、「80」を基準として、その差にデータ件数を掛けることで「信頼度」として表示しています。

シンプルに「信頼度」が高ければデータとしての信頼度も高くなります。

データの信頼度を測る上でご利用いただければと思います。

まとめ

以上で、CrossFactorの補正回収率分析の解説を終わります。

通常の回収率分析を行っている競馬ファンに一線を画したデータ分析にご活用くださいませ。