お世話になっております。
かなり色んなファクターを入れていますが、特別凄いものは入れていないと思いますよ。
・能力指数
・トラック、距離別の展開予想
・休養明け、ローテーション、馬体重
・前走レース評価 (不利、パフォーマンス、レースレベルetc)
・前走からのレース条件変化
・調教タイム、調教系
・騎手ランクの変動
・馬番、枠番、脚質、騎手、調教師、種牡馬の自動得点生成から、有用そうな項目のみ採用
(再現性が低そうな項目は0点に設定)
・+α のスパイス
などですかね。
自分が分析の際にしているポイントとしては、
・仮定 → 分析 で、採用可否の決定
・データ分析時点で大穴馬は除外している
・データ件数が少ない場合でも信憑性が高そうなファクターは採用
・再現性を重視
・ファクター同士ができるだけ重複しないように考慮
・一般の競馬ファンの認知度が低そうなファクターは積極的に採用
・一般の競馬ファンが過大評価していそうな項目は採用して、減点
・一般の競馬ファンが評価していそうな内容は不採用 (回収率80%に近づくため)
・1つ1つのファクターでそれほど大きな加減点は行わないように調整している
という感じです。
参考になれば幸いです。