競馬

スポンサーリンク
データサイエンス

【LightGBM】脚質と持ちタイムから上り3F最速の馬を予測する

過去成績の分析で大事なことはどの馬が爆走するのかということ、その一つの指標として上り3Fタイムがあります。本記事ではLightGBMを使って持ちタイムと脚質の情報から上り3F最速の競走馬を予測するモデルを作ります。
データサイエンス

脚質と持ちタイムからレース展開を予測

競走馬の脚質とその持ちタイムを使ってレースの展開予測の可能性を探ります。とりあえずは、上り3Fに到達するまでの速度の予測が可能だということが分かりました。
Python

脚質を教師なし学習で分類しランク学習で予測する方法

競馬予想で欠かせない脚質の情報をどうすれば分類できるかをKMeans法を使って解説してます。また、脚質を予測する方法としてランク学習を使ったアプローチを取ってます。
データサイエンス

【LightGBM】血統考慮版 競馬予想AIの作り方

競馬予想を行う上で、血統の情報は大変重要であることから、血統を使った競馬予想AIをLightGBMで作成する方法を解説します。
データサイエンス

LightGBMで作る血統を考慮した競馬予想AI

LightGBMには致命的な欠点があります。その欠点を理解して特徴量を追加すれば、競馬予想AIの性能を大幅に改善することができます。
データサイエンス

【機械学習 検証】競馬AIでは芝とダートは分けて学習すべきか?

pythonを使った競馬予想AIを作成する人の多くは、芝とダートの取り扱いに苦心することが多いと思います。今回はその疑問の検証を行おうと思います。
Python

番外編: 血統から産駒の適正距離や馬場を知る

競馬データ24年分の出走データから、競走馬の成長度を血統から調べてみた結果、ダートに大きな可能性を感じました。
Python

ロードマップ5: 24年分の競馬データを使って血統分析part1

競馬の血統情報を過去24年分のデータで分析すると、意外な結果が分かりました。
Python

ロードマップ2-2:データ確認&簡易分析 

2010年から2023年間の競馬データを用いて、簡易的な分析を行いモデル開発の大まかな方針を決めていきます。 走破タイムを使うのではなく、分速に変換して分析することで距離別の特性を見ることができます。また、距離区分に関してはSMILEを用いるとより分かりやすいです。
Python

ロードマップ2-1:データ確認&簡易分析

2010年から2023年間の競馬データを用いて、簡易的な分析を行いモデル開発の大まかな方針を決めていきます。
Python

ロードマップ1:タイパ!少ないアクセス数で競馬データをスクレイピング

競馬データをpythonでスクレイピングするときに、多重for文を書いている人。それ少し見直した方がいいです。このやり方で1000回以上はアクセス回数を減らせます。
スポンサーリンク