データサイエンス

スポンサーリンク
データサイエンス

マルチタスク学習で馬券の回収率160%超達成

マルチタスク学習を利用した深層学習モデルを使ってオッズと着順を同時に学習することで回収率160%超えることができます。
データサイエンス

深層学習でLightGBMの特徴量重要度的なものを出す方法:PyTorchで作る競馬予想AI

本記事では、深層学習モデルを使った競馬AIの作り方を解説します。またブラックボックスである深層学習を解釈するSHAP値という指標を使ってよりリッチな分析手法をご紹介します。
データサイエンス

【全解説】深層学習で必要なデータ前処理:PyTorchで作る競馬予想AI

深層学習を使った競馬AIを開発中の方やこれから開発してみたい方のために、学習に必要なデータの準備である前処理を全て解説します
データサイエンス

【初学者対象】深層学習 超解説:PyTorchで作る競馬予想AI

PyTorchを使った競馬予想AIを作成したい方は、絶対にこの記事を読んでください。深層学習の中身はどういった仕組みになっているのか、イメージ図を使って丁寧に解説しています
データサイエンス

LightGBMで作る回収率と的中率両方を考慮する競馬AI

11.サードモデルの作成 前回の話で過去成績の活用方法が見えてきたのでサードモデルの開発に入る 11-0.サードモデルの説明¶ モデル作成の動機¶ 血統情報+過去成績を考慮したモデルの作成がしたい 的中率をあげることで、回収率をあげることを...
データサイエンス

LightGBMのカスタムObjectを使った高回収率を目指す競馬AIの作成

LightGBMのカスタムObjectの作成記事がなかなか見当たらなかったので、自分はどういう風に実装しているかをご紹介します。
データサイエンス

【LightGBM】脚質と持ちタイムから上り3F最速の馬を予測する

過去成績の分析で大事なことはどの馬が爆走するのかということ、その一つの指標として上り3Fタイムがあります。本記事ではLightGBMを使って持ちタイムと脚質の情報から上り3F最速の競走馬を予測するモデルを作ります。
データサイエンス

脚質と持ちタイムからレース展開を予測

競走馬の脚質とその持ちタイムを使ってレースの展開予測の可能性を探ります。とりあえずは、上り3Fに到達するまでの速度の予測が可能だということが分かりました。
Python

脚質を教師なし学習で分類しランク学習で予測する方法

競馬予想で欠かせない脚質の情報をどうすれば分類できるかをKMeans法を使って解説してます。また、脚質を予測する方法としてランク学習を使ったアプローチを取ってます。
データサイエンス

【LightGBM】血統考慮版 競馬予想AIの作り方

競馬予想を行う上で、血統の情報は大変重要であることから、血統を使った競馬予想AIをLightGBMで作成する方法を解説します。
データサイエンス

LightGBMで作る血統を考慮した競馬予想AI

LightGBMには致命的な欠点があります。その欠点を理解して特徴量を追加すれば、競馬予想AIの性能を大幅に改善することができます。
データサイエンス

【機械学習 検証】競馬AIでは芝とダートは分けて学習すべきか?

pythonを使った競馬予想AIを作成する人の多くは、芝とダートの取り扱いに苦心することが多いと思います。今回はその疑問の検証を行おうと思います。
データサイエンス

血統だけで回収率130%超えた話

Pythonを学び始めた人の多くは血統情報を機械学習モデルに入れて稼げるモデルを作りたいと思ってるわけなんですけど、意外と血統情報だけを使った簡単なルールベースのモデルだけでも回収率100%超えられるみたいなので、そのやり方とPythonのソースを共有します。
Python

番外編: 血統から産駒の適正距離や馬場を知る

競馬データ24年分の出走データから、競走馬の成長度を血統から調べてみた結果、ダートに大きな可能性を感じました。
データサイエンス

血統から競走馬の成長度合いを分析する方法

競馬予想AIの制作過程をサイトにのこしているものです。今回は血統データ24年分を調べて分かったその競走馬が早くから活躍するかそうでないかを知る方法を共有します。
Python

ロードマップ5: 24年分の競馬データを使って血統分析part1

競馬の血統情報を過去24年分のデータで分析すると、意外な結果が分かりました。
データサイエンス

ロードマップ3:競馬予想AIモデルの評価方法

はじめに 本シリーズでは、動画で解説したモデル管理分析クラスの使い方のサンプルコードを載せます。 ロードマップ2で決定したモデル作成時の前提一覧については以下のページを参照ください。 競馬予想プログラムソフト開発の制作過程動画リスト モデル...
データサイエンス

ロードマップ3.5: モデル管理分析クラス ver 0.2 の作成とサンプルコード

はじめに 本シリーズでは、動画で解説したモデル管理分析クラスの使い方のサンプルコードを載せます。 ロードマップ2で決定したモデル作成時の前提一覧については以下のページを参照ください。 競馬予想プログラムソフト開発の制作過程動画リスト モデル...
データサイエンス

ロードマップ3: ファーストモデルの開発

はじめに 本シリーズでは、動画として解説しなかったロードマップ3のファーストモデルの開発で詳細な部分を解説しています。 ロードマップ2で決定したモデル作成時の前提一覧については以下のページを参照ください。 競馬予想プログラムソフト開発の制作...
Python

ロードマップ3 ex.001:前提箇所の処理詳細

競馬予想プログラムソフトの開発をしています。ここでは、競馬予想プログラムで作成するモデルが前提とする条件を実現する処理のサンプルを公開しています。
Python

ロードマップ2-3:データ確認&簡易分析

2010年から2023年間の競馬データを用いて、簡易的な分析を行いモデル開発の大まかな方針を決めていきます。 オッズと勝率には重大な関係があります。この関係を用いれば、競馬予想にも活用できる他にもモデルの評価などにも使えるとっても大事な関係が隠れていました。
Python

ロードマップ2-1:データ確認&簡易分析

2010年から2023年間の競馬データを用いて、簡易的な分析を行いモデル開発の大まかな方針を決めていきます。
スポンサーリンク