スポンサーリンク
技術/学術メモ

マルチタスク学習解説メモ

マルチタスク学習解説メモ /*! * * Twitter Bootstrap * */ /*! * Bootstrap v3.3.6 ( * Copyright 2011-2015 Twitter, Inc. * Licensed unde...
データサイエンス

マルチタスク学習で馬券の回収率160%超達成

マルチタスク学習を利用した深層学習モデルを使ってオッズと着順を同時に学習することで回収率160%超えることができます。
技術/学術メモ

【PyTorch完全版】機械学習のタスクと対応する損失関数一覧

以下は、機械学習における代表的なタスクと、それに対応する深層学習モデルの損失関数、およびそれを実装するためのPyTorchのメソッドの一覧です。 PyTorchによる実装の参考になれば幸いです。 回帰タスク¶ 1. 平均二乗誤差 (Mean...
データサイエンス

深層学習でLightGBMの特徴量重要度的なものを出す方法:PyTorchで作る競馬予想AI

本記事では、深層学習モデルを使った競馬AIの作り方を解説します。またブラックボックスである深層学習を解釈するSHAP値という指標を使ってよりリッチな分析手法をご紹介します。
データサイエンス

【全解説】深層学習で必要なデータ前処理:PyTorchで作る競馬予想AI

深層学習を使った競馬AIを開発中の方やこれから開発してみたい方のために、学習に必要なデータの準備である前処理を全て解説します
データサイエンス

【初学者対象】深層学習 超解説:PyTorchで作る競馬予想AI

PyTorchを使った競馬予想AIを作成したい方は、絶対にこの記事を読んでください。深層学習の中身はどういった仕組みになっているのか、イメージ図を使って丁寧に解説しています
技術/学術メモ

SHAP値の解説メモ

SHapley Additive exPlanations(SHAP)とは?¶ SHapley Additive exPlanations(SHAP)は、機械学習モデルの予測を個々の特徴量がどれだけ影響したかを定量化し、説明するための手法で...
データサイエンス

LightGBMで作る回収率と的中率両方を考慮する競馬AI

11.サードモデルの作成 前回の話で過去成績の活用方法が見えてきたのでサードモデルの開発に入る 11-0.サードモデルの説明¶ モデル作成の動機¶ 血統情報+過去成績を考慮したモデルの作成がしたい 的中率をあげることで、回収率をあげることを...
データサイエンス

LightGBMのカスタムObjectを使った高回収率を目指す競馬AIの作成

LightGBMのカスタムObjectの作成記事がなかなか見当たらなかったので、自分はどういう風に実装しているかをご紹介します。
技術/学術メモ

KL情報量の解説

KL情報量(Kullback-Leibler Divergence)とは?¶ KL情報量(Kullback-Leibler divergence、KL divergence)は、2つの確率分布間の「差異」や「情報の損失」を測る指標です。具体...
データサイエンス

【LightGBM】脚質と持ちタイムから上り3F最速の馬を予測する

過去成績の分析で大事なことはどの馬が爆走するのかということ、その一つの指標として上り3Fタイムがあります。本記事ではLightGBMを使って持ちタイムと脚質の情報から上り3F最速の競走馬を予測するモデルを作ります。
技術/学術メモ

TukeyのHSD検定

TukeyのHSD検定とは?¶ TukeyのHSD(Honestly Significant Difference)検定は、複数の平均値を比較する際に用いる事後検定の一つで、各グループ間のペアごとの比較に対して、すべてのペアを同時に検定しな...
技術/学術メモ

Holm法

Holm法とは?¶ Holm法(Holm-Bonferroni法)は、複数の仮説検定を行う際に、第1種の過誤率(誤って有意と判断する確率)を制御するための多重比較補正手法の一つです。 これは、より一般的で保守的なBonferroni法を改良...
データサイエンス

脚質と持ちタイムからレース展開を予測

競走馬の脚質とその持ちタイムを使ってレースの展開予測の可能性を探ります。とりあえずは、上り3Fに到達するまでの速度の予測が可能だということが分かりました。
技術/学術メモ

Mann–WhitneyU検定の解説メモ

Mann–Whitney U検定とは?¶ Mann–Whitney U検定は、2つの独立したグループ間のデータの分布が異なるかどうかを判断するための統計的手法です。 これは、母集団が正規分布に従わない場合にも使えるノンパラメトリック検定の一...
技術/学術メモ

Kruskal-Wallis検定の解説メモ

Kruskal-Wallis検定とは?¶ Kruskal-Wallis検定は、3つ以上の独立したグループ間のデータの分布が異なるかどうかを調べるためのノンパラメトリック検定です。 これは、データが正規分布していない場合や分散が等しくない場合...
技術/学術メモ

Bonferroni補正の解説メモ

Bonferroni補正とは?¶ Bonferroni補正(ボンフェローニ補正)は、複数の統計的検定を行う際に、第1種の誤り(偽陽性、つまり「差がないのに差があると判断する誤り」)のリスクを抑えるために使用される補正方法です。 特に、多重比...
Python

脚質を教師なし学習で分類しランク学習で予測する方法

競馬予想で欠かせない脚質の情報をどうすれば分類できるかをKMeans法を使って解説してます。また、脚質を予測する方法としてランク学習を使ったアプローチを取ってます。
データサイエンス

【LightGBM】血統考慮版 競馬予想AIの作り方

競馬予想を行う上で、血統の情報は大変重要であることから、血統を使った競馬予想AIをLightGBMで作成する方法を解説します。
データサイエンス

LightGBMで作る血統を考慮した競馬予想AI

LightGBMには致命的な欠点があります。その欠点を理解して特徴量を追加すれば、競馬予想AIの性能を大幅に改善することができます。
データサイエンス

【機械学習 検証】競馬AIでは芝とダートは分けて学習すべきか?

pythonを使った競馬予想AIを作成する人の多くは、芝とダートの取り扱いに苦心することが多いと思います。今回はその疑問の検証を行おうと思います。
データサイエンス

血統だけで回収率130%超えた話

Pythonを学び始めた人の多くは血統情報を機械学習モデルに入れて稼げるモデルを作りたいと思ってるわけなんですけど、意外と血統情報だけを使った簡単なルールベースのモデルだけでも回収率100%超えられるみたいなので、そのやり方とPythonのソースを共有します。
Python

番外編: 血統から産駒の適正距離や馬場を知る

競馬データ24年分の出走データから、競走馬の成長度を血統から調べてみた結果、ダートに大きな可能性を感じました。
データサイエンス

血統から競走馬の成長度合いを分析する方法

競馬予想AIの制作過程をサイトにのこしているものです。今回は血統データ24年分を調べて分かったその競走馬が早くから活躍するかそうでないかを知る方法を共有します。
Python

ロードマップ5: 24年分の競馬データを使って血統分析part1

競馬の血統情報を過去24年分のデータで分析すると、意外な結果が分かりました。
DevOps

ロードマップ4: Djangoで作る競馬予想AIモデル分析ソフト part10

Google Chartsを用いて競馬AI モデルのオッズグラフスコアのテーブルを描画します。DjangoとGoogle Chartsの連携は非常に特殊ですが、gviz_apiというライブラリを使うと比較的ラクにグラフの描画が出来るようになります。現在、競馬予想AIのモデル分析用ソフトを開発中であり、本記事ではモデルのパフォーマンスを可視化する機能を開発します。
DevOps

ロードマップ4: Djangoで作る競馬予想AIモデル分析ソフト part9

Google Chartsを用いて競馬AI モデルの回収率と的中率、収支結果、人気別ベット回数のグラフを描画します。DjangoとGoogle Chartsの連携は非常に特殊ですが、gviz_apiというライブラリを使うと比較的ラクにグラフの描画が出来るようになります。現在、競馬予想AIのモデル分析用ソフトを開発中であり、本記事ではモデルのパフォーマンスを可視化する機能を開発します。
DevOps

ロードマップ4: Djangoで作る競馬予想AIモデル分析ソフト part8

Google Chartsを用いてモデルの人気別ベット回数の円グラフを描画します。DjangoとGoogle Chartsの連携は非常に特殊ですが、gviz_apiというライブラリを使うと比較的ラクにグラフの描画が出来るようになります。現在、競馬予想AIのモデル分析用ソフトを開発中であり、本記事ではモデルのパフォーマンスを可視化する機能を開発します。
DevOps

ロードマップ4: Djangoで作る競馬予想AIモデル分析ソフト part7

Google Chartsを用いてモデルの回収率と的中率のテーブルを描画します。DjangoとGoogle Chartsの連携は非常に特殊ですが、gviz_apiというライブラリを使うと比較的ラクにグラフの描画が出来るようになります。現在、競馬予想AIのモデル分析用ソフトを開発中であり、本記事ではモデルのパフォーマンスを可視化する機能を開発します。
DevOps

ロードマップ4: Djangoで作る競馬予想AIモデル分析ソフト part6

Google Chartsを用いてモデルの収支をグラフで描画します。DjangoとGoogle Chartsの連携は非常に特殊ですが、gviz_apiというライブラリを使うと比較的ラクにグラフの描画が出来るようになります。現在、競馬予想AIのモデル分析用ソフトを開発中であり、本記事ではモデルのパフォーマンスを可視化する機能を開発します。
DevOps

ロードマップ4: Djangoで作る競馬予想AIモデル分析ソフト part5

HTML上であると便利なサイドバーを作成し、フォームの入力値チェックをJavaScriptで行うソースを紹介しています。現在、競馬予想AIのモデル分析用ソフトを開発中であり、本記事ではサイドバーからモデルを選択する機能を作ります。
DevOps

ロードマップ4: Djangoで作る競馬予想AIモデル分析ソフト part4

Djangoで必須スキルとされるDBからデータを取り出してテーブル表示させる手順とテーブル上からDBのデータを削除する手順を解説しています。競馬予想AIのモデル分析用ソフトを開発中であり、本記事ではモデルリスト表示する機能を作ります。
DevOps

ロードマップ4: Djangoで作る競馬予想AIモデル分析ソフト part3

Djangoで必須スキルとされるフォームをかっこよくモーダルで表示させる手順を解説しています。競馬予想AIのモデル分析用ソフトを開発中であり、本記事ではモデルをインポートする機能を作ります。
DevOps

ロードマップ4: Djangoで作る競馬予想AIモデル分析ソフト part2

Djangoで必須とされるModelの作成とフォームの作成の手順を解説しています。競馬予想AIのモデル分析用ソフトを開発中であり、本記事ではモデルをインポートする機能を作ります。
DevOps

ロードマップ4: Djangoで作る競馬予想AIモデル分析ソフト part1

Djangoを使って競馬分析用のWEBアプリを作ります。実際に機械学習モデルを使った競馬予想AIのパフォーマンスを評価できるだけでなく、どのモデルが良いかを比較できる機能やモデルをインポートしたり、不要なモデルを削除したりできるモデル管理機能を作る予定です。
データサイエンス

ロードマップ3:競馬予想AIモデルの評価方法

はじめに 本シリーズでは、動画で解説したモデル管理分析クラスの使い方のサンプルコードを載せます。 ロードマップ2で決定したモデル作成時の前提一覧については以下のページを参照ください。 競馬予想プログラムソフト開発の制作過程動画リスト モデル...
データサイエンス

ロードマップ3.5: モデル管理分析クラス ver 0.2 の作成とサンプルコード

はじめに 本シリーズでは、動画で解説したモデル管理分析クラスの使い方のサンプルコードを載せます。 ロードマップ2で決定したモデル作成時の前提一覧については以下のページを参照ください。 競馬予想プログラムソフト開発の制作過程動画リスト モデル...
データサイエンス

ロードマップ3: ファーストモデルの開発

はじめに 本シリーズでは、動画として解説しなかったロードマップ3のファーストモデルの開発で詳細な部分を解説しています。 ロードマップ2で決定したモデル作成時の前提一覧については以下のページを参照ください。 競馬予想プログラムソフト開発の制作...
Python

ロードマップ3 ex.002:前提箇所の処理詳細

競馬予想プログラムソフトの開発をしています。ここでは、競馬予想プログラムで作成するモデルが前提とする条件を実現する処理のサンプルを公開しています。
Python

ロードマップ3 ex.001:前提箇所の処理詳細

競馬予想プログラムソフトの開発をしています。ここでは、競馬予想プログラムで作成するモデルが前提とする条件を実現する処理のサンプルを公開しています。
Python

ロードマップ2-3:データ確認&簡易分析

2010年から2023年間の競馬データを用いて、簡易的な分析を行いモデル開発の大まかな方針を決めていきます。 オッズと勝率には重大な関係があります。この関係を用いれば、競馬予想にも活用できる他にもモデルの評価などにも使えるとっても大事な関係が隠れていました。
Python

ロードマップ2-2:データ確認&簡易分析 

2010年から2023年間の競馬データを用いて、簡易的な分析を行いモデル開発の大まかな方針を決めていきます。 走破タイムを使うのではなく、分速に変換して分析することで距離別の特性を見ることができます。また、距離区分に関してはSMILEを用いるとより分かりやすいです。
Python

ロードマップ2-1:データ確認&簡易分析

2010年から2023年間の競馬データを用いて、簡易的な分析を行いモデル開発の大まかな方針を決めていきます。
Python

ロードマップ1:タイパ!少ないアクセス数で競馬データをスクレイピング

競馬データをpythonでスクレイピングするときに、多重for文を書いている人。それ少し見直した方がいいです。このやり方で1000回以上はアクセス回数を減らせます。
スポンサーリンク