競馬予想(2020/01/18) 小倉11R 愛知杯(G3)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
モデル作成ロジックは前回(2019/12/28のホープフルS)から変更なしです。

・学習データ
 2011年から2019年までに行われた以下の条件に当てはまるレース。
  (1) 愛知杯
  (2) 小倉芝2000mのG3
 
 レース数 = 19
 出走馬数 = 294
 
 通常、愛知杯の開催は中京なのですが、今年は小倉開催なので学習データをどうしようか少し考えました。
 ある程度データ量を確保するために、ここは上のようなOR条件で学習データを採ってみました。
 
 ※"小倉で開催された愛知杯(冬開催の芝2000m 牝馬限定G3)"もあるのですが、
  学習データをそれだけに絞ると2010年、2011年の2回しかなく、データ量が少なすぎて…。
 
予想内容
 ◎サラキア(0.427)
 ○パッシングスルー(0.360)
 ▲センテリュオ(0.348)
 △レッドランディーニ(0.334)
 △アロハリリー(0.329)
 
※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


RoC曲線を描いたときに得た情報を見ると、閾値0.32あたりから偽陽性率が上がり始めていました。
6番手評価がランドネの0.286だったので、本予想的には◎~△の5頭で馬券を構成するのがいい感じですね。
5頭の中に1~4番人気が入っているので、人気どおりに近いなあ、って感じもしますけど。

競馬予想(2019/12/28) 阪神12R ファイナルS(3勝クラス)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
今年最後のJRAのレースなので、予想させてみました。
モデル作成ロジックは先ほど投稿したホープフルSから変更なしです。

・学習データ
 2010年から2019年(昨日まで)に行われた阪神芝1200m 1600万下/3勝クラスに出走した馬の出走当時のデータ
 当然のことながら、G2時代の情報も含んでいます。
 
 レース数 = 26
 出走馬数 = 356
 
予想内容
 ◎スギノヴォルケーノ(0.541)
 ○ダノンジャスティス(0.510)
 ▲エイティーンガール(0.433)
 △キラーコンテンツ(0.381)
 △ニシノキントウン(0.356)
 
※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


施行条件がコロコロと変わっていますね。
私の中のイメージは阪神芝1600m OPなのですが、これは8年前が最後なのか。

現時点で3番人気、2番人気、1番人気の馬を上位3番手までに評価する、堅めの予想となっています。
クインズチャパラが取り消していますが、この馬がいれば3番手評価はこの馬でした。

ちなみに、このモデルで使っている予想ファクターで比較的重要視されているのは騎手実績、上がり3ハロン実績、種牡馬実績でした。
個々の馬に関する要素が上位に出てきていないのが気になるところです。

競馬予想(2019/12/28) 中山11R ホープフルS(GI)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
モデル作成ロジックは前回(12/15 朝日杯FS)から特に変更なしで。

・学習データ
 2010年から2018年に行われたホープフルSに出走した馬の出走当時のデータ
 当然のことながら、G2時代の情報も含んでいます。
 
 レース数 = 9
 出走馬数 = 128
 
予想内容
 ◎ワーケア(0.581)
 ○ナリノモンターニュ(0.465)
 ▲コントレイル(0.416)
 △ヴェルトライゼンデ(0.402)
 △ガロアクリーク(0.375)
 
※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


評価値0.45あたりを境に、3着以内に来るか来ないかが明確に分かれている予想モデルになっています。

で、今年はというと、0.45以上の馬はワーケアとナリノモンターニュの2頭だけ。
ってことは、今回の予想モデル的には、この2頭の3着以内は堅い、といった予想となります。

ちなみに、ここには載せていない6番手の馬の評価はラインベックの0.201と上位5頭からの開きがあります。
この予想結果を信頼するのであれば、馬券の買い方としては、ワーケア、ナリノモンターニュを中心に、▲△の3頭を絡めるといった形になるかと。

競馬予想(2019/12/21) 阪神11R 阪神カップ(G2)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
学習に関する要素は先週から変更していません。

・学習データ
 2010年から2018年に行われた阪神芝1400m 3歳以上/4歳以上の重賞レースに出走した馬の出走当時のデータ
 (阪急杯、阪神カップ、2015年までの阪神牝馬Sが含まれています)
 レース数 = 28
 出走馬数 = 396

予想内容
 ◎グランアレグリア(0.586)
 ○シヴァージ(0.452)
 ▲レッツゴードンキ(0.371)
 △イベリス(0.286)
 △メイショウショウブ(0.254)
 
※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


過去の同一レースだけでなく似たような条件下のレース結果を学習データに加えることで、学習データ数を多くとるようにしてみました。
モデル作成時の評価においては、評価値0.37以上の馬は100% 3着以内に入っていました。
今回は▲までの3頭がその値を超えている、なおかつそこから4番手までの間の評価値が離れていることから、3頭を中心に馬券を組み立てれば良いと解釈しています。

比較的人気のない、○のシヴァージが絡んでくれれば、この予想としては満足いく結果になるのですが果たして…?

競馬予想(2019/12/15) 阪神11R 朝日杯フューチュリティS(G1)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
特徴量を1つさらに追加してみました。
重要度的には、全特徴量の真ん中ぐらいに位置しています。

・学習データ
 2010年から2019年に行われた阪神芝1600m 2歳限定のOP以上のレースに出走した馬の出走当時のデータ
 レース数 = 15
 出走馬数 = 261

予想内容
 ◎サリオス(0.535)
 ○レッドベルジュール(0.500)
 ▲ジュンライトボルト(0.437)
 △ペールエール(0.394)
 △タイセイビジョン(0.390)
 
※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


学習データを単純に過去の朝日杯FSにしなかったのは、朝日杯FSが阪神開催になったのが2014年であり、
過去5年(5レース)分のデータしかなく、これではさすがに少ないと判断したためです。

1~3着に必ず牝馬が入る様になっている、阪神JFのレース結果が3分の2を占めている点が気にはなりますが、とりあえずこの予想モデルでやってみます。
性別の重要度は比較的下位に位置していたので、おそらく問題ないでしょう。

<参考>
2017年までの阪神JF+朝日杯FSのレース結果か作ったモデルで2018年の朝日杯FSを予想をする、という検証をしてみた結果は以下の通りです。
 ◎グランアレグリア(0.606) →3着
 ○アドマイヤマーズ(0.446) →1着
 ▲ケイデンスコール(0.426) →13着
 △ファンタジスト(0.394)  →4着
 △ニホンピロヘンソン(0.345)→15着

悪くはないですね。

競馬予想(2019/12/14) 中山11R ターコイズS(G3)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
特徴量の1つとして、過去のレースでの走破時計を指数化したものを使っているのですが、指数化するロジックを大幅に変えてみました。
以前のものは馬場状態を考慮していない等、欠陥があるのはわかっていたので。

ただ、使っているアルゴリズムがランダムフォレストの上、この指数が重要度的として上位に食い込むかというとそうでもないので、予想結果にそれほど影響していないかもしれないですが。

・学習データ
 2010年から2018年に行われたターコイズに出走した馬の出走当時のデータ
 レース数 = 9
 出走馬数 = 134

予想内容
 ◎エスポワール(0.405)
 ○デンコウアンジュ(0.347)
 ▲モアナ(0.329)
 △ディメンシオン(0.321)
 △オールフォーラヴ(0.315)
 
※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


エスポワール以外の人気上位馬をバッサリ切って、中穴をねらうような感じになっています。

ちなみに、学習時の評価を見てみると、
・評価値0.39以上→全馬3着以内
・評価値0.26以下→全馬4着以下
でした。

これらの情報を信じるのであれば、「エスポワールを軸にして流す」というのが馬券的には良いということになります。

競馬予想(2019/12/08) 阪神11R 阪神ジュベナイルフィリーズ(G1)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
AI自体の内容は、前回予想掲載時(ジャパンカップ)の時と変更ありません。

・学習データ
 2010年から2018年に行われたジャパンカップに出走した馬の出走当時のデータ
 レース数 = 9
 出走馬数 = 162

予想内容
 ◎リアアメリア(0.699)
 ○クリスティ(0.656)
 ▲ウーマンズハート(0.604)
 △マルターズディオサ(0.503)
 △クラヴァシュドール(0.480)
 
※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


実際のオッズとしてはリアアメリア、クラヴァシュドール、ウーマンズハートの3強の様相ですが、本予想ではそうでもなさそうとのこと。
珍しく0.50超えが4頭もいるし、5番手のクラヴァシュドールも0.48と比較的高めです。
で、この後に大きな溝があって、6番手はジェラペッシュの0.167となっています。

ちなみに、検証結果を見たところ、3着を外している馬の中での一番大きな評価値は0.49(2010年:ダンスファンタジアが)でした。
今年のように、何頭も評価値0.50超えがいるわけではなかったです。

3強とまではいかないものの、3着以内はこの5頭で堅そうというところが読み取れますが、結果はどうなるでしょうか。

競馬予想(2019/11/24) 東京11R ジャパンカップ(G1)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは前回と同じですが、不要と思われるパラメータ(例:東京競馬場のレース予想する場合の「右回りの実績」)を事前に削除するようにしています。


・学習データ
 2011年から2018年に行われたジャパンカップに出走した馬の出走当時のデータ
 レース数 = 8
 出走馬数 = 133

予想内容
 ◎レイデオロ(0.567)
 ○ユーキャンスマイル(0.442)
 ▲カレンブーケドール(0.438)
 △シュヴァルグラン(0.436)
 △スワーヴリチャード(0.432)
 
※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


複勝率(生涯、芝、左回り、古馬混合戦)あたりが比較的重視されているパラメータのようです。
どう使っているかまでは、見てないですが。
とはいえ、Random Forestなので、複数あるそれぞれの決定木によって使い方は違うはずなので、一口に「どう使っているか」を表現するのは難しいでしょう。

現状の予想モデルでは、レース時の馬場状態は考慮できていません。
試しに、馬場状態を「不良」から「良」に変更して予想させてみたのですが、結果は同じでした。

ここに出てきていない人気どころだと、
・ワグネリアン → 評価値0.325で6番手評価
でした。

モデル作成時の評価では、「評価値0.30」までは"3着以内(※)"に来たことがあります。
評価値0.30を超えているのは、上記の馬+ルックトゥワイスでした。

※予測モデル作成時には、実際に3着以内の馬に加えて「3着馬とタイム差なし」の馬を3着以内と扱っています。

競馬予想(2019/11/17) 京都11R マイルCS(G1)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは前回と同じです。
ただ、モデル作成においてどのパラメータを利用するかどうかを判断するロジックを少し変更しています。

・学習データ
 2011年から2018年に行われたマイルCSに出走した馬の出走当時のデータ
 レース数 = 8
 出走馬数 = 143

予想内容
 ◎ダノンプレミアム(0.533)
 ○レイエンダ(0.516)
 ▲ダノンキングリー(0.482)
 △ダイアトニック(0.415)
 △レッドオルガ(0.328)
 
※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


馬体重は発表後に予想させています。

モデル評価時の結果を見たところ、0.43以上は全馬3着以内扱い、0.31以下は全馬4着以下扱いとなっていました。
で、この間の値に該当する馬は不在。

なので、今回でいうダイアトニックやレッドオルガについては「評価に少し困る」馬となります。

っとはいえ、0.43以上が◎〇▲の3頭いるので、この予想モデルとしてはこの3頭で堅く収まるのではといった見立てとなります。

天皇賞の5連単的中といった、贅沢なことは言いませんが、上位3頭で決まるといいなあ。
エリザベス女王杯のような1頭いなければ…(※クロコスミア以外の掲示板4頭が本ブログでの上位評価4頭)といった結果にはならないことを祈ってます。

競馬予想(2019/11/10) 京都11R エリザベス女王杯(G1)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは前回と同じです。
(ここのところ、機械学習本体部分に全然手が付けられてません…。)

・学習データ
 2011年から2018年に行われたエリザベス女王杯に出走した馬の出走当時のデータ
 レース数 = 8
 出走馬数 = 138

予想内容
 ◎ラヴズオンリーユー(0.542)
 ○センテリュオ(0.433)
 ▲ラッキーライラック(0.397)
 △クロノジェネシス(0.394)
 △ポンデザール(0.237)
 
※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


現時点での予想なので、当然、馬体重は発表前です。

4番手評価のクロノジェネシスと5番手評価のポンデザールのところで評価値が大きく離れています。
というわけで、この予想結果を信じるのであれば、上位4頭までを馬券購入対象としたいところです。

前走、府中牝馬Sを勝ち、その前2走も牝馬限定重賞で馬券に絡んだスカーレットカラーですが、
今回の予想モデルでは評価値0.07、13番手の相当な低評価です。

前回も同じこと書いてますが、理由が見えにくいのは改善したいところ。

競馬予想(2019/10/27) 東京11R 天皇賞・秋(G1)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは先週と同じです。

・学習データ
 2012年から2018年に行われた天皇賞・秋に出走した馬の出走当時のデータ
 レース数 = 8
 出走馬数 = 134

予想内容
 ◎アーモンドアイ(0.538)
 ○ダノンプレミアム(0.466)
 ▲アエロリット(0.424)
 △ユーキャンスマイル(0.400)
 △ワグネリアン(0.344)
 
※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


現時点での予想なので、当然、馬体重は発表前です。

アーモンドアイ、ダノンプレミアム、ワグネリアンといった、人気馬を順当に上位に評価している中、
サートゥルナーリアは7番手の低評価。

何を重視した結果こうなってるのか、もっとちゃんと可視化したほうがいいな。
現状、予想結果についてはスコア以外、まともに何も出せてないし。

競馬予想(2019/10/20) 京都11R 菊花賞(G1)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは先週と同じです。

・学習データ
 2011年から2018年に行われた菊花賞に出走した馬の出走当時のデータ
 レース数 = 8
 出走馬数 = 134

予想内容
 ◎ヴェロックス(0.401)
 ○サトノルークス(0.396)
 ▲ワールドプレミア(0.277)
 △ニシノデイジー(0.259)
 △レッドジェニアル(0.252)
 
※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


馬体重発表後に予想させています。

3番手評価で0.30を切っているあたりから、過去の傾向からは高確率で好走すると判断できる馬が
ほとんどいない=ある程度どの馬にもチャンスがあり、という見方をします。

皐月賞・ダービー勝ち馬不在、両レースで好走したダノンキングリーもいない、
トライアル勝ち馬もいないとなれば、こういう予想結果になるのも妥当かな。

競馬予想(2019/10/14) 東京11R 府中牝馬S(G2)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは先週と同じです。

・学習データ
 2012年から2018年に行われた府中牝馬Sに出走した馬の出走当時のデータ
 レース数 = 7
 出走馬数 = 98

予想内容
 ◎プリモシーン(0.458)
 ○オールフォーラヴ(0.432)
 ▲クロコスミア(0.413)
 △ラッキーライラック(0.385)
 △ディメンシオン(0.350)
 
※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


馬体重発表後に予想させています。

過去7年を見ていると、評価値0.36あたりで3着以内に入っている/入っていないが明確に分かれています。
これを信じれば、ラッキーライラックまでの4頭が3着以内候補。

ディメンシオンが0.35と0.36のラインをわずかに下回るだけなので、ここまで含めてもいいかもしれません。

競馬予想(2019/10/13) 京都11R 秋華賞(G1)

なんだかんだで1か月の予想公開。
公私に忙しく、なかなか記事を書く時間が確保できませんでした。

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは前回と同じです。

・学習データ
 2011年から2018年に行われた秋華賞に出走した馬の出走当時のデータ
 レース数 = 8
 出走馬数 = 142

予想内容
 ◎ダノンファンタジー(0.774)
 ○クロノジェネシス(0.483)
 ▲エスポワール(0.458)
 △ビーチサンバ(0.414)
 △シゲルピンクダイヤ(0.406)
 
※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


ダノンファンタジー1強の予想となってます。
相手も、春のクラシックで上位人気になっていた/馬が中心。

そんな中、エスポワールにそれなりに高い評価を与えているのは何だろう。
実際、現時点で2番人気に推されていますが。
古馬混合の2勝クラスを圧勝したのを評価されている?(重馬場の鬼だったりしないかな)

競馬予想(2019/9/8) 中山11R 京成杯AH(G3)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは先週と同じです。

・学習データ
 2011年から2018年に行われた札幌2歳Sに出走した馬の出走当時のデータ
 レース数 = 10
 出走馬数 = 120

予想内容
 ◎ディメンシオン(0.540)
 ○クリノガウディー(0.534)
 ▲プロディガルサン(0.523)
 △トロワゼトワル(0.496)
 △グルーヴィット(0.406)
 
※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


馬体重発表後に予想させています。

評価値0.50超過が3頭いますが、人気が割れてて多少手を広げても配当的にはプラスが見込めるので、
今回の回収率評価には上記5頭までを考慮します。


先週、余計なことして回収率upしそこねてますし。A^^;

競馬予想(2019/9/1) 新潟11R 新潟記念(G3)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは先週と同じです。

・学習データ
 2011年から2018年に行われた札幌2歳Sに出走した馬の出走当時のデータ
 レース数 = 10
 出走馬数 = 127

予想内容
 ◎ユーキャンスマイル(0.531)
 ○レイエンダ(0.523)
 ▲フランツ(0.520)
 △センテリュオ(0.444)
 △ジナンボー(0.398)
 
※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


馬体重発表後に予想させています。

ほぼ人気順で、評価値0.50超過も3頭。
(※モデル構築には実際の人気はパラメータとして使ってないにも関わらず。)

そして、モデル構築時の再現率0.75も高め。


というわけで、回収率評価には評価値0.50超過の3頭だけを考慮します。

そういや、最近、結果載せられてない…。

競馬予想(2019/8/31) 札幌11R 札幌2歳S(G3)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは先週と同じです。

・学習データ
 2009年から2018年に行われた札幌2歳Sに出走した馬の出走当時のデータ
 レース数 = 10
 出走馬数 = 138

予想内容
 ◎ゴルコンダ(0.341)
 ○ヨハネスボーイ(0.324)
 ▲レザネフォール(0.264)
 △コンドゥクシオン(0.249)
 △エイリアス(0.246)
 
※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


2歳戦2回目の予想。
先週は散々な結果になりましたが、今週はどうなるのか。

圧倒的一番人気から、それ以外の人気馬を外したような狙いになっています。


先週は馬体重発表前に予想させたものを載せましたが、今回は馬体重発表後に予想させたものを載せています。
(ちなみに馬体重発表前に予想させる場合は、増減なしという前提にしています。)

今回の札幌2歳Sについては馬体重発表前にも予想させていますが、結構内容が変わってました。
◎の馬も違う馬だったし。A^^;


全体的に評価値が低いですが、そもそものモデル再現率が0.235と低いので、そこはあまり気にせず。

モデル評価の際には、評価値0.35で3着以内かどうかがくっきり分かれていましたが、
今回はそれを超える馬もいないという…。

競馬予想(2019/8/25) 新潟11R 新潟2歳S(G3)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは先週と同じです。

・学習データ
 2011年から2018年に行われた新潟2歳Sに出走した馬の出走当時のデータ
 レース数 = 8
 出走馬数 = 131

予想内容
 ◎モーベット(0.530)
 ○グランチェイサー(0.445)
 ▲ペールエール(0.352)
 △グライユル(0.327)
 △タイムマシン(0.275)

※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


2歳戦の予想を掲載したのはこれが初です。
1頭当たりのデータ量が少ない、この時期の2歳重賞を今のAI機能で予想して当てられるのだろうか。

※2歳戦をまともに予想させてみたのが、今回が初です。
 函館2歳Sでも予想させてみたことはあるのですがが、JRAでの出走経験のない馬がそもそもレースに出走していない扱いになったり…。A^^;
 新馬戦に関しては動かしたこともありません。ちゃんと動くのかどうかも怪しいと思ってます。

競馬予想(2019/8/25) 札幌11R キーンランドC(G3)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは先週と同じです。

・学習データ
 2011年から2018年に行われた札幌芝1200m、3歳以上オープン以上のレースに出走した馬の出走当時のデータ
 レース数 = 13
 出走馬数 = 179
 
 データ量を増やすために、対象レースを少し広げてみました。
 結果的には、過去のキーンランドC+UHB賞が元データとなってます。

予想内容
 ◎ダノンスマッシュ(0.568)
 ○ナックビーナス(0.482)
 ▲リナーテ(0.477)
 △タワーオブロンドン(0.439)
 △アスターペガサス(0.348)

※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


評価値的に上位4頭までかなという気はしてますが、0.5を超えている馬が1頭しかいないので、
回収率の評価は上の5頭を対象としたものにします。


ちなみに、同じモデルを使って今年のUHB賞を予想した場合にどうなって、検証してみました。

 ◎リナーテ(0.371) → 1着
 ○アスタールビー(0.282)
 ▲ライトオンキュー(0.278) → 2着
 △マイネルパラディ(0.257)
 △ダイメイフジ(0.247) → 3着
 
評価値が全体的に低かったのはともかくとして当たってはいました。

明日の予想も期待していいのかな?
人気馬中心の予想にはなっちゃってますが。

競馬予想(2019/8/18) 札幌11R 札幌記念(G2)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは昨日と同じです。

・学習データ
 2011年から2018年に行われた札幌記念に出走した馬の出走当時のデータ
 レース数 = 8
 出走馬数 = 117

予想内容
 ◎フィエールマン(0.636)
 ○ワグネリアン(0.624)
 ▲サングレーザー(0.595)
 △ペルシアンナイト(0.565)
 △ランフォザローゼス(0.381)

※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


人気どころをきっちり抑えた予想になっています。
過去のデータからしても、穴馬が入る余地はないということなのか…。

なお、評価値0.50以上の馬が4頭いるので、回収率評価に関してはペルシアンナイトまでの4頭で行います。

ちなみに、データ量が少ないせいか、できたモデルは適合率・再現率ともに100%となってしました。
過学習してないか心配…。

【参考】競馬予想(2019/8/17) 小倉11R テレQ杯(3勝クラス)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。

先ほどの記事で触れたように、小倉ダート1000mの3勝クラス(旧1600m万条件)は過去のデータがなかったので、予想能力の検証を兼ねて使えそうなデータを使って予想してみます。

なお、回収率評価の対象からは外します。

・学習データ
 2011年から2018年に行われた小倉ダート1000m 古馬混合500万条件以上のレースに出走した馬の出走当時のデータ
 レース数 = 145
 出走馬数 = 1962

予想内容
 ◎サザンヴィグラス(0.648)
 ○モンペルデュ(0.583)
 ▲メイショウサチシオ(0.558)
 除メイショウアリソン(0.507)
 △ブラックランナー(0.491)
 △ヘルディン(0.415)

※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


3頭が評価値0.50超過なので、それらを馬券の中心にすれば良いという見方はできますが、何しろ学習データの大半が500万条件なので当てになるのかどうか。

競馬予想(2019/8/17) 新潟11R 日本海S(3勝クラス)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは昨日と同じです。

・学習データ
 2011年から2018年に行われた新潟芝2200m 1600万条件以上のレースに出走した馬の出走当時のデータ
 レース数 = 10
 出走馬数 = 114

予想内容
 ◎フェイズベロシティ(0.421)
 ○ゴージャスランチ(0.411)
 ▲バレリオ(0.400)
 △ステイパーシスト(0.268)
 △ノチェブランカ(0.235)

※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


8頭という少ない頭数、人気馬上位、評価値が3番手と4番手の間にそれなりに評価値の差があることから、的中評価は▲までの3頭に絞ります。


テレQ杯の方が出走頭数が多かったのでそっちを予想してみようかと思っていたのですが、
小倉ダート1000mの3勝クラス(旧1600m万条件)は今年新設されたのか
昨年までの同条件の情報が見つからなかった(旧1000万条件すらなかったようにも見えた)ので、こっちを予想してみました。

追記:
 旧1000万条件は2017年、2018年の西部日刊スポーツ杯がありました。
 だからなんだ、って感じですが。

競馬予想(2019/8/4) 新潟11R レパードS(G3)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは昨日と同じです。

・学習データ
 2011年から2018年に行われたレパードSに出走した馬の出走当時のデータ
 レース数 = 8
 出走馬数 = 116

予想内容
 ◎ハヤヤッコ(0.417)
 ○エルモンストロ(0.383)
 ▲アヴァンセ(0.366)
 △ヴァイトブリック(0.332)
 △ハヤブサナンデクン(0.279)

※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


1、2番人気を軽視した予想…。
こういう予想が当たると、作っている甲斐もあるってモンですけどね。

重視されているパラメータが、騎手の新潟/距離別の成績だったり、父の新潟/距離別の成績だったりするので、本当にそれでいいのかと思っていたりしますが。

競馬予想(2019/8/3) 札幌11R 札幌日経OP(L)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは昨日と同じです。

・学習データ
 2011年から2018年に札幌で行われた芝2600mのオープン戦に出走した馬の出走当時のデータ
 レース数 = 13
 出走馬数 = 168

予想内容
 ◎ヴァントシルム(0.474)
 ○モンドインテロ(0.450)
 ▲ロードヴァンドール(0.440)
 △タイセイトレイル(0.437)
 △レノヴァール(0.400)

※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


順番は違いますが、1~3番人気を素直に(?)1~3番手評価しています。
少なめの10頭立てで◎が人気馬なら、◎からの買い目でもあたってほしいですが

競馬予想(2019/7/28) 札幌11R クイーンS(G3)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは昨日と同じです。

・学習データ
 2011年から2018年に札幌で行われたクイーンSに出走した馬の出走当時のデータ
 レース数 = 7
 出走馬数 = 89

 ※学習データ量(過去の出走頭数)が100切っている…さすがに少ない気がする。

予想内容
 ◎スカーレットカラー(0.553)
 ○フロンテアクイーン(0.513)
 ▲ダノングレース(0.506)
 △ミッキーチャーム(0.475)
 △エイシンティンクル(0.466)


直前の投稿なので、ほぼ予想内容のみ記載のやっつけ仕事で。

競馬予想結果(2019/7/20-21)

■函館日刊スポーツ杯
★★★ レース結果 ★★★
1着 ○ハウメア
2着 △ジョーマンデリン
3着 ▲ダノンジャスティス


実際の人気でも1-2-3番人気の堅い決着。
◎以外で評価値0.50を超えた3頭による決着でした。
今更思ったのは、予想方法の性質上、評価0.50を超える馬が3頭以上いるときは、その馬たちだけに印を打つべきってことです。
(4頭に絞れば、ワイド均等流しだろうが、ワイドBOX均等買いだろうが、プラスになっているので。)

■中京記念
★★★ レース結果 ★★★
1着 △グルーヴィット
2着  クリノガウディー(0.238、6番手評価)
3着 ◎プリモシーン


当ブログのコンセプト上、あたってはいますがトリガミです。

☆☆☆ 評価 ☆☆☆ (2019/5/4~)
方法はブログ紹介ページに記載。

1.複勝(通算105点)
 (1) 回収率:90%
 (2) 対確定人気比:1.11倍

2.ワイド(通算84点)
 (1) 回収率:57%
 (2) 対確定人気比:0.58倍

先週も書きましたが、ワイド◎流しにはどこかで見切りをつけます。
回収率も対確定人気比も悪くなる一方なので、予想結果の使い方として適切ではないと判断します。
夏競馬が終わったところで、一度リセットしようかな。

競馬予想(2019/7/21) 中京11R 中京記念(G3)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
使用しているパラメータは昨日と同じです。

・学習データ
 2012年から2018年に行われた(=施行条件が芝1600mになって以降の)中京記念に出走した馬の出走当時のデータ
 レース数 = 8
 出走馬数 = 111

予想内容
 ◎プリモシーン(0.558)
 ○カテドラル(0.536)
 ▲ジャンダルム(0.336)
 △キャンベルジュニア(0.300)
 △グルーヴィット(0.288)

※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


評価値0.50超過の馬が2頭いて、しかも3番手以下を突き放しているので、この2頭は堅そう、という評価します。
(あくまで3着以内に入る、という意味ですが。)
現実でも1、2番人気に推されてますが。
 
本当は、函館2歳Sでチャレンジしたかったのですが、地方での出走情報を一切取り込んでおらず、門別でしか走っていない馬とかの情報を取り込んでいないのでそもそも学習ができないのでした…。

とはいえ、地方のレース結果全て取り込むことは考えていないのですが、どうしたもんか。

競馬予想(2019/7/20) 函館11R 函館日刊スポーツ杯(3勝クラス)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
先週のものから、3着以内好走時の馬体重(上限、下限)との差分を学習パラメータとして追加してみました。

※追加したからといって、作成されるモデルの中でどの程度重要視されるかは、その時々で変わりますが。

・学習データ
 2011年から2018年に行われた、函館芝1200m 1600万下(現3勝クラス)に出走した馬の出走当時のデータ
 レース数 = 13
 出走馬数 = 184

予想内容
 ◎ナンヨーアミーコ(0.801)
 ○ハウメア(0.711)
 ▲ダノンジャスティス(0.657)
 △ジョーマンデリン(0.569)
 △スワーヴアーサー(0.434)

※2019/7/20 15:14 適用したモデルの間違いに気づいたので訂正。

※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


レースまでの時間がないので、コメントなし。
今年から降級馬がいなくなっているので、夏の間しばらくの間、好走馬の傾向は変わるのかもしれませんが、そういう観点は取り込んでいません。

競馬予想結果(2019/7/13-14)

競馬予想結果(2019/7/13-14)

■やまびこS
★★★ レース結果 ★★★
1着  ヒザクリゲ(0.24、7番手評価)
2着 ◎アスタースウィング
3着  メイショウアリソン(0.151、9番手評価)


2着馬◎に馬券圏外に沈んだ1番人気を外したまでは良かったですが、ヒモ抜けの形に。
悔しいですね。

■函館記念
★★★ レース結果 ★★★
1着  マイスタイル(0.306、7番手評価)
2着  マイネルファンロン(0.278、10番手評価)
3着  ステイフーリッシュ(0.317、6番手評価)


印をつけた5頭は1頭も3着以内に入らず。(最高は◎アメリカズカップの5着)
導入前目に付けた3頭で決まっていて、その中に印を打った馬が入っていなかったのでどうにもならないですね。

評価値0.27以上の馬3頭で決まったのはぎりぎり救いか。


☆☆☆ 評価 ☆☆☆ (2019/5/4~)
方法はブログ紹介ページに記載。

1.複勝(通算95点)
 (1) 回収率:92%
 (2) 対確定人気比:1.13倍

2.ワイド(通算76点)
 (1) 回収率:58%
 (2) 対確定人気比:0.60倍

この予想方法では、ワイド◎流しは厳しそうですね。
どこかでいったん区切りをつけて、評価方法を変更してリスタートした方が良いかな。

競馬予想(2019/7/14) 函館11R 函館記念(G3)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
考慮するパラメータは、先週と同じ。

・学習データ
 2011年から2018年に行われた、函館記念に出走した馬の出走当時のデータ
 レース数 = 8
 出走馬数 = 127

予想内容
 ◎アメリカズカップ(0.434)
 ○レッドローゼス(0.361)
 ▲メートルダール(0.349)
 △ゴールドギア(0.335)
 △ナイトオブナイツ(0.324)

※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


再現率は90%超。過学習気味かな、と思います。
先週のプロキオンSでは同じようなことを言いながら、◎○の馬はちゃんと3着以内に来ましたが。

モデル作成時の評価では、

・評価値0.46以上:全馬3着以内
・評価値0.27以下:全馬4着以下

なのですが、0.27~0.46の間は過去8年の出走馬にはそもそも該当馬なし。
で、今回の上位5頭の評価は全部上記の値の間。
なので、自信度合いの評価ができないです。

上位5頭の中に、5番人気以内は1頭のみの予想。
かなり攻めてます。

…中る気がしないですが(笑)