競馬予想結果(2019/7/13-14)

競馬予想結果(2019/7/13-14)

■やまびこS
★★★ レース結果 ★★★
1着  ヒザクリゲ(0.24、7番手評価)
2着 ◎アスタースウィング
3着  メイショウアリソン(0.151、9番手評価)


2着馬◎に馬券圏外に沈んだ1番人気を外したまでは良かったですが、ヒモ抜けの形に。
悔しいですね。

■函館記念
★★★ レース結果 ★★★
1着  マイスタイル(0.306、7番手評価)
2着  マイネルファンロン(0.278、10番手評価)
3着  ステイフーリッシュ(0.317、6番手評価)


印をつけた5頭は1頭も3着以内に入らず。(最高は◎アメリカズカップの5着)
導入前目に付けた3頭で決まっていて、その中に印を打った馬が入っていなかったのでどうにもならないですね。

評価値0.27以上の馬3頭で決まったのはぎりぎり救いか。


☆☆☆ 評価 ☆☆☆ (2019/5/4~)
方法はブログ紹介ページに記載。

1.複勝(通算95点)
 (1) 回収率:92%
 (2) 対確定人気比:1.13倍

2.ワイド(通算76点)
 (1) 回収率:58%
 (2) 対確定人気比:0.60倍

この予想方法では、ワイド◎流しは厳しそうですね。
どこかでいったん区切りをつけて、評価方法を変更してリスタートした方が良いかな。

競馬予想(2019/7/14) 函館11R 函館記念(G3)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
考慮するパラメータは、先週と同じ。

・学習データ
 2011年から2018年に行われた、函館記念に出走した馬の出走当時のデータ
 レース数 = 8
 出走馬数 = 127

予想内容
 ◎アメリカズカップ(0.434)
 ○レッドローゼス(0.361)
 ▲メートルダール(0.349)
 △ゴールドギア(0.335)
 △ナイトオブナイツ(0.324)

※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


再現率は90%超。過学習気味かな、と思います。
先週のプロキオンSでは同じようなことを言いながら、◎○の馬はちゃんと3着以内に来ましたが。

モデル作成時の評価では、

・評価値0.46以上:全馬3着以内
・評価値0.27以下:全馬4着以下

なのですが、0.27~0.46の間は過去8年の出走馬にはそもそも該当馬なし。
で、今回の上位5頭の評価は全部上記の値の間。
なので、自信度合いの評価ができないです。

上位5頭の中に、5番人気以内は1頭のみの予想。
かなり攻めてます。

…中る気がしないですが(笑)

競馬予想(2019/7/13) 福島11R やまびこS(3勝クラス)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
考慮するパラメータは、先週と同じ。

・学習データ
 2011年から2018年に行われた、福島ダート1150mの1000万下に出走した馬の出走当時のデータ
 レース数 = 17
 出走馬数 = 269
 
少なくとも2011年から2018年には、福島ダート1150mでは1600万下(以上)のレースは行われていないようです
学習データを作成するときに「1600万条件以上」で検索をかけたところ、ヒットするレースは 1レースもありませんでした。
 
なので、条件的に一番近いと思われる、同コース1000万条件の過去データを学習用に使ってみました。
ひょっとしたら、他の競馬場のダート短距離1600万条件のレースを持ってきた方が合うのかもしれませんが、試してはいません。

予想内容
 ◎アスタースウィング(0.606)
 ○オーヴァーライト(0.553)
 ▲ハニージェイド(0.472)
 △タガノヴィッター(0.449)
 △バーニングペスカ(0.343)

※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


再現率は62%なので、それなりの精度のモデルだと考えています。

評価値が0.50を超えている馬はこのAIの予想だと「3着以内は堅い」という扱いになるので、今回の場合はアスタースウィング、オーヴァーライトの2頭が堅いということになります。
…本当か?

馬柱見てると、バーニングぺスカこそ3着以内なら堅い軸のように見えますが。
そこはクラスの壁があると評価しているのでしょうか。

競馬予想結果(7/6-7)

■五稜郭S
★★★ レース結果 ★★★
1着 ◎サトノガーネット
2着  カリビアンゴールド(0.215、13番手評価)
3着  マイハートビート(0.331、8番手評価)


当ブログで使っているAIでの予想だけを参考にすると取れないですね。
実際には1番人気-3番人気-4番人気の堅めの決着なので、馬連・3連複共に取りやすい馬券だったと思いますが。

■プロキオンS
★★★ レース結果 ★★★
1着  アルクトス(0.282、7番手評価)
2着 ◎ミッキーワイルド
3着 ○ヴェンジェンス


1番人気のマテラスカイを△止まりにした上で、◎○の(しかもともに3着以内は堅いと評価した)馬が2、3着に入ってきているので予想のコンセプトからするとそれなりにいい結果と見ています。


■七夕賞
★★★ レース結果 ★★★
1着  ミッキースワロー(0.259、10番手評価)
2着 ○クレッシェンドラヴ
3着 △ロードヴァンドール


今回のロードヴァンドールのように、現実2桁人気の馬をAIの5番手内評価で拾える、ってケースがそこそこあります。(評価を始めてからの17レースで4レース目)
その時に◎の馬が馬券圏内に来ているかどうかというと…あまり来てません。

ただ、◎以外の印をつけた馬は一緒に来ていたりします。
こういうのを見ていると、「ワイドBOX向きなのかな」と思ってしまいます。


☆☆☆ 評価 ☆☆☆ (2019/5/4~)
方法はブログ紹介ページに記載。

1.複勝(通算85点)
 (1) 回収率:95%
 (2) 対確定人気比:1.16倍

2.ワイド(通算68点)
 (1) 回収率:64%
 (2) 対確定人気比:0.67倍

競馬予想(2019/7/7) 中京11R プロキオンS(G3)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
考慮するパラメータは、先週と同じ。

学習データとしては、2012年から2018年のプロキオンSに出走した馬の出走当時のデータを採用しています。

 レース数 = 7
 出走馬数 = 108

予想内容
 ◎ミッキーワイルド(0.631)
 ○ヴェンジェンス(0.533)
 ▲キングズガード(0.461)
 △オールドベイリー(0.451)
 △マテラスカイ(0.394)

※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


モデル構築時の検証結果が、適合率100%はともかく再現率まで100%となっていることから、
過学習に陥っている疑いがありますが、まずは構築されたモデルを変にいじらずにいこうと思います。

で、予想結果についてですが、
「(評価値0.50超えている)ミッキーワイルド、ヴェンジェンスの2頭は3着以内は堅い」
と解釈します。

競馬予想(2019/7/7) 福島11R 七夕賞(G3)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
考慮するパラメータは、昨日と同じ。

学習データとしては、2012年から2018年の七夕賞に出走した馬の出走当時のデータを採用しています。

 レース数 = 7
 出走馬数 = 103


予想内容
 ◎ロシュフォール(0.361)
 ○クレッシェンドラヴ(0.338)
 ▲カフェブリッツ(0.329)
 △ロードヴァンドール(0.315)
 △ブラックスピネル(0.304)

※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


モデル構築時の評価を確認したところ、評価値=0.37あたりで実際の3着以内/4着以下がくっきり分かれています。
ですが今回は◎のロシュフォールでも0.36台なので、2012年以降の傾向に照らし合わせると3着以内に入りそうな馬がいないように見える…。

この予想ははっきりいうと「自信なし」です。

競馬予想(2019/7/6) 函館11R 五稜郭S(3勝クラス)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
考慮するパラメータは、先週と同じ。

学習データとしては、2012年から2018年の函館芝2000m、1600万下以上のクラスの出走した馬の出走当時のデータを採用しています。

 レース数 = 15
 出走馬数 = 216

明日は3場ともメインは3勝クラスなのでどこでやってみても良かったのですが、函館は夏のこの時期にしかレースがないことと、フルゲートで予想のし甲斐がある(?)(他のレースはともに8頭立て)ってことで、ブログに載せる予想としてはこれを選びました。

予想に使ったモデルが間違っていたので、予想やり直し。(2019/7/5 22:51)
予想内容
 ◎フィニフティ(0.496)
 ○サトノガーネット(0.461)
 ▲ニホンピロヘンソン(0.373)
 △ロライマ(0.369)
 △ドゥーカ(0.341)

※()内はpredict_probaで取得した、3着以内=Trueの確率
当ブログ内では評価値と呼ぶことにします。


・適合率1.00(モデル作成時の評価で、評価値0.50以上の馬は100% 3着以内に入っている)、
・再現率0.73(同、実際に3着以内に来た馬の内73%が評価値0.50以上とされている)

というモデルなので、評価値0.5以上の馬がいればその馬はかなり信頼度の高い3着以内候補といえるのですが…。
フィニフティがそれに近い評価を受けているので、信頼してみましょう。

<2019/7/6 15:05追記>
馬体重発表後に再度予想を実行したら、それなりに変わりました。

予想内容
 ◎サトノガーネット(0.469)
 ○フィニフティ(0.458)
 ▲ニホンピロヘンソン(0.385)
 △ロライマ(0.362)
 △ジャズファンク(0.343)

評価は馬体重発表後の予想で実施します。

競馬予想結果(2019/6/29-30)

週末に予想を掲載したレースについて、結果を別のエントリーとしてまとめて掲載していこうと思います。

(1) 函館11R TVh賞(3勝クラス)(2019/6/29)
★★★ レース結果 ★★★
1着  パラダイスガーデン(0.121、16番手評価)
2着 ◎ハウメア
3着  エスターテ(0.374、8番手評価)


確定人気でも低評価(14番人気)でしたが、AI評価では最低評価。
◎が1番人気ということもあり相手は絞りたいわけで…。
そうなると、当ブログとしては複勝以外の馬券を取るのは難しいですね。


(2) 福島11R ラジオNIKKEI賞(2019/6/30)
★★★ レース結果 ★★★
1着  ブレイキングドーン(0.171、9番手評価)
2着 ◎マイネルサーパス
3着  ゴータイミング(0.128、14番手評価)


こちらもブログで印をつけた馬の中では◎の馬のみ。
ただ、TVh賞と違って◎は9番人気だったことから、現実の馬券にする場合に、
「AIで得られた情報を参考にして手広く流す」という選択肢も視野に入ります。

となると、馬連はとれたかもなあ、といったのが筆者の感想。

1着のブレイキングドーンは重馬場の弥生賞で3着という実績もあり、
今日のような馬場であれば、連系馬券の馬券に入れる相手としておかしくはないので。


☆☆☆ 評価 ☆☆☆ (2019/5/4~)
方法はブログ紹介ページに記載。

1.複勝(通算70点)
 (1) 回収率:95%
 (2) 対確定人気比:1.26倍

2.ワイド(通算56点)
 (1) 回収率:67%
 (2) 対確定人気比:0.70倍

ワイド流しについては、今の評価方法(≒購入馬券のシミュレーション)だと回収率が低いのが嫌ですね。
対確定人気比よりも低いということは、単純に1番人気を軸に2~5番人気へのワイド均等流しを
続けている方が回収率がいいというわけなので。

複勝5点流しについては、回収率100%を割ってきてたものの、対確定人気比よりは優位を保っているので
今は良しとしましょう。

競馬予想(2019/6/30) 福島11R ラジオNIKKEI賞(G3)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。

考慮するパラメータとして、昨日のものから、「所属厩舎の東西(あるいは地方)」を追加しています。
 
学習データとしては、2012年から2018年のラジオNIKKEI賞に出走した馬の、
出走当時のデータを採用しています。

 レース数 = 7
 出走馬数 = 105

2011年の情報も使おうと思えば使えるのですが、この年のラジオNIKKEI賞は中山で実施されているので
学習データからは除外。

予想内容
 ◎マイネルサーパス(0.430)
 ○ブレイブメジャー(0.344)
 ▲ディキシーナイト(0.319)
 △ヒシイグアス(0.280)
 △ギルマ(0.274)
 
 ◎マイネルサーパスは現状9番人気。
 こういう予想をしたときに、◎に選んだ馬が3着以内に来てくれると、
 予想AI作って遊んでいるかいがあるのですが。
 

競馬予想(2019/6/29) 函館11R TVh杯(3勝)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
考慮するパラメータとして、前回のものから、父の距離別の成績(3着以内入着率)を追加してます。
 
学習データとしては、2012年から2018年の函館芝1200mのレースに出走した馬の、
出走当時のデータを採用しています。

せっかくブログ使って記録を残しているので、今回は検証の兼ねて2パターンで予想させてみます。

(1)過去の函館芝1200m 1600万下(現3勝クラス)のみを学習データとして採用。
 レース数 = 12
 出走馬数 = 170

予想内容
 ◎ハウメア(0.695)
 ○ニホンピロヘンソン(0.514)
 ▲マイネルパラディ(0.497)
 △ホウオウカトリーヌ(0.465)
 △スワーヴアーサー(0.425)
 
 再現率81%のモデルです。
 これまで、同じクラスのレースの情報を学習データとして利用して予想した結果を多く載せてきた
 こともあり、累積評価に加算するのはこちらの結果とします。
 
(2)過去の函館芝1200m 1600万下(現3勝クラス)以上を学習データとして採用。
 レース数 = 29
 出走馬数 = 405
 
 ◎ニホンピロヘンソン(0.464)
 ○ハウメア(0.458)
 ▲マイネルパラディ(0.394)
 △レコードチェイサー(0.386)
 △ホウオウカトリーヌ(0.384)

 こちらは、再現率65%のモデルで、上よりは少し落ちます。
 ですが、()内の値が0.39以上あれば、ほぼ3着以内には来てます。
 
 上位評価される顔ぶれは(1)でも(2)でもそんなに変わらないですね。

【結果反映】競馬予想(2019/6/22) 函館11R 大沼S(L) 

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
考慮するパラメータは、6/8から変えていません。
 
学習データとしては、2012年から2018年の函館ダート1700mのオープン以上のレースに出走した馬の
出走当時のデータを採用しています。
実質的には、大沼SとマリーンSのデータになります。

 レース数 = 15
 出走馬数 = 186

予想内容
 ◎フュージョンロック(0.334)
 ○ハイランドピーク(0.303)
 ▲ジョーストリクトリ(0.299)
 △ロードゴラッソ(0.257)
 △ドライヴナイト(0.257)

※()内はpredict_probaで取得した、3着以内=Trueの確率

一番評価が高くても3着以内確率0.33の評価。
今のAIで使っている過去の傾向情報からする、これといって自信を持って推せる馬がいないということに
なりますが結果は果たして…?

★★★ レース結果 ★★★
1着  リアンヴェリテ(0.225、8番手評価)
2着 △ロードゴラッソ
3着  プレスティージオ(0.201、9番手評価)


予想的にはかすりもせず、ってとこですね。
確定人気2-1番人気で決まったのに。

ただ、せっかくAI作ってるからには、1-2番人気の馬連をとるよりも、プレスティージオのような人気薄の3着を
拾える頻度を上げたいなあ、と思っていたりします。

☆☆☆ 評価 ☆☆☆ (2019/5/4~)
方法はブログ紹介ページに記載。

1.複勝(通算55点)
 (1) 回収率:99%
 (2) 対確定人気比:1.33倍

2.ワイド(通算44点)
 (1) 回収率:78%
 (2) 対確定人気比:0.87倍

競馬予想(2019/6/9) 阪神11R マーメイドS(G3)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
考慮するパラメータは、6/8から変えていません。
 
学習データとしては、2012年から2018年のマーメイドSに出走した馬の出走当時のデータを採用しています。

 レース数 = 7
 出走馬数 = 99

予想内容
 ◎ダンサール(0.394)
 ○フローレスマジック(0.386)
 ▲クィーンズベスト(0.374)
 △センテリュオ(0.325)
 △モーヴサファイア(0.297)

※()内はpredict_probaで取得した、3着以内=Trueの確率

モデル/検証時の結果では、以下の通りでした。

3着以内=Trueの確率が0.395以上…全馬実際に3着以内(24頭)
3着以内=Trueの確率が0.377以上…全馬実際に4着以下(75頭)

この結果を踏まえると、馬券的には「◎ダンサールから手広く流すのがいいのかな」という印象です。


★★★ レース結果 ★★★
1着  サラス(0.256、7番手評価)
2着  レッドランディーニ(0.244、8番手評価)
3着  スカーレットカラー(0.292、6番手評価)


予想的には完敗…。
当ブログには5番手までを掲載することにしているのですが、その直下の3頭で決まるとか、
何の当てつけでしょうか。
こういうレースに対しても、それなりに格好がつく予想ができるようにしたいものです。

☆☆☆ 評価 ☆☆☆ (2019/5/4~)
方法はブログ紹介ページに記載。

1.複勝(通算55点)
 (1) 回収率:106%
 (2) 対確定人気比:1.40倍

2.ワイド(通算44点)
 (1) 回収率:85%
 (2) 対確定人気比:0.95倍

競馬予想(2019/6/8) 阪神11R 天保山S(OP) 【結果反映】

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
特徴量(予想パラメータ)として、当該競馬場・馬場(芝/ダート)での騎手の成績を追加しました。

※そういえば、当日の馬場状態が予想パラメータに入っていないような…。


学習データとしては、2012年から2018年の阪神ダート1400m(1600万条件以上)に出走した馬の、
出走当時のデータを採用しています。

 レース数 = 71
 出走馬数 = 1023

予想内容
 ◎ファッショニスタ(0.603)
 ○ヴェンジェンス(0.505)
 ▲ダノンフェイス(0.426)
 △フュージョンロック(0.426)
 △サヴィ(0.404)

※()内はpredict_probaで取得した、3着以内=Trueの確率

再現率が53%と、今までに作ってきたモデルの中では、かなり再現率の高いモデルになっています。

また、3着以内=Trueの確率が0.50を超えていれば、96%(130頭/135頭)という高い比率で
実際に3着以内に入ってきています。

これを踏まえると、ファッショニスタ、ヴェンジェンスはかなり高い確率で3着以内に来るのではと見ています。
…人気しそうな2頭なので面白い予想ではないですね。

ハイパーパラメータ変更して、再現率がより高いモデルができたので、そのモデルでの予想も載せておきます。

予想内容(2)
 ◎ファッショニスタ(0.649)
 ○ヴェンジェンス(0.507)
 ▲ダノンフェイス(0.471)
 △ヌーディーカラー(0.427)
 △テーオーヘリオス(0.425)

3番手評価までは変わらずです。やっぱり、ファッショニスタ、ヴェンジェンスは堅いか。

せっかくなので、評価はいま掲載した、「再現率がより高いモデル」の方でやります。


★★★ レース結果 ★★★
1着 ○ヴェンジェンス
2着 ◎ファッショニスタ
3着  スマートアヴァロン(0.181、10番手評価)


馬連的で買えば本線的中といえますね。
本命サイドの決着ではあるものの、作ったモデルの正しさが検証される形となったのは嬉しいです。

3着のスマートアヴァロンは…、拾うのは厳しかったと思います。(どちらのモデルでも下位評価)
取れるとすれば、上の予想結果を見て、
「◎○は堅い2頭軸と決めた上で残りの1頭は少し広めにとった3連系の馬券にする」
でしょうか。

☆☆☆ 評価 ☆☆☆ (2019/5/4~)
方法はブログ紹介ページに記載。

1.複勝(通算50点)
 (1) 回収率:116%
 (2) 対確定人気比:1.57倍

2.ワイド(通算40点)
 (1) 回収率:94%
 (2) 対確定人気比:0.95倍

競馬予想(2019/6/2) 東京11R 安田記念(G1) 【結果反映】

競馬予想(2019/6/2) 東京11R 安田記念(G1)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
モデルの作り方の中心となるところは、先週と変えていません。
 
学習データとしては、2012年から2018年の安田記念に出走した馬の、出走当時のデータを採用しています。
※なお、現状では、海外・地方レースの経験に関しては一切考慮に入れられていません。

 レース数 = 7
 出走馬数 = 112

予想内容
 ◎モズアスコット(0.566)
 ○インディチャンプ(0.402)
 ▲アーモンドアイ(0.402)
 △アエロリット(0.383)
 △ダノンプレミアム(0.363)

※()内はpredict_probaで取得した、3着以内=Trueの確率

学習(モデル作成)時の評価では、確率0.42以上と評価された馬(23頭)は実際には全て3着以内。

それ以下の馬は実際には全て4着以下という結果になっています。
ただし、実際の4着以下の評価は、高くても確率0.30でした。
そして、今回の予想モデルで評価した明日の6番手はロジクライで確率評価は0.26。

以上から、、
・3着以内という観点で、モズアスコットが堅い軸。
・相手も○~△の4頭で堅いのでは。
という見解になるかと。


★★★ レース結果 ★★★
1着 ○インディチャンプ
2着 △アエロリット
3着 ▲アーモンドアイ


印的にはタテ目での決着となりました。
見解は半分あたりで半分はずれ、といったところでしょうか。
これで◎が来てりゃ、言うことはないんですが。


レース後、コース上で騎手が下馬していたダノンプレミアムが心配です…。
スタート直後に少し変な動きになったし、そこで既に脚を痛めたりしていたのかも?

アーモンドアイはスタートで不利を食らった中、よく3着まで来たと思います。


☆☆☆ 評価 ☆☆☆ (2019/5/4~)
方法はブログ紹介ページに記載。

1.複勝(通算45点)
 (1) 回収率:123%
 (2) 対確定人気比:1.62倍

2.ワイド(通算36点)
 (1) 回収率:95%
 (2) 対確定人気比:0.94倍

競馬予想(2019/6/1) 阪神11R 鳴尾記念(G3)  【結果反映】

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
モデルの作り方の中心となるところは、先週と変えていません。

今回は3つのモデルで予想させてみました。
といっても、モデルを作る際に利用するパラメータは変えず、学習データに何を使うかを
変化させただけなので、3つのモデル間に根本的な違いがあるとは言えないです。

①学習データとして、2013年から2018年の、「阪神芝2000m・3歳以上・1600万条件以上」
 レースに出走した馬の、出走当時のデータを採用した場合

 レース数 = 40
 出走馬数 = 510

予想内容
 ◎メールドグラース(0.50)
 ○ギベオン(0.48)
 ▲タニノフランケル(0.42)
 △プラチナムバレット(0.37)
 △ステイフーリッシュ(0.36)
 
②学習データとして、2013年から2018年の、「阪神芝2000m・3歳以上・オープン以上」
 レースに出走した馬の、出走当時のデータを採用した場合

 レース数 = 40
 出走馬数 = 259

予想内容
 ◎メールドグラース(0.50)
 ○ギベオン(0.45)
 ▲ステイフーリッシュ(0.40)
 △タニノフランケル(0.37)
 △プラチナムバレット(0.30)
 
③学習データとして、2013年から2018年の、「鳴尾記念」に出走した馬の、出走当時のデータを採用した場合

 レース数 = 6
 出走馬数 = 73

予想内容
 ◎ギベオン(0.64)
 ○メールドグラース(0.540)
 ▲タニノフランケル(0.535)
 △プラチナムバレット(0.49)
 △ブラックスピネル(0.36)

※()内はpredict_probaで取得した、3着以内=Trueの確率

9頭立てと、出走頭数が少なめであることも影響しているかとは思いますが、上位評価している馬は
3つのモデルの間にそれほど大きな差異はありません。

ギベオン、メールドグラースの2頭を中心として、その次がタニノフランケルとプラチナムバレット。
違いがあるのは、残りの1頭をステイフーリッシュにするか、ブラックスピネルにするか。


今回、3つの結果を紹介しましたが、通算成績に反映させるのは、②で予想した結果とします。
レースの格として今回の予想対象レースにより近いものが多く含まれており、
なおかつ、それなりに学習データ数があったためです。


★★★ レース結果 ★★★
1着 ◎メールドグラース
2着  ブラックスピネル
3着 △ステイフーリッシュ


3つのモデルで予想してみましたが、選ばれた馬が似たり寄ったりだったせいもあり
予想としては、微妙な結果のものが3つ並んだだけでした。

今の回収率評価ルールを判断基準とすると、1着馬に◎を打てた上で3着馬は拾えている①②の方が
良いということになりそうですが。

☆☆☆ 評価 ☆☆☆ (2019/5/4~)
方法はブログ紹介ページに記載。

1.複勝(通算40点)
 (1) 回収率:122%
 (2) 対確定人気比:1.76倍

2.ワイド(通算32点)
 (1) 回収率:107%
 (2) 対確定人気比:1.17倍

競馬予想(2019/5/26) 東京11R 東京優駿(G1)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。
モデルの作り方の中心となるところは、先週と変えていません。

学習データとして採用したのは、2011年から2018年のダービーに出走した馬の、
ダービー出走時のデータです。

 レース数 = 8
 出走馬数 = 141

予想内容
 ◎ダノンキングリー(0.56)
 ○サートゥルナーリア(0.43)
 ▲ヴェロックス(0.42)
 △ロジャーバローズ(0.38)
 △ランフォザローゼス(0.37)

※()内はpredict_probaで取得した、3着以内=Trueの確率

サートゥルナーリアを高く評価するかと思ってましたが、
3着以内に来る確率という点ではダノンキングリーが上という評価に。
しかも、結構離してます。

とはいえ、モデル作成における学習/評価時の結果を見ると、
確率0.40以上と評価した馬まではほぼすべて(26頭中25頭)3着に来ているので、
この傾向に従えば、結局人気3頭で堅そうというところでしょうか。

(ちなみに、唯一3着を外した馬はリアルスティール(2015年4着)でした。)


なお、「過去8年分の情報なのに3着以内が24(=3×8)頭を超えて」いますが、、
これは学習データを扱う際、「3着以内の定義」を「実際に3着以内に来た馬+3着馬とタイム差なし」
としているためです。

例えば、2013年は5着馬まで、2014年は4着馬までを「3着以内」扱いで学習/評価をしています。


★★★ レース結果 ★★★
1着 △ロジャーバローズ
2着 ◎ダノンキングリー
3着 ▲ヴェロックス


ブログで記録をつけ始めてから、初めての会心の当たりです。(^^♪
◎が連に入った上での、上位評価5頭までで3着以内を独占。
しかも、人気薄の馬も拾えている。いうことはありません。

惜しむらくは、今日のレースでは実際の馬券は買っていなかったところ。
参考にして買っていれば、ワイドや3連複は取れていたと思います。


☆☆☆ 評価 ☆☆☆ (2019/5/4~)
方法はブログ紹介ページに記載。

1.複勝(通算35点)
 (1) 回収率:132%
 (2) 対確定人気比:2.08倍

2.ワイド(通算28点)
 (1) 回収率:112%
 (2) 対確定人気比:1.57倍

競馬予想(2019/5/25) 京都11R 葵(G)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる
予想です。
モデルの作り方の中心となるところは、先週と変えていません。

学習データとして採用したのは、2011年から2018年に京都競馬場で実施された、
3歳限定500万以上の芝1200m戦に出走した馬の、出走時のデータです。

 レース数 = 25
 出走馬数 = 362

予想内容
 ◎ディープダイバー(0.45)
 ○ケイアイサクソニー(0.41)
 ▲アスターペガサス(0.40)
 △アウィルアウェイ(0.353)
 △ディアンドル(0.351)

※()内はpredict_probaで取得した、3着以内=Trueの確率

比較的人気どころを抑えている感じでしょうか。

モデル作成時の評価では、確率0.37以上した馬のほとんどは実際に3着までに入ってきています。
(該当馬80頭中、78頭が実際に3着以内。)

確率0.31~0.37までに評価されて、実際に3着以内に来たのが半々ぐらい。
0.31未満は皆無。

これだけ見ると、今回は◎○▲まででかなり堅いという話になって、
他に3着以内に来るかも、といえるのは上記以外にメイショウケイメイとタマモメイトウの2頭と
なるのですが、結果は果たして…?

★★★ レース結果 ★★★
1着 △ディアンドル
2着 ▲アスターペガサス
3着 △アウィルアウェイ


4着、5着が◎○だったので、5連複なら1点的中(苦笑)
3連複5頭BOXで91倍が取れれば、馬券的には御の字ですね。

今回に関しては、馬のチョイスはよくできていたと思います。

☆☆☆ 評価 ☆☆☆ (2019/5/4~)
方法はブログ紹介ページに記載。

1.複勝(通算30点)
 (1) 回収率:109%
 (2) 対確定人気比:1.80倍

2.ワイド(通算24点)
 (1) 回収率:32%
 (2) 対確定人気比:0.47倍

競馬予想(2019/5/19) 東京11R 優駿牝馬(G1)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。

学習データとして採用したのは、2011年から2018年のオークスに出走した馬の出走時のデータです。

 レース数 = 8
 出走馬数 = 142

予想内容
 ◎クロノジェネシス(0.70)
 ○シゲルピングダイヤ(0.67)
 ▲ビーチサンバ(0.440)
 △ダノンファンタジー(0.439)
 △フェアリーポルカ(0.36)

※()内はpredict_probaで取得した、3着以内=Trueの確率

桜花賞の上位組を上位評価しています。
ここに出てきていない上位人気馬だと、ラヴズオンリーユーが9番手評価(0.26)、
コントラチェックが7番手評価(0.32)。
なので、このAIの結果に従うと手を出しづらいですね。

モデル作成時の評価では、確率0.19(※)と評価した馬まで実際には3着以内に来ているので、
信頼性は低いモデルになっているかもしれません。
(※バウンスシャッセ、2011年3着。
  フラワーC 1着→皐月賞11着という、サンプル数が少ないローテーションで来ていることから、
  うまく学習できていないのかも。)


また、確率0.25~0.50程度の評価を出している馬でも、実際には50%程度は馬券に絡んでいる模様。
そうなると、上記2頭+エールヴォア、シャドウディーヴァまでの9頭が対象に含まれてしまいます。
さすがに9頭は多いですね・・・。



★★★ レース結果 ★★★
1着  ラヴズオンリーユー(0.26、9番手評価)
2着  カレンブーケドール(0.23、11番手評価)
3着 ◎クロノジェネシス


◎が3着以内にきっちり来たことは救いですが、2頭軸のような予想の相方(シゲルピンクダイヤ)は
いいところなく12着という結果。
他にも上位評価されていたビーチサンバ、フェアリーポルカがそれぞれ15着、16着で
予想としては散々な結果といえるでしょう。

☆☆☆ 評価 ☆☆☆ (2019/5/4~)
方法はブログ紹介ページに記載。

1.複勝(通算25点)
 (1) 回収率:84%
 (2) 対確定人気比:1.39倍

2.ワイド(通算20点)
 (1) 回収率:38%
 (2) 対確定人気比:0.62倍

競馬予想(2019/5/18) 京都11R 平安S(G3)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる予想です。


学習データとして採用したのは、2013年から2018年の京都ダート1900mのオープン以上の
レースに出走した馬の出走時のデータです。
といっても、平安S以外に当てはまるのは、基本的にはアルデバランSだけ。
例外的に、昨年のJBCクラシックが入ってますが。

 レース数 = 13
 出走馬数 = 197

予想内容
 ◎チュウワウィザード(0.58)
 ○サンライズソア(0.55)
 ▲クイーンマンボ(0.40)
 △オメガパフューム(0.38)
 △ジョーダンキング(0.33)

※()内はpredict_probaで取得した、3着以内=Trueである確率


実際に3着に入った馬の、3着以内=Trueである確率の最低値は約0.34。
これを信じれば、馬券圏内はオメガパヒュームまでの4頭ということになります。

結果は果たして…?

n_estimators(決定木の数)は100、パラメータ数は71でやってます。


★★★ レース結果 ★★★
1着 ◎チュウワウィザード
2着  モズアトラクション(0.09、13番手評価)
3着 △オメガパフューム


今の予想方法だと、多少手を広げたところで2着馬は拾えないですね…。
予想した5頭のうち◎を含む2頭が馬券圏内に来たものの、人気サイドの馬なので配当は低め。


☆☆☆ 評価 ☆☆☆ (2019/5/4~)
方法はブログ紹介ページに記載。

1.複勝(通算20点)
 (1) 回収率:97%
 (2) 対確定人気比:1.69倍

2.ワイド(通算16点)
 (1) 回収率:63%
 (2) 対確定人気比:1.00倍

競馬予想(2019/5/12) 東京9R 青竜S(OP)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる
予想です。
明日のメインはヴィクトリアマイルですが、はっきり「この馬たちがいい」という
結果が出なかったので、傾向がそれなりにはっきり出たレースをチョイスして
掲載してみます。

学習データとして採用したのは、2013年から2018年の2~3歳限定、500万条件以上の
東京ダート1600mに出走した馬の出走時のデータです。

 レース数 = 60
 出走馬数 = 870

予想内容
 ◎デュープロセス(0.52)
 ○ケイアイターコイズ(0.46)
 ▲デアフルーグ(0.44)
 △カフェクラウン(0.44)
 △ハヤヤッコ(0.43)

※()内はpredict_probaで取得した、3着以内=Trueの確率

★★★ レース結果 ★★★
1着 ◎デュープロセス
2着 ▲デアフルーグ
3着  ニューモニュメント


ようやく◎が勝利、馬連も◎▲でとれるという結果に。
人気サイドの結果なので、AIじゃなくても、と思ってしまうわけですが。

☆☆☆ 評価 ☆☆☆ (2019/5/4~)
方法はブログ紹介ページに記載。

1.複勝(通算15点)
 (1) 回収率:101%
 (2) 対確定人気比:2.10倍

2.ワイド(通算12点)
 (1) 回収率:23%
 (2) 対確定人気比:1.00倍

競馬予想(2019/5/11) 東京11R 京王杯SC(G2)

scikit-learnのRandomForestClassifierを利用して作成した予想モデルによる
予想です。

学習データとして採用したのは、2012年から2018年の京王杯SCの出走時点のデータで、
 レース数 = 6
 出走馬数 = 98
 
(学習データはもっと多くした方が良いんだろうな、きっと。)

予想内容
 ◎サトノアレス(0.60)
 ○キャナルストリート(0.46)
 ▲タワーオブロンドン(0.41)
 △ロードクエスト(0.38)
 △トゥザクラウン(0.35)

※()内はpredict_probaで取得した、3着以内=Trueの確率


なお、今回から、GridSearchCVで最適なハイパーパラメータを求める際の評価関数を
「実際に結果が3着以内だったケースの再現率(recall)」に変更しました。

今までは正解率(accuracy)で評価していたのですが、
正例(3着以内の馬)に比べて負例(4着以下の馬)の方が圧倒的に多い状況で
正解率で評価してしまうと、
「実際の4着以下」を4着以下と評価できるモデル(を作るためのハイパーパラメータ)が
選択されてしまう可能性もあると考えたためです。


★★★ レース結果 ★★★
1着 ▲タワーオブロンドン
2着  リナーテ
3着  ロジクライ


◎サトノアレスが出走除外となったこともありますが、印をつけた馬のうち馬券圏内に来たのは
最終的に1番人気に推されたタワーオブロンドンのみ。
なかなか的中といえる予想が出せないですね。

ただ、軸馬がレースに出ていないので、
このようなケースについては回収率の評価の対象外とすることにします。

競馬予想(2019/5/5) 東京11R NHKマイルC(G1)

アルゴリズムとしてはランダムフォレストを採用しています。
(scikit-learnのRandomForestClassifierを利用して実装)

学習データとして採用したのは、2012年から2018年のNHKマイルC出走馬の出走時点のデータで、
 レース数 = 7
 出走馬数 = 124

予想内容
 ◎グランアレグリア(0.57)
 ○アドマイヤマーズ(0.52)
 ▲クリノガウディー(0.41)
 △ヴァルディーゼル(0.33)
 △ワイドファラオ(0.30)

※()内はpredict_probaで取得した、3着以内=Trueの確率

実際の1、2番人気馬を少し抜けた1、2番手として評価しています。
3番手以下に人気薄を持ってきているので、ヒモ荒れ期待ってとこですかね。


ちなみに、学習/予測に関する機能は昨日の京都新聞杯からは変更なし。

そろそろ「中った~」という感覚の的中がほしいなあ。

★★★ レース結果 ★★★
1着 ○アドマイヤマーズ
2着  ケイデンスコール
3着  カテドラル

今日も◎は馬券対象外。
始めたばかりとはいえ、なかなかいい結果はでないですね…(T_T)

☆☆☆ 評価 ☆☆☆ (2019/5/4~)
方法はブログ紹介ページに記載。

1.複勝(通算10点)
 (1) 回収率:122%
 (2) 対確定人気比:2.84倍

2.ワイド(通算8点)
 (1) 回収率:0%
 (2) 対確定人気比:-

競馬予想(2019/5/4) 京都11R 京都新聞杯(G2)

アルゴリズムとしてはランダムフォレストを採用しています。
(scikit-learnのRandomForestClassifierを利用して実装)

学習データとして採用したのは、2012年から2018年の京都新聞杯出走馬の出走時点のデータで、
 レース数 = 7
 出走馬数 = 105

予想内容
 ◎ オールイズウェル(0.47)
 ○ ヒーリングマインド(0.35)
 ▲ ロジャーバローズ(0.33)
 △ レッドジェニアル(0.32)
 △ タガノディアマンテ(0.31)

※()内はpredict_probaで取得した、3着以内=Trueの確率

現時点での人気順とは少し違うものの、基本的に上位人気馬を上に評価してますね。


なお、先週から今週にかけて、AI機能の実装として以下を変更しています。

・学習時のハイパーパラメータの調整

・学習データにおける"3着以内"の定義変更
 結果3着以内
 → 結果3着以内+結果4着以下で3着馬と同タイム

・性別を学習/予想時に考慮させないケースの追加
 牝馬限定戦の場合のみ
 → 牝馬限定戦+実質的に牡馬限定戦(あるいはそれに近い状態)になっているレース(※)

  ※ですが、例えば、今回予想の対象としている京都新聞杯が該当します。
  (少なくとも、2012年以降は牝馬の出走はありません。)

  おそらく、2歳GIや3歳限定の重賞で、皐月賞・ダービー・菊花賞につながっていくようなレースが
  該当することになると思います。

★★★ レース結果 ★★★
1着 △レッドジェニアル
2着 ▲ロジャーバローズ
3着  サトノソロモン

△で11番人気は拾えているものの、◎が3着以内にいなきゃ意味が薄いですね。


☆☆☆ 評価 ☆☆☆ (2019/5/4~)
方法はブログ紹介ページに記載。

1.複勝
 (1) 回収率:202%
 (2) 対確定人気比:4.59倍

2.ワイド
 (1) 回収率:0%
 (2) 対確定人気比:-

競馬予想(2019/4/29) 新潟11R 新潟大賞典(G3)

アルゴリズムはランダムフォレスト。

学習データとして採用しているのは、2013年から2018年の新潟大賞典出走馬の出走時点のデータ。
 レース数:6
 出走馬数:96

◆新潟11R 新潟大賞典(G3)
 ◎ ロシュフォール(0.70)
 ○ アストラエンブレム(0.61)
 ▲ スズカデヴィアス(0.42)
 △ メールドグラース(0.36)
 △ ダッシングブレイズ(0.2748)
 △ メートルダール(0.2745)

※()内はpredict_probaで取得できる、3着以内=Trueの確率

5番手と6番手でほとんど差がなかったので、本日は6番手まで掲載。
◎ロシュフォールと○アストラエンブレムが抜けた評価になってます。

ちなみに、このレースから各馬の右回り/左回りの競走実績を特徴量に
含めるようにしています。
(なぜ今までいれていなかったのか…。)

★結果
1着 △メールドグラース
2着  ミッキースワロー
3着 ◎ロシュフォール


微妙な結果。

馬連はどうあがいても外れ。
ただ、そもそも3着以内に来るかどうかを評価していて、最上位評価の馬は3着以内にちゃんと来ている。
(1番人気ですが)
で、◎から相手5頭にワイド流しすれば当たればプラスになるようにもなっている。

評価軸ちゃんと決めないとなあ…。

競馬予想(2019/4/28) 東京11R スイートピー(L)

自作AIでの競馬予想。
※自作AIでの予想方法は常に変わっていきます。

アルゴリズムはランダムフォレスト。(scikit-learnのRandomForestClassifierを利用)
学習データとして採用しているのは、2012年から2018年のスイートピー出走馬の出走時点のデータ。
 レース数:7
 出走馬数:110

3着以内に来る確率が高いと予想された順に最大上位5頭までを掲載します。


◆東京11R スイートピー(L)
 ◎ セリユーズ(0.77)
 ○ クールウォーター(0.63)
 ▲ シャワークライム(0.59)
 △ ウインメルシー(0.57)
 △ シングフォーユー(0.53)

※()内はpredict_probaで取得できる、3着以内=Trueの確率


昨日の青葉賞と違って堅めの予想。

なお、6番手のカレンブーケドールが3着以内=Trueの確率が0.48と出ており、5番手とは僅差。
さらに6番手と7番手に差が見られたので、気持ち的にはカレンブーケドールまで△をつけたいところ。

→最初の投稿時の予想時には特徴量に無意味な情報(開催時期)を含めてしまっていたため、
 この情報を削除した上で、学習/予想を再実行してみました。
 結果、5番手と6番手の差が開いたので、記事は訂正します。
 …再実行の結果が裏目に出なきゃいいですが。

★結果
1着  カレンブーケドール
2着 △シングフォーユー
3着 ◎セリユーズ



不要なはずのデータを削った結果とはいえ、絵に描いたように修正が裏目にでました。

もっとも、修正していなかったところで、単勝1倍台の圧倒的1番人気馬に◎を打った予想の結果が
△△◎では的中といえるかどうかは微妙。



ちなみに、今回のように過去○年の同レースに関する情報を学習データとして予想する限り、
開催情報を特徴量としては採用するつもりはないです。

理由は、全出走馬が同じ情報を持つことになり、結果を左右する要素にはならないから。

競馬予想(2019/4/27) 東京11R 青葉賞

自作AIでの競馬予想。
※自作AIでの予想方法は常に変わっていきます。

アルゴリズムはランダムフォレスト。(scikit-learnのRandomForestClassifierを利用)
学習データとして採用しているのは、2013年から2018年の青葉賞出走馬の出走時点のデータ。
 レース数:6
 出走馬数:97

3着以内に来る確率が高いと予想された順に最大上位5頭までを掲載します。


◆東京11R 青葉賞
 ◎ リオンリオン(0.53)
 ○ バラックパリンカ(0.319)
 ▲ タイセイモナーク(0.315)
 △ アドマイヤスコール(0.27)
 △ マコトジュズマル(0.24)

※()内はpredict_probaで取得できる、3着以内=Trueとなる確率


かなりの穴予想となりました。

人気のランフォザローゼス、ウーリリの評価は(今回作ったモデル上では)低かったですが、
結果は果たして…?


★結果
1着 ◎リオンリオン
2着  ランフォザローゼス
3着  ピースワンパラディ


◎をつけたリオンリオン(5番人気)が1着に来ただけでも良しとするかな…。

競馬予想(2019/4/21) 東京10R

基本的な予想方法は1つ前のエントリーと同じ。

アルゴリズムはランダムフォレスト。
学習データとして採用しているのは、2013年から2018年に実施された東京ダート1400m、1600万条件以上。
(サンプル:66レース、延べ1021頭)

3着以内に来る確率が高いと予想された順に最大上位5頭までを掲載します。


◆東京10R 鎌倉S
 ◎ ルッジェーロ
 ○ ドリュウ
 ▲ フュージョンロック
 △ ビックリシタナモー
 △ ミックベンハー


結果
 1着(▲) フュージョンロック
 2着( ) ハルクンノテソーロ
 3着( ) グロワールシチー


レース自体は堅く収まる中、上位5頭内で予想した馬の3着以内は1頭だけ。
まだまだ改善していかないと。

競馬予想(4/21)

自作AIでの競馬予想。
※自作AIでの予想方法は常に変わっていきます。

アルゴリズムはランダムフォレスト。
学習データとして採用しているのは、2013年から2018年のフローラS出走馬の出走時点のデータ。

3着以内に来る確率が高いと予想された順に最大上位5頭までを掲載します。


◆東京11R フローラS
 ◎ フェアリーポルカ
 ○ ペレ
 ▲ エトワール
 △ エアジーン
 △ クラサーヴィツァ

結果
 1着  ウィクトーリア
 2着  シャドウディーヴァ
 3着  ジョディー

 5頭選んで3着以内なし。最高でも◎フェアリーポルカの5着までで大外れ。
 う~ん、どうしたもんか。

◆京都11R マイラーズC
 ◎ダノンプレミアム
 ○インディチャンプ
 ▲パクスアメリカーナ
 △モズアスコット

 ※上位4番手までと5番手の評価の差が大きいため、上位4頭までを掲載。

結果
 1着 ◎ダノンプレミアム
 2着  グァンチャーレ
 3着 ▲パクスアメリカーナ

 今見たら、5番手評価はグァンチャーレ。
 ただ、予想時点で切った以上、外れたことには変わらず。