【競馬予想で遊ぶ】データをできる限り増やしてみる

 

ディープラーニングで競馬予想をして遊んでいたのですが、なんとなく熱が冷めてしまいやめていました。

年度も変わり、元号も変わり、やる気もでてきたので、新しくやり直そうと思います。

やろうと思っていることは、

  • データをできる限り増やす
  • 様々なモデルを作って遊ぶ

まぁ、初めの目標はそれなりで、やっていくうちに次々とやるべきことが出てくるでしょう。

ということで

タイトルにもありますが、データを集めてみました。

さて、昨年度までは、16頭立てのレースを3,357レース分使って学習させていました。今度は気合を入れてスクレイピングしよう!と心に決め、16頭立てのレースを15,653レース分集めました。

これだけ集まれば、芝とダートのレースを、別々に学習させることが可能ですね。(今まではごちゃまぜにしていました…)

どこで飽きるか分かりませんが、ぼちぼち再出発をしました。開催日に予定が合えば、リアルタイム予想もしていこうと思っています。

2020年6月7日追記

データを増やしてから、少しは検証していました。が、競馬開催日の土日に自由な時間がなく、ほとんど進んでいませんでした。

本業はコロナの影響は皆無で、時間もつくれるようになってきたので、再び開始しようと考えています。

2回目の再開宣言…

まったくさぼっていたわけではなく、興味のあるところは追いかけていました。

具体的には、netkeibaでの予想販売についてです。このサイトでは、人工知能を用いて予想を販売している方がおられます。

的中率か回収率のどちらかを重視する形で、なぜか本年度は前者の回収率が高い現象がおきています。この記事をかいているときは、確か、前者回収率108%、後者回収率85%くらいだった気がします。これはめっちゃ面白いです。

なぜこんなことが起こるのか自分なりに考察しながら、自分の作業に注力したいと思います。