金食い虫
ねぇ、テイモン。ボートレースのデータを分析したいんだけど、
どうすればいいのか教えてくれない?
いくらくれる??
、、、10円な
前回までのあらすじ
なぜかキョーコのやる気を削いでしまうテイモン。。。
さて、前回の『コラボでGO!』シリーズでは、Google Colaboratoryを利用してPythonのスクリプトを実行し、ボートレースの公式サイトから自動で競争成績をダウンロードしました。
それだけでなく、ダウンロードしたファイルを解凍し、CSV化し、おまけにGoogleスプレッドシートでピボットテーブルを作成して簡単な分析まで行いました。
すべてGoogle先生のプラットフォーム上で行い、ローカル環境(PC)には何もインストールしていません。ブラウザさえあればいつでもどこでも分析環境が整うなんて、いい時代になりましたね。
前回はPythonのスクリプトをコピーして実行するだけで競走成績のデータを取得できるようにしたので、プログラミングが初心者の人でも取り組めたのではないでしょうか。
なにが「もっと」なのか
前回はレース結果を分析することに焦点を当てました。その時に使ったスクリプトがあれば、出目の違いをレース場やレース回といった切り口で分析できます。ちなみに前回はこんなデータを取得しました。
このデータがあれば、インが強いレース場を見つけたり、特定の組み合わせで買い続けた場合の回収率も計算できるため、競走成績のデータは応用範囲がとても広いと言えます。
しかし、レース結果を予想するときに使うデータはこれだけではありませんね。レーサーの級別や2連対率などの指標は、競走成績のファイルにはありません。それらは「番組表」と呼ばれるファイルに入っています。
今回の『もっとコラボでGO!』シリーズでは、ボートレースの結果を予想するための指標を番組表から抽出し、競走結果と結びつけることにチャレンジします。また、データを抽出するときの工夫や、例外的なデータが入ったときの対処の仕方などについても説明していきます。
ボートレースのデータ分析を「もっと」楽しむためのスキルを身につけていきましょう。
事前準備
コラボでGO!シリーズは、すべてGoogleのプラットフォーム上で完結できるように構成しています。したがって、必要なものは次の2つだけです。
- Googleのアカウント
- Googleにログイン可能なパソコン
スマホやタブレットでも動くかもしれませんが、操作性の問題からなるべくPCを使うようにしましょう。インストールやダウンロードは行わないため、共用のPCでも問題ないでしょう。
それでは、Let’s BOAT RACE 予想!
更新履歴
2020/11/23: 文言修正