ずっとコラボでGO!(1)まだまだ取れる!データの大海原へ

星の数だけ

ふと思ったけど、世の中にはどれくらいのデータがあるんだろうねー

星の数だけあるんじゃない?(うまい返しだな…)

つまりいくつ? それってナメック星や惑星ベジータも含まれるの?

うーん、それをだったら界王星も含めないと、、、ってなんか違う!

海賊王におれはなる!ただしデータの海で

ひとつなぎの大秘宝(ワンピース)を見つける旅が、競艇(ボートレース)のデータを分析することだって構わないと思います。

「自由にデータを取得して、自由に分析すればいいさ。そこで見つけたインサイトはキミだけのワンピースだ!」by テイモン

注: このセリフに特に意味はありません。

『コラボでGO!』シリーズも今回で3回目となりました。今回の『ずっとコラボでGO!』では、より多くのデータを取得することに焦点を当てます。

最初のシリーズで抽出した競走成績のデータは、ファイルに含まれるごく一部の情報に過ぎませんでした。今回は競走成績のファイルに含まれる全てのデータを抽出します。

また、ボートレースを分析する上で重要なデータの1つに「オッズ」があります。オッズデータが手に入れば期待値の計算に利用できますし、人気順に賭けた場合のシミュレーションや、各種指標のインパクトを分析する上で役に立つでしょう。

オッズデータはファイルとして提供されていないため、今回のシリーズでは過去のオッズデータをWebスクレイピングと呼ばれる手法で取得します。

環境準備

『コラボでGO!』シリーズは、ボートレースのデータ取得から分析までをGoogleのプラットフォーム上で行います。したがって、必要なものはインターネットに接続できるパソコンと、Googleのアカウントだけです。

データの取得にはPythonを用いますが、Google Colaboratory(通称コラボ)が提供するPythonの実行環境を利用するため、ローカル環境にPythonをインストールする必要はありません。

また、分析にはGoogleスプレッドシートを利用するので、Excelや分析用のアプリケーションを開く必要もありません。

それではデータの大海原へ帆を広げましょう。Let’s Boat Race 分析!

タイトルとURLをコピーしました