星の数だけ
ふと思ったけど、世の中にはどれくらいのデータがあるんだろうねー
星の数だけあるんじゃない?(うまい返しだな…)
つまりいくつ? それってナメック星や惑星ベジータも含まれるの?
うーん、それをだったら界王星も含めないと、、、ってなんか違う!
海賊王におれはなる!ただしデータの海で
ひとつなぎの大秘宝(ワンピース)を見つける旅が、競艇(ボートレース)のデータを分析することだって構わないと思います。
「自由にデータを取得して、自由に分析すればいいさ。そこで見つけたインサイトはキミだけのワンピースだ!」by テイモン
注: このセリフに特に意味はありません。
『コラボでGO!』シリーズも今回で3回目となりました。今回の『ずっとコラボでGO!』では、より多くのデータを取得することに焦点を当てます。
最初のシリーズで抽出した競走成績のデータは、ファイルに含まれるごく一部の情報に過ぎませんでした。今回は競走成績のファイルに含まれる全てのデータを抽出します。
また、ボートレースを分析する上で重要なデータの1つに「オッズ」があります。オッズデータが手に入れば期待値の計算に利用できますし、人気順に賭けた場合のシミュレーションや、各種指標のインパクトを分析する上で役に立つでしょう。
オッズデータはファイルとして提供されていないため、今回のシリーズでは過去のオッズデータをWebスクレイピングと呼ばれる手法で取得します。
環境準備
『コラボでGO!』シリーズは、ボートレースのデータ取得から分析までをGoogleのプラットフォーム上で行います。したがって、必要なものはインターネットに接続できるパソコンと、Googleのアカウントだけです。
データの取得にはPythonを用いますが、Google Colaboratory(通称コラボ)が提供するPythonの実行環境を利用するため、ローカル環境にPythonをインストールする必要はありません。
また、分析にはGoogleスプレッドシートを利用するので、Excelや分析用のアプリケーションを開く必要もありません。
それではデータの大海原へ帆を広げましょう。Let’s Boat Race 分析!