Pythonを使用してデータを分析するためには、大きく以下のステップを経る必要があります。
このページでは、1.と2.を解説します。3.は各ファイルの解説ファイルがありますので、そちらをご確認ください。もしファイルが存在していなかった場合は、ぜひ環境整備にご協力ください。
Pythonを実行する環境を構築するには、少なくとも2つの方法があります。
A. 自分のパソコン内に環境を整備する。
B. Google Colaboratory(以下、Colab)を使用する。
A. は継続してデータを分析する予定なら実行する方法です。ただ、長くなってしまうのと本質ではないので、ここでは詳細に説明しません。参考リンクを掲載しますので各自で環境を構築してください。分からない時は関連するキーワードで検索すると解決できます。
B. はGoogleが提供しているサービスを使用する方法です。
Colab(正式名称「Colaboratory」)では、ブラウザ上で Python を記述、実行できます。以下の機能を使用できます。
- 環境構築が不要
- GPU に料金なしでアクセス
- 簡単に共有
Colab は、学生からデータ サイエンティスト、AI リサーチャーまで、皆さんの作業を効率化します。詳しくは、Colab の紹介動画をご覧ください。下のリンクからすぐに使ってみることもできます。
記載があるように、環境構築が不要な点はとても嬉しいポイントです。また、他のGoogleのサービスと同様に共有も簡単に実行できるのも便利です。
しかし、あくまでもクラウド上で実行するものですので、IR関係のデータを分析できないという欠点もあります。
ただ、ここでは擬似的に作成したデータ(PAIRが提供するデータ)を使用して分析することを目的にしていますので問題ありません。
もし外部に公開してはいけない独自のデータを分析する場合には、必ずローカル環境を構築してください。