Pythonでデータを分析するまでのステップ

Pythonを使用してデータを分析するためには、大きく以下のステップを経る必要があります。

  1. Pythonを実行できる環境を整える
  2. データを適切な位置に配置する
  3. 結果を描画するためのプログラムを記述する

このページでは、1.と2.を解説します。3.は各ファイルの解説ファイルがありますので、そちらをご確認ください。もしファイルが存在していなかった場合は、ぜひ環境整備にご協力ください。

はじめに

Pythonを実行する環境を構築するには、少なくとも2つの方法があります。

A. 自分のパソコン内に環境を整備する。

B. Google Colaboratory(以下、Colab)を使用する。

A. 自分のパソコン内に環境を整備する

A. は継続してデータを分析する予定なら実行する方法です。ただ、長くなってしまうのと本質ではないので、ここでは詳細に説明しません。参考リンクを掲載しますので各自で環境を構築してください。分からない時は関連するキーワードで検索すると解決できます。

B. Colabを使用する

B. はGoogleが提供しているサービスを使用する方法です。

Colab(正式名称「Colaboratory」)では、ブラウザ上で Python を記述、実行できます。以下の機能を使用できます。

Colab は、学生からデータ サイエンティストAI リサーチャーまで、皆さんの作業を効率化します。詳しくは、Colab の紹介動画をご覧ください。下のリンクからすぐに使ってみることもできます。

記載があるように、環境構築が不要な点はとても嬉しいポイントです。また、他のGoogleのサービスと同様に共有も簡単に実行できるのも便利です。

しかし、あくまでもクラウド上で実行するものですので、IR関係のデータを分析できないという欠点もあります。

ただ、ここでは擬似的に作成したデータ(PAIRが提供するデータ)を使用して分析することを目的にしていますので問題ありません。

もし外部に公開してはいけない独自のデータを分析する場合には、必ずローカル環境を構築してください。