【第2回】【初心者向け】Google ColabとDriveを連携しCSVファイルを読み書きする方法を画像付きで解説

csv

Google Colabでデータ分析を行う際、Google Driveに保存したCSVファイルを読み込んだり、編集して保存したりする場面が多くあります。
そこで本記事では、Google ColabとGoogle Driveを連携して、CSVファイルを簡単に読み書きする方法をステップごとにわかりやすく解説します。

🔰 Google Colabの基本的な使い方については、前回の記事をご覧ください。
👉
【第1回】【初心者向け】Pythonの実行環境を比較!Colab・Anaconda・インストールの違いと使い方


例えば、Google Drive(MyDrive)に保存されている height_weight.csv というCSVファイルを、Colabノートブック height_weight.ipynb から読み込むケースを使って説明していきます。

ステップ①:Google DriveをGoogle Colabにマウント(接続)する

まずはGoogle DriveをGoogle Colabにマウント(接続)します。以下のコードを実行することで、ColabからGoogle Drive内のファイルにアクセスできるようになります。「このノートブックにGoogleドライブのファイルへのアクセスを許可しますか?」と表示されたら、「Googleドライブに接続」をクリックしてください。

from google.colab import drive
drive.mount('/content/drive')
Google DriveをGoogle Colabにマウントする手順

ステップ②:pandasライブラリをインポートする

次に、CSVを読み込むために必要なpandasライブラリをインポートしましょう。

import pandas as pd

ステップ③:CSVファイルを読み込む

マウントが完了すると、Colab左側のファイルビューにGoogle Driveの内容が表示されます。
ファイルビューからたどり着いた「読み込みたいCSVファイル(ここでは height_weight.csv)」にマウスのカーソルをあてて、「右クリック」→「パスをコピー」を実行します。

CSVファイルをGoogle Colabから読み込む様子

次に、以下のコードを書くことで、csvファイルを読み込むことができます。pd.read_csvの最後の括弧書きは先ほどコピーしたパスになります。ちなみに、height_weight.csvは、名前・身長(cm)・体重(kg)の3列のデータです。

【失敗談】私自身、最初はファイルパスを正しく指定できず、何度も”No such file or directory”というエラーに悩まされました。Google Drive上で右クリックして「パスをコピー」することで、確実に正しいパスを貼り付けられると気付き、エラーが解決しました。

df = pd.read_csv('/content/drive/MyDrive/height_weight.csv')

ステップ④:読み込んだデータ(DataFrame)を出力する

df

このようにして、データの中身が全て表示されます。ただし、行数が多い場合は、df.head()を使うことで、先頭の5行のみを確認できます。これは画面が見づらくなるのを防ぐときに便利です。

読み込んだDataFrameの内容表示

ステップ⑤:CSVファイルとして保存する

続いて、編集したデータを新しいCSVファイル(例:height_weight2.csv)として保存するには、以下のように記述します。


df.to_csv('height_weight2.csv', index=False)

保存されたファイルはColabの一時ディレクトリに格納されます。そのため、必要に応じて右クリックから「ダウンロード」や、Google Driveに手動で移動することも可能です。
【体験談】私は最初、一時ディレクトリに保存したままセッションを終了してしまい、せっかく作成したCSVファイルが消えてしまいました。それ以降は、保存時に必ずGoogle Driveのパスを指定するようにしています。

補足: Colabでファイルを保存する場合、特に指定がなければ一時ディレクトリ(/content/)に保存されます。
しかしこの一時ディレクトリはセッション終了時に削除されるため、保存先をGoogle Drive内に変更するのがおすすめです。
たとえば:df.to_csv('/content/drive/MyDrive/height_weight2.csv') と記述することで、Google Driveにファイルを残すことができます。
【改善策】毎回MyDriveの明示的な保存先を指定しておくことで、ファイル損失のリスクをゼロにできます。

参考:全体のコードまとめ


# ① Google Driveをマウント
from google.colab import drive
drive.mount('/content/drive')

# ② pandasをインポート
import pandas as pd

# ③ CSVファイルの読み込み
df = pd.read_csv('/content/drive/MyDrive/height_weight.csv')

# ④ データ表示
df

# ⑤ CSVとして保存
df.to_csv('height_weight2.csv', index=False)

おわりに

本記事では、Google ColabとGoogle Driveを連携してCSVファイルを読み書きする方法を解説しました。
データ分析を行う上で、ファイルの取り扱いは基本的かつ重要なステップなので、ぜひ実践してみてください。
初めての方はうまくいかない場合もあるかもしれませんが、焦らずひとつずつ試してみてくださいね。継続が一番の上達のコツです。

✅ まとめ

  • Google ColabはGoogle Driveと連携することで、クラウド上でCSVファイルの読み書きが簡単に行えます。
  • 必要なのは、Googleアカウントのログインと、drive.mount()のコード実行だけ。
  • pandasを使えば、CSVの読み込み・表示・保存がとてもシンプルに。
  • 保存先は一時ディレクトリよりもGoogle Drive内のパスを指定するのが確実でおすすめ。
  • したがって、データ分析の第一歩として、「ファイルの読み書き」から始めてみましょう!

▲ ページトップへ戻る

コメント

タイトルとURLをコピーしました