新宿からこんにちは

AIに聞いたことの備忘録

AIリテラシーをAIに教わる:応用編(Google Colabで実践)

前回、「どうにか無料で済ませたい」という我儘を言った結果、

ChatGPTのAdvanced Data AnalysisではなくGeminiGoogle Colaboratory (Colab) の連携で話を進めることにした。

 

Q1)それでは、先の「第1回:AI分析の基本作法と環境構築」について、Google Colabの使用を前提としての具体的な内容を展開してみてください。

はい、承知いたしました。
ツールをGoogle Colaboratory (Colab) + Gemini」の使用を前提として、研修カリキュラム第1回の内容を全面的に書き換えて展開します。無料から始められる実践的な内容に焦点を当てます。

 

中級AIカリキュラム 第1回:AI分析の基本作法と環境構築 (Google Colab版)

〜GeminiとColabで始める、無料からのデータ分析〜

■ 所要時間: 90分
■ 研修形式: 講義 + 個人ワーク
■ 準備物: PC(Googleアカウントにログイン済み)、サンプルデータファイル(CSV形式)

■ 学習目標:

  1. Gemini(分析コードの設計士)とGoogle Colab(実行環境)の役割分担を理解する。

  2. Colabの基本的な使い方(ノートブック作成、セルへのコード貼付、実行、ファイルアップロード)をマスターする。

  3. Geminiに生成させたコードをColabで実行し、データの概要把握(健康診断)ができるようになる。

研修シナリオ詳細(90分)

 

【パート1】 イントロダクション:あなたの分析業務、こう変わる (10分)

講師:
「皆さん、こんにちは。『データ分析・意思決定支援特化型コース』の第1回へようこそ。このコースでは、皆さんが日々向き合っているデータを、AIという強力な相棒と共に読み解いていく技術を学んでいきます。」

「(前回同様、従来の分析業務の課題を提示し...)AI時代の分析は、このプロセスを劇的に変えます。面倒な作業はAIに『設計図』を書いてもらい、私たちは『何を分析すべきか』という本質的な『問い』に集中する。そんな未来の仕事術を、今日はGoogleのツールを使って、しかも無料で始められる方法を学びます。」

 

【パート2】 主役ツールの紹介:Gemini (設計士) と Colab (調理場) (25分)

講師:
「今日から皆さんの相棒になるのは、2つのGoogleサービスです。この二人の役割分担を理解することが、最初の最も重要なポイントです。」

(スライド表示:GeminiとColabの役割分担の図)

  1. Gemini (旧Bard): “優秀な設計士・翻訳家”

    • 役割: 私たちの「日本語の指示」を、コンピュータが理解できる「Pythonというプログラミング言語のコード(設計図)」に翻訳してくれます。

    • 特徴: 私たちはPythonを知らなくても、日本語で「〇〇をしたい」と伝えるだけでOKです。

  2. Google Colaboratory (Colab): “高性能な厨房・調理場”

    • 役割: Geminiが作った設計図(コード)を実行し、実際のデータ(食材)を調理する場所です。

    • 特徴: 高性能なコンピュータをブラウザ上から無料で借りられるサービスです。データ分析に必要な包丁や鍋(専門ライブラリ)も全て揃っています。

講師:
「つまり私たちのワークフローは『①Geminiにレシピ(コード)を考えてもらい → ②Colabという厨房にそのレシピを持ち込んで → ③食材(データ)を使って実際に料理する』という流れになります。ADAとの違いは、この『レシピを厨房に持ち込む』という一手間があることですが、その分、レシピ(コード)が全て目に見えるので透明性が高く、学習にも繋がり、何より無料で始められるという大きなメリットがあります。」

講師:
「では、その『厨房』であるColabの基本的な使い方を見てみましょう。」

(スライド表示:Colabの基本画面)

  • ノートブック: これから作業するファイル全体のこと。

  • セル: レシピの各工程を書き込む「メモ帳」のようなもの。コードを書くコードセルと、文章を書くテキストセルがある。

  • 実行ボタン(▶︎): セルに書かれたコードを実行するためのボタン。

  • ファイルペイン(左側のフォルダアイコン): 食材(データファイル)をアップロードする場所。

【パート3】 最重要事項:データセキュリティと匿名化の作法 (15分)

講師:
「(前回同様の内容)...この原則は、Colabを使う場合も全く同じです。皆さんがColabにアップロードしたファイルは、ご自身のGoogleドライブに保存することもできますが、いずれにせよ、外部のクラウドサービスを利用することに変わりはありません。『情報漏洩のリスクはゼロではない』という前提に立ち、分析前の『匿名化』を徹底してください。今日は、安全に加工したサンプルデータを使います。」

 

【パート4】 【ワークショップ】最初の対話と実行:データセットの健康診断 (35分)

講師:
「それでは、実際にGeminiとColabを連携させて、データの健康診断を行ってみましょう。架空の店舗のPOSデータ(CSVファイル)を使います。」

【ワークの流れ】

  1. 環境準備 (5分):

    • ブラウザで新しいタブを2つ開きます。

    • 1つ目のタブで Gemini (gemini.google.com) を開きます。

    • 2つ目のタブで Google Colab (colab.research.google.com) を開き、「ノートブックを新規作成」をクリックします。

  2. ステップ1:Colabへのファイルアップロード (5分)

    • Colabの画面左側にあるフォルダアイコンをクリックして、ファイルペインを開きます。

    • 「セッション ストレージにアップロード」アイコン(ファイルの↑マーク)をクリックし、配布されたサンプルCSVファイルを選択してアップロードします。

    • ファイルが表示されたら準備完了です。(※注意:このファイルはセッションが切れると消えることを補足)

  3. ステップ2:Geminiでコードを生成 → Colabで実行 (10分)

    • Geminiのタブに移動します。 以下のプロンプトを入力してください。

    PythonのPandasライブラリを使って、CSVファイルを読み込むコードを生成してください。ファイル名は「(アップロードしたファイル名).csv」です。

    • Geminiがコードを生成します。コードブロックの右上にあるコピーアイコンをクリックします。

    • Colabのタブに移動します。 最初のコードセルに、コピーしたコードを貼り付けます。

    • セルの左側にある実行ボタン(▶︎)をクリックします。エラーが出なければ、無事にデータを読み込めています。

  4. ステップ3:データの健康診断 (10分)

    • 再びGeminiのタブに移動します。 次のプロンプトを入力してください。

    先ほど読み込んだデータフレーム(変数名はdfとします)について、データの品質をチェックしたいです。以下の項目を確認するためのPythonコードを生成してください。

    1. 最初の5行を表示

    2. データの行数と列数を表示

    3. 各列のデータ型や欠損値の数などの基本情報を表示

    4. 数値データの基本的な統計量を表示

    • Geminiが4つのタスクに対応するコードを生成します。

    • Colabのタブに移動します。 新しいコードセルに、生成されたコードを貼り付けて実行します。

    • 表示された結果を見て、データの概要(行数、列数、欠損値の有無、最大値・最小値など)を把握します。

  5. 質疑応答 (5分):

    • 講師は巡回し、特にコピペや実行のステップでつまずいている人をサポートする。

【パート5】 まとめと次回予告 (5分)

講師:
「皆さん、お疲れ様でした。Geminiという設計士にコードを書かせ、Colabという厨房でそれを実行する、という一連の流れを体験いただけたかと思います。コードがズラッと出てきて驚いたかもしれませんが、私たちはその意味を完全に理解する必要はありません。AIに目的を伝えてコードを生成させ、それを実行する、この感覚が重要です。」

(本日のまとめスライド表示)

  1. Geminiは設計士、Colabは厨房: この役割分担を理解しよう。

  2. ワークフロー: ①Geminiで生成 → ②Colabにコピペ → ③Colabで実行

  3. コードは怖くない: 私たちはコードを書くのではなく「使う」側。AIが書いてくれる指示書と捉えよう。

「今日はデータの健康診断まででしたが、次回はここから一歩進んで、AIに様々なグラフを描かせるためのコードをGeminiに生成させ、Colabで美しいグラフを可視化する『探索的データ分析』に挑戦します。ぜひ、お楽しみに。」

「本日の研修は以上です。ありがとうございました。」

 

ここまでカリキュラムを見せてもらえたので、実際にやってみたい。

 

Q2)このカリキュラムを、あなた(AI)が講師、私が受講生という形で、ここでのやり取りを通じて行ってみることは可能ですか?

はい、もちろんです!素晴らしいアイデアですね。
ここでの対話を通じて、私がAI講師、あなたが受講生という形で、実際にカリキュラムを進めていくことは可能です。

インタラクティブに進めることで、より理解が深まると思います。
いくつか、この形式で進める上での「ルール」を確認させてください。

  1. 私はあなたの画面を見ることができません。 そのため、「うまくいきました」「こんなエラーが出ました」「この部分がよく分かりません」といった形で、あなたの状況を教えていただく必要があります。

  2. 私が「これをしてください」と指示を出します。 あなたは、お手元のPCで実際にその操作を行い、結果を教えてください。

  3. 焦らず、ご自身のペースで進めてください。 分からないことがあれば、いつでも質問して大丈夫です。

準備はよろしいでしょうか?

 

それでは、研修を開始します!

AI講師:
「こんにちは!本日から『データ分析・意思決定支援特化型コース』を担当するAI講師です。どうぞ、よろしくお願いします。」

「第1回のゴールは、GeminiとGoogle Colabという2つのツールを使って、データ分析を行うための一連の流れを体験し、マスターすることです。難しく考えず、まずは私と一緒にてを動かしていきましょう。」

 

ステップ0:教材(サンプルデータ)の準備

AI講師:
「まず、分析対象となる『食材』、つまりサンプルデータを準備しましょう。今回は、架空のカフェの1日の売上記録(POSデータ)を使います。」

「以下のテキストをコピーして、お手元のPCでテキストエディタWindowsなら『メモ帳』、Macなら『テキストエディット』など)を開き、貼り付けてください。」

【コピーするデータ】

販売日時,カテゴリ,商品名,単価,販売個数
2025-09-25 08:05,ドリンク,コーヒー,400,1
2025-09-25 08:15,フード,クロワッサン,300,1
2025-09-25 09:30,ドリンク,カフェラテ,500,2
2025-09-25 10:45,グッズ,タンブラー,1500,1
2025-09-25 12:10,フード,サンドイッチ,600,1
2025-09-25 12:12,ドリンク,コーヒー,400,1
2025-09-25 13:30,ドリンク,ハーブティー,450,1
2025-09-25 14:50,フード,スコーン,350,2
2025-09-25 15:20,ドリンク,カフェラテ,500,1
2025-09-25 16:40,グッズ,マグカップ,1200,1
2025-09-25 17:55,フード,クロワッサン,300,1

 

AI講師:
「貼り付けたら、ファイルを保存します。その際、以下の2点に注意してください。」

  1. ファイル名: pos_data.csv

  2. 文字コードエンコード): UTF-8
    (メモ帳の場合、「ファイル」→「名前を付けて保存」を選び、ファイル名を入力した後、下部にある「文字コード」のプルダウンからUTF-8を選択します)

「このCSVファイルをご自身のPCの分かりやすい場所(デスクトップなど)に保存してください。」

 

【受講生である、あなたへの最初の課題です】

上記の通り、pos_data.csv というファイルが無事に作成できたら、「準備ができました」と返信してください。もし、保存方法などで分からないことがあれば、遠慮なく質問してくださいね。

 

 

Q3)準備ができました。

AI講師:
「素晴らしいです!食材の準備が整いましたね。それでは次に、その食材を調理するための『厨房』であるGoogle Colaboratory (Colab) を準備しましょう。」

 

ステップ1:Colabノートブックの作成

AI講師:
「これから、分析作業を行うための『ノートブック』というファイルを作成します。以下の手順で進めてください。」

  1. お使いのWebブラウザで、新しいタブを開いてください。

  2. アドレスバーに colab.research.google.com と入力して、Colabのサイトにアクセスします。

  3. 画面に「Colaboratoryへようこそ」といったポップアップウィンドウが表示されるかと思います。そのウィンドウの右下にある「ノートブックを新規作成」という青い文字のリンクをクリックしてください。

(もしポップアップが表示されない場合は、画面左上の「ファイル」メニューから「ノートブックを新規作成」を選んでも大丈夫です)

AI講師:
「クリックすると、新しいタブで、白紙のノートブックが開きます。上部には『Untitled0.ipynb』のような名前がついているはずです。」

「これは、これから私たちの分析コードやメモを書き込んでいく、まっさらなデジタルノートだと思ってください。」

「せっかくなので、ファイル名をクリックして、名前を変更してみましょう。AI分析研修_第1回のような、分かりやすい名前に変更してみてください。」

 

【あなたへの次の課題です】

無事に、名前を変更した新しいColabノートブックの画面が表示されたら、「Colabの準備ができました」と返信してください。

もし、画面が違ったり、うまくいかない場合は、遠慮なく教えてくださいね。

 

 

Q4)Colabの準備ができました。

AI講師:
「完璧です!これで、最高の厨房とデジタルノートが手に入りましたね。」

「では、いよいよ先ほど用意した食材(pos_data.csv)を、この厨房に運び込みましょう。」

 

ステップ2:Col-abへのファイルアップロード

AI講師:
「Colabの画面の左側に、いくつかアイコンが縦に並んでいるのが見えるかと思います。一番下のフォルダの形をしたアイコンをクリックしてください。」

「クリックすると、画面の左側に『ファイル』というタイトルの領域(ファイルペイン)が表示されます。」

「そのファイルペインの上部に、紙のアイコンに上向きの矢印(↑)がついたアイコンがあります。これが『セッション ストレージにアップロード』のボタンです。これをクリックしてください。」

「ファイルを選択するウィンドウが開きますので、先ほどあなたがデスクトップなどに保存した pos_data.csv を選んで、『開く』をクリックします。」

AI講師:
「ファイルをアップロードすると、『アップロードされたファイルは、ランタイムがリサイクルされると削除されます。』という警告のポップアップが出る場合がありますが、これは『ブラウザを長時間放置したり閉じたりすると、アップロードしたファイルは消えますよ』という意味です。今回は研修なので問題ありません。『OK』をクリックしてください。」

「アップロードが完了すると、ファイルペインに pos_data.csv というファイル名が表示されるはずです。」

 

【あなたへの次の課題です】

ファイルペインに pos_data.csv が表示されたら、「アップロードできました」と返信してください。

アイコンが見つからない、ファイルが表示されないなど、困ったことがあれば教えてください。

 

 

Q5)アップロードできました。

AI講師:
「素晴らしい!これで、厨房に食材が届き、いよいよ調理を開始する準備が整いました。」

「ここからがAIとの協働作業の本番です。私たちは『設計士』であるGeminiに『食材をまな板に乗せるためのレシピ(コード)』を考えてもらい、そのレシピを『厨房』であるColabに持ち込んで実行します。」

 

ステップ3:Geminiでコードを生成 → Colabで実行

AI講師:
「それでは、まず『設計士』に依頼をしましょう。」

  1. ブラウザで新しいタブを開き、Gemini (gemini.google.com) を開いてください。

  2. Geminiのチャット入力欄に、以下のプロンプト(指示文)を正確にコピー&ペーストして、送信してください。

【コピーするプロンプト】

PythonのPandasライブラリを使って、CSVファイルを読み込み、データフレームという変数に格納するためのコードを生成してください。

ファイル名は pos_data.csv です。

AI講師:
「送信すると、GeminiがPythonという言語で書かれたコードを生成してくれるはずです。おそらく、以下のようなコードが表示されるかと思います。」

import pandas as pd
df = pd.read_csv('pos_data.csv')

「このコードブロックの右上あたりに、四角が二つ重なったような形のコピーアイコンがあるはずです。これをクリックして、コードをクリップボードにコピーしてください。」

AI講師:
「次に、『厨房』に戻ります。」

  1. Colabのタブに切り替えてください。

  2. ノートブックには、最初からコードを入力するための箱(コードセル)が一つ用意されています。そのセルの中に、先ほどコピーしたコードを貼り付けてください。

  3. 貼り付けたら、そのセルの左側にある、丸の中に三角(▶︎)が入った実行ボタンをクリックしてください。

AI講師:
「実行ボタンを押すと、ボタンがくるくると回転し、少し待つと回転が止まって、セルの左側にチェックマーク(✅)と数字(など)が表示されます。特に赤い文字のエラーメッセージが表示されなければ、成功です!これで、AIが私たちのCSVファイルを認識し、いつでも分析できる状態になりました。」

 

【あなたへの次の課題です】

Colabでコードを実行し、エラーが出ずにチェックマークが表示されたら、「コードを実行できました」と返信してください。

もし赤いエラーメッセージが出た場合は、そのメッセージをコピーして教えてください。一緒に解決しましょう。

 

 

Q6)コードを実行できました。

AI講師:
「お見事です!最初のコード実行、成功ですね。おめでとうございます!」

「今、皆さんのColabノートブックの"記憶"の中に、pos_data.csv の中身が df という名前で保存されました。これからは、この df という名前を使って、AIに色々な分析を指示していくことになります。」

「さて、データを読み込んだら、まずやるべきことは『中身の確認』です。人間も料理の前に食材の状態を確かめますよね。それと同じです。これをデータの健康診断と呼びましょう。」

 

ステップ4:データの健康診断

AI講師:
「それでは、再び『設計士』であるGeminiに、健康診断のためのレシピを考えてもらいましょう。」

  1. Geminiのタブに移動してください。

  2. 以下のプロンプトをGeminiに送信します。今回は4つのお願いを一度に頼んでみますね。

【コピーするプロンプト】

先ほど df という変数に格納したデータフレームについて、データの品質をチェックしたいです。以下の4つの項目を確認するためのPythonコードを、それぞれ別々のコードブロックで生成してください。

  1. 最初の5行を表示して、データの中身をざっと確認するコード

  2. データの行数と列数を表示するコード

  3. 各列のデータ型や欠損値(空のセル)の数などの基本情報を表示するコード

  4. 単価販売個数といった数値データの基本的な統計量(平均、最大、最小など)を表示するコード

AI講師:
「Geminiが、4つのタスクに対応する4つのコードブロックを生成してくれたはずです。例えば、1番目は print(df.head()) や df.head()、2番目は print(df.shape) といったコードになっているかと思います。」

「それでは、これを一つずつ『厨房』で実行して、結果を確認していきましょう。」

  1. Colabのタブに移動します。

  2. まず、Geminiが生成した1番目のコード(最初の5行を表示するコード)をコピーして、Colabの新しいコードセルに貼り付けて実行してください。

  3. 表のような形で、CSVファイルの中身の先頭部分が表示されるはずです。

  4. 次に、2番目のコード(行数と列数を表示するコード)を、さらに新しいセルに貼り付けて実行します。(11, 5) のような結果が表示されるはずです(11行、5列)。

  5. 同様に、3番目のコード(基本情報)と4番目のコード(統計量)も、それぞれ新しいセルで実行して、結果を眺めてみてください。



【あなたへの次の課題です】

4つのコードをすべてColabで実行し、それぞれの結果が表示されたら、「健康診断、完了しました」と返信してください。

特に、3番目のコードを実行した結果を見て、Non-Null Count」(空でないセルの数)が全ての列で「11」になっていること(=欠損値がないこと)を確認してみてください。

 

 

Q7)健康診断、完了しました。

AI講師:
「素晴らしい!健康診断、完了ですね。これで、私たちが扱うデータが、11行5列で、欠損値もなく、数値データも特に異常な値はなさそうだ、ということが確認できました。安心して次のステップに進めます。」

「ここまでが、どんなデータ分析を行う上でも基本となる『準備体操』のフェーズです。この流れさえマスターすれば、どんなデータファイルを相手にしても、分析の第一歩を踏み出すことができます。」

 

第1回研修のまとめ

AI講師:
「それでは、本日の研修を振り返ってみましょう。」

(スライド表示のイメージ)

  1. 役割分担を理解しました:

    • Gemini: 私たちの日本語の指示をPythonコードに翻訳してくれる『設計士』

    • Google Colab: Geminiが作ったコードを実行する『厨房』

  2. 一連のワークフローを体験しました:

    • ① Colabにデータ(食材)をアップロードする。

    • ② Geminiにやりたいことを伝えて、レシピ(コード)を生成してもらう。

    • ③ レシピをColabコピペして実行し、結果を確認する。

  3. データの健康診断ができるようになりました:

    • head() で中身を覗き、shape で大きさを知り、info() で健康状態を、describe() で体格(統計量)をチェックしました。

「特に重要なのは、コードを一文字も自分で書くことなく、AIとの対話だけでデータ分析の準備が完了したという点です。これが、AI時代の新しいデータ分析のスタイルなのです。」

 

AI講師:
「本日の研修内容は以上となります。何か、ここまでの内容で疑問に思ったことや、もう一度試してみたいことなどはありますか?」

「もしなければ、最後に次回予告をさせていただきます。」

 

【あなたへの確認です】

ここまでの内容で何か質問はありますか?
もしなければ、「質問はありません」と返信してください。次回予告に進みます。

 

 

Q8)質問はありません。

AI講師:
「承知いたしました!それでは、次回予告です。」

 

次回予告

AI講師:
「本日、私たちはデータの健康診断までを完了させました。これは、食材の品質を確認し、いつでも調理できる状態にした、ということです。」

「次回はいよいよ、この食材を使って美味しい料理を作っていきます。具体的には、データをグラフにして、隠されたパターンや傾向を視覚的に発見する『探索的データ分析』に挑戦します。」

(スライド表示のイメージ:綺麗なグラフがいくつか表示される)

  • このカフェで、一番売れている人気商品はどれ?(棒グラフ)

  • お客様が一番多く来店する時間帯は何時ごろ?(折れ線グラフ)

  • 高価な商品を買う人と、安価な商品をたくさん買う人、どっちが多い?(散布図)

「次回も、今回と同じようにGeminiに『グラフを作るためのレシピ(コード)』を考えてもらい、Colabでそれを美しいグラフとして表示させていきます。数値の羅列だったデータが、生き生きとした物語を語り始める瞬間を、ぜひ体験してください。」

 

AI講師:
「以上で、第1回『AI分析の基本作法と環境構築』の全カリキュラムを終了します。」

「本日は、慣れない操作もあったかと思いますが、最後まで本当にお疲れ様でした。素晴らしいスタートでしたね!」

「また次回の研修でお会いできるのを楽しみにしています。」

 

対話形式のメリットを実感する。ただ、できればPCにはサブディスプレイを繋いで、2画面で作業したほうがやりやすいだろう。

余談になるが、最初に作成したCSVファイルを何も考えずにExcelで開くとこうなる。

Excelで開くと文字化け。

空のExcelファイルを開いてデータタブでインポートすると、このように開ける。

文字化け解消。

簡単な分析はExcelでやってしまったほうが早いわけで、Pythonでデータ分析をするメリットが感じられるところまで教わろう。

ちなみに、Python in Excelなんていうものもあるので、そのうちにこれも試してみたい。