Pythonバイブコーディング講座 — Part 2
VSCode と仮想環境で最初のコードを実行
Part 1 で説明した環境構築を、実際に手を動かして体験します。本パートでは、VSCode と Python 本体をインストールし、解析用フォルダに仮想環境を構築します。そして最後に、サンプルのExcelファイルを読み込んで基本統計量を出力するところまで進みます。所要時間は約1時間です。エラーが出ても焦らず、画面の表示を1つずつ確認しながら進めてください。
code.visualstudio.com を開き、「Download for Windows」(Macの場合は Mac)をクリックしてインストーラをダウンロードします。ダウンロードしたインストーラを実行してください。画面の指示に従って進めれば完了です。
Windowsの場合、インストール時に「PATHへの追加」「右クリックメニューに追加」などのオプションがあります。すべてチェックを入れておくと、後の作業が楽になります。
python.org/downloads からPythonをダウンロードします。最初は最新の安定版(例:Python 3.12)でかまいません。
必ずしも「最新版」が良いとは限りません。一部のライブラリは新しいPythonバージョンにまだ対応していないことがあります。そのようなライブラリを使いたい場合は、あえて少し古いバージョン(例:Python 3.10 や 3.11)をインストールする必要があります。最初は最新版で進めて、もし「このPythonバージョンでは動かない」というエラーに遭遇したら、後から別バージョンを入れ直すことができます(手順は Part 3 で説明)。
重要:Windowsのインストール画面で 「Add python.exe to PATH」 のチェックを必ず入れてください。これを忘れるとターミナルからPythonを呼び出せなくなります。Macの場合は特に追加設定は不要です。
インストールが終わったら、念のため確認します。VSCodeを起動し、上部メニュー「ターミナル → 新しいターミナル」を開いてください。次のコマンドを入力します。
python --version
Python 3.12.x のように表示されれば成功です(Macの場合は python3 --version を試してください)。
PCの好きな場所(例:デスクトップ)に新しいフォルダを作成します。名前は my_first_analysis などわかりやすいものにしましょう。
この中に、解析したいExcelファイル(例:sample_data.xlsx)を置いてください。手元に適当なファイルがなければ、Excelで簡単な表(例:列見出しが「身長」「体重」「年齢」の数値データ)を作って保存しましょう。
my_first_analysis/
└── sample_data.xlsx
VSCodeを起動し、上部メニュー「File → Open Folder(フォルダを開く)」から先ほど作った my_first_analysis フォルダを選択します。左側に sample_data.xlsx が表示されればOKです。
「このフォルダ内のファイルの作成者を信頼しますか?」と聞かれたら「Yes, I trust the authors(はい、作成者を信頼します)」を選んでください。
VSCodeの左サイドバーにある四角いアイコン(拡張機能 / Extensions)をクリックします。検索ボックスで以下を順にインストールしてください。
どちらも青い「Install」ボタンを押すだけです。
Windows の方へ:拡張機能のインストール時や後の pip install 時に「path too long」「ファイル名が長すぎる」といったエラーが出る場合があります。Windowsのファイルパス長制限が原因です。対処法は 補足記事「Windowsの『ロングパス』問題への対処」 を参照してください。
ここがいちばん大事なステップです。仮想環境とは、このフォルダ専用の独立したPython環境のことです。仮想環境を作っておけば、ライブラリのバージョンがほかのプロジェクトと干渉しません。さらに、後で再現性を保つためにも役立ちます。
VSCodeの上部メニューから「ターミナル → 新しいターミナル」を選びます。画面下部にターミナルが開きます。
ターミナルが開くと、Windows では PowerShell・Command Prompt(コマンドプロンプト)・Git Bash など複数の種類が選べます。本講座では PowerShell を推奨 します。ターミナルの右上にある「+」ボタンの隣の「∨」プルダウンから「PowerShell」を選んでください(既定で PowerShell になっていることが多いです)。Mac/Linux の場合は zsh または bash が標準で選ばれているのでそのままでOKです。
ターミナルが準備できたら、次のコマンドを実行してください(コマンドを入力して Enter を押す)。
python -m venv .venv
Macで python コマンドが効かない場合は python3 -m venv .venv としてください。コマンドが完了すると、フォルダ内に .venv という新しいフォルダが自動で作られます。これが仮想環境の本体です。
Pythonバージョンを指定して仮想環境を作りたい場合:複数のバージョンのPythonをPCに入れている場合、どのバージョンの仮想環境かを指定できます。Windows なら py -3.11 -m venv .venv(Python 3.11 を使う場合)、Mac/Linux なら python3.11 -m venv .venv のように、バージョン番号を指定して実行します。指定したバージョンが事前にインストールされている必要があります。
my_first_analysis/
├── .venv/ # 仮想環境(中身は触らなくてOK)
└── sample_data.xlsx
作った仮想環境を「使う」状態にします。これを 仮想環境に入る(アクティベートする)と呼びます。仮想環境に入った状態で pip install を実行すると、ライブラリはその仮想環境の中だけにインストールされます。python コマンドも、その仮想環境のPythonが使われます。逆に、入っていない状態で pip install を実行すると、PCのシステム全体にライブラリがインストールされてしまいます。これでは、プロジェクトを分離した意味がなくなってしまいます。
ターミナルで次のコマンドを実行してください。
.venv\Scripts\Activate.ps1
.venv\Scripts\activate.bat
source .venv/bin/activate
成功すると、ターミナルのプロンプトの先頭に (.venv) という表示が出ます。これが「現在は仮想環境の中に入っている」ことを示す印です。逆に (.venv) の表示が消えていたら、仮想環境から出ている状態です(明示的に出るときは deactivate コマンドを実行します)。
Windows PowerShell で「このシステムではスクリプトの実行が無効になっています」というエラーが出る場合は、ターミナル上で Set-ExecutionPolicy -Scope Process -ExecutionPolicy Bypass を1回実行してから、再度 activate コマンドを試してください。
VSCodeにも「どのPython環境でコードを実行するか」を教える必要があります。設定方法は2か所あります。状況によって使い分けてください。
.venv を含むものを選択。.ipynb ファイル(Jupyter Notebook)を開いているときは、画面右上に「Select Kernel」というボタンが表示されます。これをクリック →「Python Environments」→ .venv を含むものを選択。どちらの場合も、選んだ環境がそのファイルでコードを実行する際に使われる環境になります。本講座では .ipynb を扱うので、右上の「Select Kernel」を主に使います。
選択肢に .venv が出てこない場合は、VSCodeを一度閉じて開き直してみてください。それでも出ない場合は、Step 6 の仮想環境作成が失敗している可能性があります。.venv フォルダがプロジェクト直下に存在するか確認してください。
左サイドバーのフォルダ表示エリアにある「新規ファイル」アイコン(紙のマーク)をクリックして、analysis.ipynb という名前のファイルを作成します。.ipynb は Jupyter Notebook と呼ばれる形式のファイルです。コード・実行結果・説明文をセル単位で記録できる、研究や教育で広く使われている便利な形式です。
my_first_analysis/
├── .venv/
├── analysis.ipynb # 解析スクリプト
└── sample_data.xlsx
作った analysis.ipynb をクリックして開きます。最初のセル(コードを書く欄)に次のコードを入力してください。実行は、左側の「▷」(再生ボタン)か Shift + Enter で行えます。
print("Hello, world!")
セルの下に Hello, world! と表示されれば、Pythonの実行環境が正常に動いています!おめでとうございます。
初回実行時に「Pythonカーネルを選択してください」と出たら、.venv のPythonを選びます。「ipykernel をインストールしますか?」と聞かれたら「Install」を選んでください。
Excelを読むためのライブラリ pandas と、Excel形式に対応する openpyxl を仮想環境にインストールします。ターミナル(プロンプトに (.venv) がついている状態)で次のコマンドを実行してください。
pip install pandas openpyxl
ダウンロードと展開が進み、最後に「Successfully installed ...」と表示されれば成功です。
ここがポイントです。今インストールしたライブラリは この仮想環境の中だけに入ります。別のプロジェクトで .venv を作った場合は、別途そこにもインストールが必要です。これによってプロジェクトごとのバージョンを独立して管理できます。
インストールしただけではコード上で使えません。import 文で「これから使います」と宣言する必要があります。analysis.ipynb に新しいセルを追加(上のセルの下にある「+ Code」をクリック)して、次を実行してみてください。
import pandas as pd
print(pd.__version__)
セルの下にバージョン番号(例:2.2.0)が表示されればOKです。import pandas as pd は「pandasライブラリを pd という短い名前で使います」という意味です。以降のコードでは pd.read_excel(...) のように pd. を頭につけて呼び出します。
いよいよ実データを扱います。新しいセルに次のコードを入れて実行してください。sample_data.xlsx の部分は、自分のファイル名に合わせて変更します。
df = pd.read_excel("sample_data.xlsx")
df.head()
Excelの先頭5行が表として表示されれば成功です。df(DataFrame)はpandasがExcelを読み込んだときに作る「表データ」のことです。
次のセルで基本統計量を出してみましょう。
df.describe()
各列について、件数(count)・平均(mean)・標準偏差(std)・最小値(min)・四分位(25%・50%・75%)・最大値(max)が一気に出力されます。
これでもう、あなたはPythonでデータ解析をしている状態です。Part 3 では、ここから「もっと複雑な解析をLLMにやってもらう」やり方を学びます。
pip install でインストールする手順import でライブラリをコードから呼び出す書き方次のPart 3では、このセル単位の実行スタイルを活かして、LLMにコードを書いてもらいながら解析を進めていきます。