Pythonと最新AI「Gemini」で広がるプログラミングの世界
![]()
【Yuki】
Hirokiくん、こんにちは。今日は、Googleが開発している最新のAI「Gemini(ジェミニ)」を、Pythonから自由に操る方法についてお話ししようと思います。AIの世界は進歩がとても速くて、少し目を離すと新しいモデルやライブラリが出てくるので、ついていくのが大変かもしれませんね……。でも、基本をしっかり押さえれば、きっとHirokiくんのプログラミングの幅がぐっと広がると思います。
![]()
【Hiroki】
Yukiさん、こんにちは!Geminiって、あのGoogleの有名なAIですよね。ニュースでもよく見かけます。Pythonから使えると聞いたことはあるんですけど、具体的にどうやって始めればいいのか分からなくて……。初心者でも、最新の機能を使えるようになりますか?
![]()
【Yuki】
はい、もちろんです。最近、Googleから「google-genai」という新しいライブラリが公開されました。これを使うと、これまでよりも直感的で、かつ高度な機能を簡単に扱えるようになるんです。今日はその最新のライブラリを使って、AIに文章を作ってもらったり、画像を理解してもらったりする方法を一緒に見ていきましょう。
Geminiとは何か、そして最新の進化
![]()
【Yuki】
まず、Geminiについて簡単におさらいしておきますね。Geminiは、Googleが開発した「マルチモーダル」な生成AIです。マルチモーダルというのは、文字だけじゃなくて、画像や音声、動画なども同時に扱えるという意味なんです。
![]()
【Hiroki】
文字だけじゃないんですね。人間みたいに、写真を見て「これは何?」って答えられるということでしょうか。
![]()
【Yuki】
ええ、その通りです。特に最新の「gemini-2.0-flash」や、さらに先を見据えた「gemini-3-flash-preview」といったモデルは、処理速度が非常に速くて、かつ賢いのが特徴です。以前のモデルに比べて、より自然なやり取りができるようになっていると思います……たぶん、初めて触るとその速さに驚くかもしれません。
![]()
【Hiroki】
「gemini-3-flash-preview」……!もうそんなに進んでいるんですね。名前からして、すごく速そうです。
![]()
【Yuki】
そうですね。「Flash」という名前がついているモデルは、特に対話のレスポンスやリアルタイム性が重視されています。今回は、この最新モデルをPythonから呼び出すための準備をしていきましょう。
開発環境の準備とライブラリのインストール
![]()
【Yuki】
まずは、PythonでGeminiを動かすための準備をします。先ほどお話しした通り、今回は最新のSDKである google-genai を使います。これまでの google-generativeai というライブラリとは少し使い勝手が違うので、注意が必要かもしれません。
![]()
【Hiroki】
新しいライブラリなんですね。インストールはどうすればいいですか?
![]()
【Yuki】
コマンドラインやターミナルで、次のコマンドを入力するだけです。
pip install google-genai
![]()
【Yuki】
これで準備は完了です。次に、Google AI Studioという場所で「APIキー」を取得する必要があります。これは、AIを使うための「鍵」のようなものですね。
![]()
【Hiroki】
APIキーですね。どこからもらえるんでしょうか?
![]()
【Yuki】
Google AI Studio にアクセスして、自分のGoogleアカウントでログインすれば、無料で作成できますよ。ただし、このキーは自分専用の秘密のものなので、他の人には教えないように気をつけてくださいね……。もし漏れてしまうと、誰かに自分の枠を勝手に使われてしまうかもしれませんから。
![]()
【Hiroki】
分かりました。自分だけの鍵として、大切に保管します!
Geminiを動かすための基本コード
![]()
【Yuki】
それでは、実際にPythonのコードを書いていきましょう。まずは、一番シンプルな「テキストの生成」からです。以下のコードを見てみてください。
from google import genai
# クライアントの初期化
# API_KEYの部分には、先ほど取得したキーを入れてくださいね
client = genai.Client(api_key="YOUR_API_KEY")
# テキスト生成の実行
response = client.models.generate_content(
model="gemini-3-flash-preview",
contents="Pythonについて、初心者に優しく一言で説明してください。"
)
# 結果の表示
print(response.text)
![]()
【Hiroki】
わあ、意外と短いコードで動くんですね!genai.Client で接続して、generate_content でお願いをする……という流れでしょうか。
![]()
【Yuki】
その通りです。とても分かりやすい構造になっていると思います。この model の部分に「gemini-3-flash-preview」と指定することで、最新のAIエンジンを使うことができるんです。
![]()
【Hiroki】
実行したら、本当にAIから返事が返ってきそうでワクワクします。
![]()
【Yuki】
ええ、きっと優しい答えが返ってくるはずです。もし、もう少し複雑な設定をしたい場合は、config という引数を使って、「自由度(temperature)」などを調整することもできるんですよ。
画像を理解させるマルチモーダルの力
![]()
【Yuki】
次は、Geminiの大きな特徴である「マルチモーダル機能」を試してみましょう。画像ファイルを読み込んで、その内容をAIに説明してもらうコードです。
![]()
【Hiroki】
画像を送るだけで内容を教えてくれるなんて、魔法みたいですね。
![]()
【Yuki】
ふふ、そうかもしれませんね。Pythonの PIL というライブラリ(Pillow)を一緒に使うと、画像の扱いがとても楽になります。
from google import genai
from PIL import Image
client = genai.Client(api_key="YOUR_API_KEY")
# 画像ファイルの読み込み
img = Image.open("sample_image.jpg")
# 画像とテキストを一緒に送る
response = client.models.generate_content(
model="gemini-3-flash-preview",
contents=[
"この画像には何が写っていますか?詳しく教えてください。",
img
]
)
print(response.text)
![]()
【Hiroki】
contents のリストの中に、テキストと画像オブジェクトを一緒に入れるだけでいいんですね。
![]()
【Yuki】
はい、それだけでGeminiは画像の内容を解析してくれます。風景写真なら「どこで撮られたものか」を推測してくれたり、図表なら「そこに書かれているデータ」を読み取ってくれたりします。Hirokiくんが撮った写真などを読み込ませてみると、面白い発見があるかもしれません。
![]()
【Hiroki】
僕がプログラミングでエラーが出たときの画面キャプチャを送って、「どこが間違ってる?」って聞くこともできるんでしょうか。
![]()
【Yuki】
……!それはとても良いアイデアだと思います。Geminiはコードの理解も得意なので、画像の中のソースコードを読み取って、間違いを指摘してくれるはずです。
連続した会話を楽しむ(チャット機能)
![]()
【Yuki】
これまでの使い方は、一回質問して終わり、というものでした。でも、AIともっと長くお話ししたいときもありますよね。そんなときは「チャットセッション」を使います。
![]()
【Hiroki】
これまでの会話の内容を覚えておいてくれる、ということですか?
![]()
【Yuki】
はい。AIが以前の発言を記憶してくれるので、より自然なやり取りが可能になります。
from google import genai
client = genai.Client(api_key="YOUR_API_KEY")
# チャットセッションの開始
chat = client.chats.create(model="gemini-3-flash-preview")
# 1回目の質問
response1 = chat.send_message("こんにちは!僕の名前はHirokiです。プログラミングを勉強しています。")
print(f"AI: {response1.text}")
# 2回目の質問(名前を覚えているか確認)
response2 = chat.send_message("僕の名前を覚えていますか?あと、おすすめの学習法を教えてください。")
print(f"AI: {response2.text}")
![]()
【Hiroki】
client.chats.create を使うんですね。これなら、自分専用のAI家庭教師みたいなツールも作れそうです。
![]()
【Yuki】
素敵な発想ですね。ただ、会話が長くなりすぎると、AIが一度に扱える情報の限界(コンテキストウィンドウ)を超えてしまうこともあるので、そこだけ少し注意が必要かもしれません。……まあ、最新のGeminiならかなりの長文でも大丈夫だとは思いますけど。
安全にAIを使うための設定
![]()
【Yuki】
AIを扱う上で、もう一つ大切なことがあります。それは「セーフティ設定」です。AIが不適切な内容を出力しないように、あらかじめ制限をかけることができるんです。
![]()
【Hiroki】
確かに、勝手に変なことを言い出したら困りますもんね。
![]()
【Yuki】
そうですね。最新の google-genai ライブラリでは、types モジュールを使って細かく設定できます。
from google import genai
from google.genai import types
client = genai.Client(api_key="YOUR_API_KEY")
# 安全設定の構築
safety_settings = [
types.SafetySetting(
category="HARM_CATEGORY_HATE_SPEECH",
threshold="BLOCK_MEDIUM_AND_ABOVE",
),
]
# 設定を適用して生成
response = client.models.generate_content(
model="gemini-3-flash-preview",
contents="平和な世界を作るために必要なことは何ですか?",
config=types.GenerateContentConfig(
safety_settings=safety_settings,
temperature=0.7
)
)
print(response.text)
![]()
【Hiroki】
SafetySetting で、カテゴリーごとにブロックするレベルを決められるんですね。
![]()
【Yuki】
ええ。アプリケーションを作る際には、ユーザーに不快な思いをさせないための大事な配慮になります。また、ここで使っている temperature(温度)という値は、AIの「遊び心」を調節するものです。値を小さくすると真面目な回答になり、大きくすると独創的な回答になりやすくなります。……その時の気分に合わせて調整してみるのも面白いかもしれませんね。
最新情報の確認とドキュメントの活用
![]()
【Hiroki】
Yukiさん、いろいろ教えてくれてありがとうございます!最新のGeminiをPythonで使う方法、なんとなくイメージが掴めてきました。
![]()
【Yuki】
それは良かったです。AIの分野は本当に変化が激しいので、私の説明もすぐに「古い情報」になってしまうかもしれません。なので、自分でも公式のドキュメントを時々チェックしてみるのが一番だと思います。
![]()
【Hiroki】
公式ドキュメントですね。どこを見ればいいでしょうか?
![]()
【Yuki】
まずは、GoogleのAI開発者向けサイトである Google AI for Developers を見るのが確実です。それから、今回使ったライブラリのソースコードやサンプルは GitHub の google-genai-python リポジトリでも確認できますよ。
![]()
【Hiroki】
GitHubのページもあるんですね。英語かもしれませんけど、頑張って読んでみます!
![]()
【Yuki】
……ふふ、Hirokiくんなら大丈夫ですよ。もし分からないことがあっても、Geminiにその英文を貼り付けて「日本語で解説して」ってお願いすれば、きっと助けてくれますから。AIを学ぶためにAIを使う……というのも、今の時代の賢いやり方だと思います。
![]()
【Hiroki】
なるほど!その手がありましたね。さっそくAPIキーを取って、自分でもコードを動かしてみます。
![]()
【Yuki】
はい、ぜひ挑戦してみてください。何か面白いものができたら、また教えてくれると嬉しいです。……わたしも、Hirokiくんがどんなプログラムを作るのか、楽しみにしていますね。
![]()
【Hiroki】
頑張ります!今日はありがとうございました、Yukiさん!
![]()
【Yuki】
どういたしまして。あ、それから……。コードを書くときは、インデントや全角スペースの混入に気をつけてくださいね。細かいミスで動かないと、少し悲しい気持ちになってしまいますから。……応援しています。
「Gemini」のサンプルコードを見る
この記事では基礎を解説しましたが、実務においては「もっと複雑なデータを扱いたい」「独自のシステムに組み込みたい」といった、個別の課題に直面することも多いはずです。
「自分で書く時間は最小限に抑え、プロの品質でツールを完成させたい」という方は、ぜひ一度ご相談ください。
- 専門家の知見に基づいた、保守性の高いコード設計
- AIの専門家による、Gemini API等の最新AIを組み合わせた高度な自動化
- ChatGPT等が生成したコードのデバッグ・最適化
「教わる」だけでなく「形にする」パートナーとして、フリーランスエンジニアのmei_13が最短ルートでの解決をサポートします。


