Gemini API、Veo 3 でのビルドに対応開始

2025年7月17日

Alisa Fortin Product Manager

Luciano Martins Tech Lead Manager & AI Engineer

Seth Odoom Product Manager

本日より、デベロッパーの皆さんは Gemini API および Vertex AI を通じて、Veo 3 の有料プレビュー版をご利用いただけます。

Google I/O 2025 で初めて発表された Veo 3 は、すでに世界中のユーザーによって数千万本以上の高品質な動画生成に利用されており、新しい魅力的なトレンドも生まれています。Veo 3 は高忠実度な動画の出力とネイティブ音声を統合した初の動画生成モデルで、現在はテキストからの動画生成に対応しており、今後は画像からの動画生成にも対応する予定です。

Link to Youtube Video (visible only when JS is disabled)

デベロッパーの皆さんは実際に Veo 3 を使用する中で、コンテンツのブレインストーミングや迅速なイテレーション、業務効率の向上にこのモデルがいかに役立つかを実感しています。

Cartwheel は、人間の 2D 動画から、リグ付きキャラクターを使って、本番環境対応の 3D アニメーションへと変換するシステムを開発しました。同社は Veo 3 を活用してリアルでなめらかな人間の動きを生成し、それをお客様向けに 3D アニメーションに変換しています。

Volley は Veo 3 を使用して、ゲームのストーリーを進めるカットシーン動画を制作しています。Volley のデザイナーは Veo 3 を活用し、今後リリース予定の RPG 『Wit's End』の完成度を高めるため、迅速にイテレーションを行っています。

Veo 3 の機能

Veo 3 は、映画のナレーションからダイナミックなキャラクターアニメーションまで、幅広い動画生成のタスクに対応するよう設計されています。圧倒的なビジュアルに加え、会話や効果音などの音声も生成できるため、より没入感のあるエクスペリエンスが実現します。

同期サウンド: 会話や効果音、音楽などの迫力ある音声をネイティブに生成し、1 つのパスで動画と同期させます。

映画のような品質: 複雑なテクスチャから繊細な照明効果まで、プロンプトの創意あふれる細やかな表現を捉えた、高解像度で美しい動画を生成します。

リアルな物理: 自然なキャラクターの動きから、正確な水の流れや影の投影まで、現実世界の物理法則をシミュレートし、本物のような動きを実現します。

例をいくつか紹介しましょう。

Link to Youtube Video (visible only when JS is disabled)

プロンプト: ふわふわのキャラクターのストップモーション: 舞台はフェルトと毛糸で作られた明るく居心地の良いキッチンです。大きめの眼鏡をかけたぽっちゃりしたハムスターのニブルス教授が、ミニチュアのストーブの上で泡立つ鍋を神経質にかき混ぜながら、「もう少し...レシピどおりにセイボリーのエッセンスを」とつぶやきます。カメラは中距離で、教授の慌ただしくかき混ぜる様子を捉えています。すると突然、鍋の中から大きな「ポン！」という音が鳴り響き、続いて「シューッ！」という蒸気の音が辺りに広がりました。虹色に輝く緑色の粘り気のある液体が勢いよく噴き出し、キッチン中に飛び散ってあたり一面を覆いました。ニブルス教授は「ああ、なんてこった！もう二度とごめんだ！」と叫び、パニックに陥って慌ててその場を立ち去りました。後には、小さなきしみ声のような音だけが残っています。

Link to Youtube Video (visible only when JS is disabled)

プロンプト: シーケンスは、1 つのギアを極端にクローズアップした映像から始まります。ギアはゆっくりと回転し、強烈な太陽光を反射しています。カメラはなめらかに引いていき、このギアが、荒涼とした赤褐色の砂漠に半ば埋もれた、巨大な機械の心臓部の一部であることが明らかになります。広がる空撮映像では、荒れ果てた不毛の大地にひっそりとたたずむこの構造物の、圧倒的なスケールと孤独な存在感が描かれます。カメラは地上に近づき、蒸気を吹き出すパイプや、誰もいない平原に響くリズミカルな音を捉えます。微かなカメラの揺れが、機械の鼓動と合わせるようにリズムを刻みます。続く横方向のトラックショットでは、金属の表面を動き回るローブ姿の小さな人物が映し出されます。カメラはその一人にフォーカスを移し、真鍮のバルブを磨き、巨大なボルトを丁寧に締めるといった、緻密なメンテナンス作業を追いかけていきます。視点が構造全体へと広がり、錆びついた機械の不安定な表面で作業するさまざまなメンテナンスチームの姿を、巧みなカメラワークで映していきます。最後のショットでは、1 人の小さな人物の繊細な作業から始まり、徐々に視点が引いていくことで、この心臓部を持つ機械全体の途方もないスケールと、それを支える人間の小ささが浮き彫りになります。そしてフレームの外へと広がる、目には見えない眠れる巨人の命をほのめかしつつ、物語は幕を下ろします。

Google AI Studio の Veo 3 では、さまざまな例をご覧いただけます。これらは SDK テンプレートやインタラクティブなスターターアプリとして提供されており、リミックスやコピー、拡張が可能です。スターターアプリとサンプルコードを使うと、有料プランのユーザーは Google AI Studio 上で Gemini API を通じて、Veo 3 などのプロトタイプをすばやく作成できます。

AI Studio Build インターフェースの右上にある [キー] ボタンをクリックして、課金が有効な Google Cloud プロジェクトを選択すると、AI Studio アプリで有料プランを利用できるようになります。詳細については、よくある質問をご覧ください。

Gemini API で Veo 3 を使ってみる

Veo 3 の料金は、動画と音声の出力に対して 1 秒あたり 0.75 ドルです。まもなく、動画作成に最適な高速かつ費用対効果に優れたオプションの Veo 3 Fast も利用可能になります。

動画を作成するための基本的な Python の例をご紹介します。

import time
from google import genai
from google.genai import types
 
client = genai.Client()
 
operation = client.models.generate_videos(
    model="veo-3.0-generate-preview",
    prompt="a close-up shot of a golden retriever playing in a field of sunflowers",
    config=types.GenerateVideosConfig(
        negative_prompt="barking, woofing",
    ),
)
 
# Waiting for the video(s) to be generated
while not operation.done:
    time.sleep(20)
    operation = client.operations.get(operation)
 
generated_video = operation.result.generated_videos[0]
client.files.download(file=generated_video.video)
generated_video.video.save("veo3_video.mp4")

Python

Gemini API での責任ある Veo 3 のビルド

Veo 3 モデルが生成したすべての動画には SynthID 透かしが含まれます。まずは Google AI Studio のドキュメント、クックブック、Veo 3 スターターアプリをご覧ください。

ドキュメントを読む

Veo クックブック

Veo 3 スターターアプリを試す（有料プランのご利用が必要です）

Veo 3 は、Google AI Studio の Gemini API をはじめ、Gemini アプリや Flow をご利用の Google AI 定期購入者、そして Vertex AI を通じてエンタープライズのお客様向けにも提供されています。