이제 Gemini API에서 사용할 수 있는 Veo 3로 개발하세요

2025년 7월 17일

Alisa Fortin Product Manager

Luciano Martins Tech Lead Manager & AI Engineer

Seth Odoom Product Manager

오늘부터 Gemini API 및 Vertex AI를 통해 개발자에게 Veo 3를 유료 미리보기로 제공해 드립니다.

Google I/O 2025에서 처음 공개된 이후, 전 세계 사람들은 Veo 3로 이미 수천만 개의 고품질 동영상을 생성했습니다. 덕분에 새롭고 흥미로운 몇 가지 동영상 트렌드도 함께 등장했습니다. Veo 3은 고품질 동영상 출력과 네이티브 오디오를 지원하는 최초의 동영상 모델로, 우선 텍스트를 영상으로 변환하는 기능으로 시작한 후 곧 이미지를 영상으로 변환하는 기능도 제공할 예정입니다.

Link to Youtube Video (visible only when JS is disabled)

개발자들은 이미 Veo 3로 다양한 실험을 하면서 이 모델이 어떻게 콘텐츠를 브레인스토밍하고 빠르게 반복 작업을 하며 효율성을 높이는 데 도움이 될지 연구 중입니다.

Cartwheel은 사람의 2D 동영상을 가져와, 이를 리깅된 캐릭터에 적용할 수 있는 완전히 프로덕션 준비가 완료된 3D 애니메이션으로 변환하는 시스템을 개발했습니다. Cartwheel은 Veo 3를 사용해 사실적이고 유동적인 휴먼 액션을 생성한 뒤 이를 고객을 위해 3D 애니메이션으로 변환할 수 있습니다.

Volley는 Veo 3를 사용하여 스토리를 전개하는 게임 내 중간 삽입 영상을 만듭니다. Volley 디자이너는 Veo 3를 통해 곧 출시될 Wit's End라는 RPG 게임에서 최상의 결과물을 내기 위해 빠르게 반복 작업을 할 수 있습니다.

Veo 3 기능

Veo 3는 영화 내러티브부터 역동적인 캐릭터 애니메이션까지 다양한 동영상 생성 작업을 처리하도록 설계되었습니다. Veo 3를 사용하면 멋진 비주얼뿐만 아니라 대화 및 음향 효과 같은 오디오를 생성하여 더욱 몰입감 넘치는 경험을 만들 수 있습니다.

동기화된 사운드: 대화, 효과음, 음악 등 기본적으로 풍부한 오디오를 생성하여 단 한 번에 동영상과 동기화합니다.

영화와 같은 화질: 복잡한 질감에서부터 미묘한 조명 효과까지, 프롬프트에 설명된 창의적인 뉘앙스를 포착해 놀라운 고화질 동영상을 생성합니다.

사실적인 물리적 표현: 자연스러운 캐릭터 동작부터 정확하게 표현되는 물의 흐름과 그림자의 넣기까지, 실제 물리적 특성을 시뮬레이션하여 진정한 움직임을 표현합니다.

몇 가지 사례를 살펴보겠습니다.

Link to Youtube Video (visible only when JS is disabled)

프롬프트: 털북숭이 캐릭터 스톱 모션: 펠트와 원사로 꾸민 밝은 색상에 아늑한 주방 내부. 큼직한 안경을 쓴 통통한 털북숭이 햄스터 니블스 교수가 초조한 모습으로 미니어처 스토브에서 거품이 보글보글 끓는 냄비를 저으며 "조금만 더... 조리법에 적힌 대로 '짭조름한 맛의 정수'를"이라고 중얼거립니다. 카메라는 니블스가 정신없이 냄비를 젓는 모습을 미드 샷에 담아냅니다. 갑자기 냄비에서 "펑!" 하는 큰 소리와 함께 코믹한 "쉭" 소리가 나고 반짝이는 녹색 점액이 분출하며 주방 전체를 뒤덮습니다. 니블스 교수가 비명을 지르며 "오, 이런! 또 이러면 안 되는데!"라고 외치며 작고 당황한 끽끽 소리를 남기고 허둥지둥 사라집니다.

Link to Youtube Video (visible only when JS is disabled)

프롬프트: 서서히 회전하면서 강렬한 햇빛을 반사하는 하나의 기어를 완전히 클로즈업하는 장면으로 시작합니다. 카메라가 연속 동작으로 서서히 뒤쪽으로 이동해 이 기어가 황량한 적갈색 사막에 반쯤 파묻힌 거대한 기계 심장의 한 구성품일 뿐임을 보여줍니다. 광활한 공중 촬영 화면을 통해 황량한 풍경 속에서 거대한 스케일과 고립감이 잘 드러납니다. 카메라가 아래로 내려가며 증기를 내뿜는 파이프와 텅 빈 평원에 울려 퍼지는 리드미컬한 쿵쾅거림을 포착합니다. 미묘한 흔들림 효과는 거대한 심장 박동 소리 하나하나와 동기화됩니다. 측면 트래킹 샷을 통해 긴 가운을 입은 아주 작은 인물들이 금속 표면을 바삐 움직이는 모습을 보여줍니다. 카메라는 그중 하나를 따라가며 그들이 황동 밸브를 닦고 엄청나게 큰 볼트를 조이는 등 세심한 유지 보수 작업을 수행하는 모습을 정밀한 트래킹 샷에 담습니다. 복잡한 카메라 움직임이 구조물 전체를 돌면서 녹슨 외관 곳곳에서 불안정한 자세로 작업하는 다양한 유지 보수 팀을 포착합니다. 마지막 샷은 작은 인물이 꼼꼼하게 작업하는 모습을 클로즈업해서 시작한 다음, 카메라가 극적으로 뒤로 빠지면서 심장의 거대한 규모와 이를 돌보는 작은 관리인의 미세한 크기를 보여줍니다. 이 관리인들은 프레임 밖까지 이어지는 보이지 않는 잠자는 거인의 중요한 장기를 돌보고 있습니다.

Google AI Studio의 Veo 3에서 이러한 예제와 더 많은 기능을 살펴보세요. SDK 템플릿과 대화형 Starter App으로 제공되어 리믹스, 복사, 확장할 수 있습니다. Starter App과 샘플 코드는 Paid Tier 사용자가 Google AI Studio에서 직접 Gemini API를 통해 Veo 3 등으로 빠르게 프로토타입을 만들 수 있는 편리한 방법을 제공합니다.

AI Studio Build 인터페이스의 오른쪽 상단에 있는 Key 버튼을 클릭하여 AI Studio 앱에서 Paid Tier를 사용하도록 청구 옵션이 활성화된 Google Cloud Project를 선택하세요. 자세한 내용은 FAQ를 참조하세요.

Gemini API에서 Veo 3 시작하기

Veo 3의 동영상 및 오디오 출력 요금은 초당 0.75달러입니다. 또한 Veo 3 Fast도 곧 출시 예정으로, 동영상 제작을 위한 더 빠르고 비용 효율적인 옵션을 제공할 것입니다.

동영상을 만드는 기본 Python 예제는 다음과 같습니다.

import time
from google import genai
from google.genai import types
 
client = genai.Client()
 
operation = client.models.generate_videos(
    model="veo-3.0-generate-preview",
    prompt="a close-up shot of a golden retriever playing in a field of sunflowers",
    config=types.GenerateVideosConfig(
        negative_prompt="barking, woofing",
    ),
)
 
# Waiting for the video(s) to be generated
while not operation.done:
    time.sleep(20)
    operation = client.operations.get(operation)
 
generated_video = operation.result.generated_videos[0]
client.files.download(file=generated_video.video)
generated_video.video.save("veo3_video.mp4")

Python

Gemini API에서 Veo 3로 책임감 있게 개발하기

Veo 3 모델에서 생성된 모든 동영상에는 디지털 SynthID 워터마크가 계속 포함됩니다. 시작하려면 Google AI Studio에서 관련 문서, 설명서, Veo 3 스타터 앱을 확인하세요.

관련 문서 읽기

Veo 설명서

Veo 3 스타터 앱을 사용해 보세요 (유료 등급 전용)

Veo 3는 Google AI Studio의 Gemini API를 통해 사용할 수 있을 뿐만 아니라 Gemini 앱과 Flow의 Google AI 구독자와 Vertex AI를 통해 액세스하는 엔터프라이즈 고객에게도 제공됩니다.