借助基于 Python、Java 和 Go 编程语言的可用 API,利用 Google Cloud AI 赋能的图片生成功能,短短几秒钟内就能生成图片。
新客户可获享最高 $300 的赠金,用于在 Vertex AI 上使用 Imagen 生成图片及完成其他任务。
概览
在应用开发中,文本到图像 AI 可用于生成模型、原型、插图、测试数据、教育内容和可视化内容,以便进行调试。object detection借助 Google Cloud 的 Vertex AI 和 Cloud Vision API,开发者可以使用一整套图像处理功能,包括文本检测、对象检测和图片分类。Document AI 可用于提取扫描文档中的文本,以生成文本描述图片。
Imagen 是一种 diffusion 模型,非常适合照片写实,并且具有深层次的语言理解能力。Parti 是一种自回归模型,非常适合一致的风格和主题,以及生成特定风格的图像。Transformer 模型 Muse 可以生成具有多个物体和复杂构成的图像。每款产品都各具特色:Imagen 擅长照片写实,Parti 在内容的丰富性方面表现出色,Muse 速度快,且提供编辑工具。所有这些工具都易于使用,并且无需编程知识。
Imagen 3 是 Google 最新的图片生成模型。它提供出色的图片质量,并在 Imagen 2 的基础上进行了多项改进,包括:生成速度提高 40% 以上,实现快速原型设计和迭代;改善了提示理解和指令遵循;生成逼真的图像,包括人群;增强了对图片内文本渲染的控制。
Imagen 3 面向 Vertex AI 客户推出预览版,可抢先体验新功能,它还包含多语言支持、内置的安全功能(如 Google DeepMind 的 SynthID 数字水印),以及对多种宽高比的支持。
您可以通过 Google Cloud 上的 Vertex AI 或第三方 API 提供商访问这些文本到图像 AI 模型。如需使用这些模型,只需提供文本提示,选择参数(某些模型允许您选择参数来控制所生成图片的风格、创意和准确率),最后生成图片。
工作方式
文本到图像 AI 使用自然语言处理 (NLP) 将文本描述转换为机器可读的格式。转换为机器可读的格式后,机器学习模型即可使用大型文本和图像数据集进行训练,学习识别模式,并使用这些模式生成新的图像。Google Cloud 的文本到图像 AI 使用名为 Imagen 的深度学习模型。Imagen 是一种先进的模型,可以基于文本描述生成逼真的图像。
常见用途
了解如何使用 Imagen on Vertex AI 的文本到图像功能并导出生成的图片的放大版本。本快速入门介绍如何在 Google Cloud 控制台中使用 Imagen 图片生成功能。
了解如何使用 Imagen on Vertex AI 的文本到图像功能并导出生成的图片的放大版本。本快速入门介绍如何在 Google Cloud 控制台中使用 Imagen 图片生成功能。