Anunciado em maio de 2025: o Dataproc Serverless agora é o Google Cloud Serverless para Apache Spark

Google Cloud Serverless para Apache Spark

A nova forma de usar o Apache Spark do desenvolvimento à produção

Spark sob demanda: inicialização rápida, zero operações, melhora do desempenho de consultas e produtividade do Gemini. TCO até 60% menor para cargas de trabalho do Spark.

Apache Spark é uma marca registrada da Apache Software Foundation.

Recursos

Spark sob demanda: foque no código, não nos clusters

Elimine as complexidades do gerenciamento de clusters e evite pagar por recursos inativos e subutilizados. O Google Cloud Serverless para Apache Spark oferece inicialização rápida de VM e escalonamento automático dinâmico para suas cargas de trabalho interativas, em lote e de IA. Gaste seu tempo criando recursos, não gerenciando infraestrutura. Não há cobranças durante a inicialização e o desligamento da VM.

Aumente a performance com o Lightning Engine

Tenha a melhor relação custo-benefício do setor. O Google Cloud Serverless para Apache Spark é alimentado pelo nosso mecanismo de consulta nativa de última geração, o Lightning Engine, em prévia. Ele oferece uma performance de processamento de dados e consulta do Spark significativamente mais rápida, mais de 3, 6 vezes mais rápida** do que o Apache Spark de código aberto, com execução vetorial avançada, armazenamento em cache inteligente integrado e E/S de armazenamento otimizada, ajudando você a gerar insights mais rapidamente e reduzir custos.

** As consultas são derivadas do padrão TPC-DS e do padrão TPC-H e, portanto, não podem ser comparadas aos resultados publicados do padrão TPC-DS e do padrão TPC-H, porque essas execuções não atendem a todos os requisitos da especificação do padrão TPC-DS e do padrão TPC-H.

Segurança e configurações prontas para empresas

Execute suas cargas de trabalho de produção do Spark com confiança. O Google Cloud Serverless para Apache Spark otimiza recursos, oferece isolamento de jobs e oferece suporte aos recursos de segurança corporativa do Google Cloud, incluindo VPC-SC, CMEK, autenticação pessoal e políticas personalizadas da organização. Ele garante um ambiente de execução seguro com recursos como sub-redes seguras, criptografia padrão para dados em repouso e em trânsito e sem acesso direto à VM ou ao root, minimizando a carga de segurança operacional. Embora tenha sido criado para automação, os usuários avançados mantêm acesso total às configurações do Spark para controle detalhado.

Produtividade em cada etapa com o Gemini

Incorpore a IA generativa ao ciclo de vida de desenvolvimento do Spark. Use o Gemini para gerar códigos do PySpark com base no contexto em notebooks com contexto inteligente dos seus dados para aumentar a produtividade. Receba recomendações de solução de problemas com assistência de IA com o Gemini Cloud Assist Investigate para resolver problemas rapidamente, ter insights operacionais mais aprofundados e otimizar o desempenho.

IA/ML distribuído com facilidade

Execute cargas de trabalho de inferência em lote ou treinamento distribuído sem problemas. O Google Cloud Serverless para Apache Spark oferece suporte integrado à aceleração de GPU e vem com bibliotecas de ML conhecidas pré-empacotadas, como XGBoost, PyTorch e Transformers. Isso resulta em tempos de inicialização significativamente mais rápidos para ambientes de IA/ML e melhora a confiabilidade, já que as imagens são certificadas pelo Google.

Aberto, flexível e interoperável

Mantenha a flexibilidade total. O Google Cloud Serverless para Apache Spark é totalmente compatível com OSS, então você pode usar seu código e bibliotecas do Spark sem fazer modificações. Desenvolva no idioma de sua preferência (Python, Java, Scala, R) usando o IDE de sua escolha (BigQuery Studio, Vertex AI Workbench, Jupyter, VSCode) e orquestre com ferramentas como Apache Airflow/Cloud Composer ou BigQuery Pipelines. Processe todos os formatos de dados, como os nativos do Google e de código aberto, como o Apache Iceberg.

Experiência unificada do BigQuery

Conheça o poder do Apache Spark diretamente no BigQuery. Escreva e execute código do PySpark com SQL em notebooks do Colab Enterprise unificados, aproveitando metadados comuns com o BigLake Metastore, segurança compartilhada e governança consistente com o catálogo universal do Dataplex.

Como funciona

Spark sem esforço, da ideia à produção

Usos comuns

Pipelines sem servidor

ETL/ELT sem servidor ultrarrápido

Ingerir, transformar e carregar rapidamente conjuntos de dados enormes de diversas fontes no BigQuery ou no Google Cloud Storage. Com o desempenho incomparável do Lightning Engine e sem carga operacional, simplifique seus pipelines de dados e garanta dados novos para análise.

Tutoriais, guias de início rápido e laboratórios

ETL/ELT sem servidor ultrarrápido

Ingerir, transformar e carregar rapidamente conjuntos de dados enormes de diversas fontes no BigQuery ou no Google Cloud Storage. Com o desempenho incomparável do Lightning Engine e sem carga operacional, simplifique seus pipelines de dados e garanta dados novos para análise.

Ciência de dados e análise interativos

Análise de dados interativa e prototipagem rápida

Capacite seus cientistas e analistas de dados com um ambiente Spark sem servidor flexível e de alto desempenho. Seja para realizar a exploração de dados ad hoc, a prototipagem rápida ou a construção de modelos sofisticados de machine learning, o Google Cloud Serverless para Apache Spark oferece a velocidade e as ferramentas necessárias. Desenvolva código PySpark e SQL no BigQuery Studio para uma experiência unificada ou conecte-se usando suas ferramentas preferidas, como notebooks do Jupyter e o VS Code com extensões do Google Cloud. Use o Gemini para receber assistência com códigos e solucionar problemas, o Lightning Engine para resultados de consultas rápidos e a integração da Vertex AI para MLOps. Desde a descoberta rápida de dados até o treinamento de modelos complexos com GPUs e bibliotecas pré-empacotadas, acelere todo o ciclo de vida da ciência de dados.

Tutoriais, guias de início rápido e laboratórios

Análise de dados interativa e prototipagem rápida

Capacite seus cientistas e analistas de dados com um ambiente Spark sem servidor flexível e de alto desempenho. Seja para realizar a exploração de dados ad hoc, a prototipagem rápida ou a construção de modelos sofisticados de machine learning, o Google Cloud Serverless para Apache Spark oferece a velocidade e as ferramentas necessárias. Desenvolva código PySpark e SQL no BigQuery Studio para uma experiência unificada ou conecte-se usando suas ferramentas preferidas, como notebooks do Jupyter e o VS Code com extensões do Google Cloud. Use o Gemini para receber assistência com códigos e solucionar problemas, o Lightning Engine para resultados de consultas rápidos e a integração da Vertex AI para MLOps. Desde a descoberta rápida de dados até o treinamento de modelos complexos com GPUs e bibliotecas pré-empacotadas, acelere todo o ciclo de vida da ciência de dados.

Gerar uma solução

Qual problema você está tentando resolver?

What you'll get:

Guia explicativo

Arquitetura de referência

Soluções pré-criadas disponíveis

Este serviço foi criado com a Vertex AI. Você precisa ter 18 anos ou mais para usá-lo. Não insira informações sensíveis, confidenciais ou pessoais.

Preços

Preços transparentes e baseados no valor	Os preços do Spark sem servidor do Google Cloud são baseados no uso por segundo de computação (DCU), GPUs e armazenamento de shuffle.
Serviços e uso	Tipo de assinatura	Preço (US$)
Unidade de computação de dados (DCU)	Standard	A partir de US$ 0,06 por hora
Unidade de computação de dados (DCU)	Premium	A partir de US$ 0,089 por hora
Armazenamento de embaralhamento	Standard	A partir de US$ 0,04 por GB / mês
Armazenamento de embaralhamento	Premium	A partir de US$ 0,10 por GB / mês
Preços do Accelerator	a100 40 GB	A partir de US$ 3,52069 por hora
	a100 80 GB	A partir de US$ 4,713696 por hora
	L4	A partir de US$ 0,672048 por hora

Confira os detalhes de preços do Google Cloud Serverless para Apache Spark.

Preços transparentes e baseados no valor

Os preços do Spark sem servidor do Google Cloud são baseados no uso por segundo de computação (DCU), GPUs e armazenamento de shuffle.

Unidade de computação de dados (DCU)

Tipo de assinatura

Standard

Preço (US$)

Starting at

US$ 0,06

por hora

Premium

Tipo de assinatura

Starting at

US$ 0,089

por hora

Armazenamento de embaralhamento

Tipo de assinatura

Standard

Preço (US$)

Starting at

US$ 0,04

por GB / mês

Premium

Tipo de assinatura

Starting at

US$ 0,10

por GB / mês

Preços do Accelerator

Tipo de assinatura

a100 40 GB

Preço (US$)

Starting at

US$ 3,52069

por hora

a100 80 GB

Tipo de assinatura

Starting at

US$ 4,713696

por hora

L4

Tipo de assinatura

Starting at

US$ 0,672048

por hora

Confira os detalhes de preços do Google Cloud Serverless para Apache Spark.

Calculadora de preços

Calcule seus custos mensais por região.

Cota personalizada

Fale com nossa equipe de vendas e receba uma cotação personalizada para sua organização.

Google Cloud Serverless para Apache Spark

A nova forma de usar o Apache Spark do desenvolvimento à produção

Características do produto

Spark sob demanda: foque no código, não nos clusters

Aumente a performance com o Lightning Engine

Segurança e configurações prontas para empresas

Produtividade em cada etapa com o Gemini

IA/ML distribuído com facilidade

Aberto, flexível e interoperável

Experiência unificada do BigQuery

Spark sem esforço, da ideia à produção

Pipelines sem servidor

ETL/ELT sem servidor ultrarrápido

Tutoriais, guias de início rápido e laboratórios

ETL/ELT sem servidor ultrarrápido

Ciência de dados e análise interativos

Análise de dados interativa e prototipagem rápida

Tutoriais, guias de início rápido e laboratórios

Análise de dados interativa e prototipagem rápida

Calculadora de preços

Cota personalizada

Comece hoje mesmo

Tutorial para começar

Tem um projeto grande?

Visão geral do produto

Usar o conector do BigQuery com o Google Cloud Serverless para Apache Spark

Usar GPUs com o Google Cloud Serverless para Apache Spark