Anunciado em maio de 2025: o Dataproc Serverless agora é o Google Cloud Serverless para Apache Spark
Spark sob demanda: inicialização rápida, zero operações, melhora do desempenho de consultas e produtividade do Gemini. TCO até 60% menor para cargas de trabalho do Spark.
Apache Spark é uma marca registrada da Apache Software Foundation.
Recursos
Elimine as complexidades do gerenciamento de clusters e evite pagar por recursos inativos e subutilizados. O Google Cloud Serverless para Apache Spark oferece inicialização rápida de VM e escalonamento automático dinâmico para suas cargas de trabalho interativas, em lote e de IA. Gaste seu tempo criando recursos, não gerenciando infraestrutura. Não há cobranças durante a inicialização e o desligamento da VM.
Tenha a melhor relação custo-benefício do setor. O Google Cloud Serverless para Apache Spark é alimentado pelo nosso mecanismo de consulta nativa de última geração, o Lightning Engine, em prévia. Ele oferece uma performance de processamento de dados e consulta do Spark significativamente mais rápida, mais de 3, 6 vezes mais rápida** do que o Apache Spark de código aberto, com execução vetorial avançada, armazenamento em cache inteligente integrado e E/S de armazenamento otimizada, ajudando você a gerar insights mais rapidamente e reduzir custos.
** As consultas são derivadas do padrão TPC-DS e do padrão TPC-H e, portanto, não podem ser comparadas aos resultados publicados do padrão TPC-DS e do padrão TPC-H, porque essas execuções não atendem a todos os requisitos da especificação do padrão TPC-DS e do padrão TPC-H.
Execute suas cargas de trabalho de produção do Spark com confiança. O Google Cloud Serverless para Apache Spark otimiza recursos, oferece isolamento de jobs e oferece suporte aos recursos de segurança corporativa do Google Cloud, incluindo VPC-SC, CMEK, autenticação pessoal e políticas personalizadas da organização. Ele garante um ambiente de execução seguro com recursos como sub-redes seguras, criptografia padrão para dados em repouso e em trânsito e sem acesso direto à VM ou ao root, minimizando a carga de segurança operacional. Embora tenha sido criado para automação, os usuários avançados mantêm acesso total às configurações do Spark para controle detalhado.
Incorpore a IA generativa ao ciclo de vida de desenvolvimento do Spark. Use o Gemini para gerar códigos do PySpark com base no contexto em notebooks com contexto inteligente dos seus dados para aumentar a produtividade. Receba recomendações de solução de problemas com assistência de IA com o Gemini Cloud Assist Investigate para resolver problemas rapidamente, ter insights operacionais mais aprofundados e otimizar o desempenho.
Execute cargas de trabalho de inferência em lote ou treinamento distribuído sem problemas. O Google Cloud Serverless para Apache Spark oferece suporte integrado à aceleração de GPU e vem com bibliotecas de ML conhecidas pré-empacotadas, como XGBoost, PyTorch e Transformers. Isso resulta em tempos de inicialização significativamente mais rápidos para ambientes de IA/ML e melhora a confiabilidade, já que as imagens são certificadas pelo Google.
Mantenha a flexibilidade total. O Google Cloud Serverless para Apache Spark é totalmente compatível com OSS, então você pode usar seu código e bibliotecas do Spark sem fazer modificações. Desenvolva no idioma de sua preferência (Python, Java, Scala, R) usando o IDE de sua escolha (BigQuery Studio, Vertex AI Workbench, Jupyter, VSCode) e orquestre com ferramentas como Apache Airflow/Cloud Composer ou BigQuery Pipelines. Processe todos os formatos de dados, como os nativos do Google e de código aberto, como o Apache Iceberg.
Conheça o poder do Apache Spark diretamente no BigQuery. Escreva e execute código do PySpark com SQL em notebooks do Colab Enterprise unificados, aproveitando metadados comuns com o BigLake Metastore, segurança compartilhada e governança consistente com o catálogo universal do Dataplex.
Usos comuns
ETL/ELT sem servidor ultrarrápido
Ingerir, transformar e carregar rapidamente conjuntos de dados enormes de diversas fontes no BigQuery ou no Google Cloud Storage. Com o desempenho incomparável do Lightning Engine e sem carga operacional, simplifique seus pipelines de dados e garanta dados novos para análise.
ETL/ELT sem servidor ultrarrápido
Ingerir, transformar e carregar rapidamente conjuntos de dados enormes de diversas fontes no BigQuery ou no Google Cloud Storage. Com o desempenho incomparável do Lightning Engine e sem carga operacional, simplifique seus pipelines de dados e garanta dados novos para análise.
Análise de dados interativa e prototipagem rápida
Capacite seus cientistas e analistas de dados com um ambiente Spark sem servidor flexível e de alto desempenho. Seja para realizar a exploração de dados ad hoc, a prototipagem rápida ou a construção de modelos sofisticados de machine learning, o Google Cloud Serverless para Apache Spark oferece a velocidade e as ferramentas necessárias. Desenvolva código PySpark e SQL no BigQuery Studio para uma experiência unificada ou conecte-se usando suas ferramentas preferidas, como notebooks do Jupyter e o VS Code com extensões do Google Cloud. Use o Gemini para receber assistência com códigos e solucionar problemas, o Lightning Engine para resultados de consultas rápidos e a integração da Vertex AI para MLOps. Desde a descoberta rápida de dados até o treinamento de modelos complexos com GPUs e bibliotecas pré-empacotadas, acelere todo o ciclo de vida da ciência de dados.
Análise de dados interativa e prototipagem rápida
Capacite seus cientistas e analistas de dados com um ambiente Spark sem servidor flexível e de alto desempenho. Seja para realizar a exploração de dados ad hoc, a prototipagem rápida ou a construção de modelos sofisticados de machine learning, o Google Cloud Serverless para Apache Spark oferece a velocidade e as ferramentas necessárias. Desenvolva código PySpark e SQL no BigQuery Studio para uma experiência unificada ou conecte-se usando suas ferramentas preferidas, como notebooks do Jupyter e o VS Code com extensões do Google Cloud. Use o Gemini para receber assistência com códigos e solucionar problemas, o Lightning Engine para resultados de consultas rápidos e a integração da Vertex AI para MLOps. Desde a descoberta rápida de dados até o treinamento de modelos complexos com GPUs e bibliotecas pré-empacotadas, acelere todo o ciclo de vida da ciência de dados.
Preços
Preços transparentes e baseados no valor | Os preços do Spark sem servidor do Google Cloud são baseados no uso por segundo de computação (DCU), GPUs e armazenamento de shuffle. | |
---|---|---|
Serviços e uso | Tipo de assinatura | Preço (US$) |
Unidade de computação de dados (DCU) | Standard | A partir de US$ 0,06 por hora |
Premium | A partir de US$ 0,089 por hora | |
Armazenamento de embaralhamento | Standard | A partir de US$ 0,04 por GB / mês |
Premium | A partir de US$ 0,10 por GB / mês | |
Preços do Accelerator | a100 40 GB | A partir de US$ 3,52069 por hora |
a100 80 GB | A partir de US$ 4,713696 por hora | |
L4 | A partir de US$ 0,672048 por hora |
Confira os detalhes de preços do Google Cloud Serverless para Apache Spark.
Preços transparentes e baseados no valor
Os preços do Spark sem servidor do Google Cloud são baseados no uso por segundo de computação (DCU), GPUs e armazenamento de shuffle.
Unidade de computação de dados (DCU)
Standard
Starting at
US$ 0,06
por hora
Premium
Starting at
US$ 0,089
por hora
Armazenamento de embaralhamento
Standard
Starting at
US$ 0,04
por GB / mês
Premium
Starting at
US$ 0,10
por GB / mês
Preços do Accelerator
a100 40 GB
Starting at
US$ 3,52069
por hora
a100 80 GB
Starting at
US$ 4,713696
por hora
L4
Starting at
US$ 0,672048
por hora
Confira os detalhes de preços do Google Cloud Serverless para Apache Spark.