Crea un lakehouse de Iceberg abierto, gestionado y de alto rendimiento para habilitar analíticas avanzadas y la ciencia de datos, con gestión de datos automatizada y gobernanza integrada.
Características
BigLake Metastore es un metastore sin servidor para todas tus tablas de Iceberg. Motores como Apache Spark, BigQuery y plataformas de terceros pueden usarlo para crear y gestionar tablas, lo que te proporciona una vista coherente de tus datos y controles de acceso unificados. BigLake Metastore ahora es compatible con el catálogo REST de Apache Iceberg (versión preliminar) para facilitar la integración con software libre y motores de terceros. Las tablas de iceberg ahora son accesibles en AlloyDB (versión preliminar) para mejorar la interoperabilidad entre las plataformas analíticas y las plataformas de transacciones.
BigLake amplía las funciones de gestión de Google Cloud Storage, lo que te permite usar la clase automática de almacenamiento para crear niveles de datos fríos de forma eficiente y aplicar claves de cifrado gestionadas por el cliente (CMEK) a tus segmentos de almacenamiento. El metaalmacene de BigLake se integra de forma nativa en el catálogo universal de Dataplex, lo que garantiza que las políticas de gobierno definidas de forma centralizada se apliquen de forma coherente en varios motores y permite la búsqueda semántica, el linaje de datos, la elaboración de perfiles y las comprobaciones de calidad.
Las tablas de BigLake para Apache Iceberg ofrecen una experiencia de Iceberg totalmente gestionada y preparada para empresas cuando se usan con BigQuery. Al almacenar los datos de Apache Iceberg en tus propias secciones de Google Cloud Storage y aprovechar las funciones de gestión de metadatos en tiempo real y altamente escalables de BigQuery, obtienes lo mejor de ambos mundos: la apertura y la propiedad de los datos asociados a GCS, así como el acceso a las funciones totalmente gestionadas de BigQuery con datos de Iceberg para casos prácticos de streaming, analíticas avanzadas e IA.
Cómo funciona
BigLake ofrece una implementación nativa de Apache Iceberg en Cloud Storage, donde puedes utilizar BigQuery o los motores de código abierto que elijas directamente en los datos de Iceberg. BigLake Metastore simplifica la gestión de datos y se integra con el catálogo universal de Dataplex para ofrecer un gobierno unificado.
Usos habituales
Componentes de Google Cloud de un data lakehouse abierto
Para crear un almacén de datos lakehouse con BigLake, empieza por almacenar tus datos en Cloud Storage. Después, define estos datos con tablas de BigLake para Apache Iceberg. El metaalmacen de BigLake sirve como catálogo centralizado y sin servidor para estas tablas de iceberg, por lo que no es necesario gestionar una infraestructura compleja. Esta configuración permite que cualquier motor compatible con Iceberg pueda acceder y gestionar tus datos de forma coherente, lo que facilita la creación de un entorno de lakehouse unificado, abierto y escalable.
Componentes de Google Cloud de un data lakehouse abierto
Para crear un almacén de datos lakehouse con BigLake, empieza por almacenar tus datos en Cloud Storage. Después, define estos datos con tablas de BigLake para Apache Iceberg. El metaalmacen de BigLake sirve como catálogo centralizado y sin servidor para estas tablas de iceberg, por lo que no es necesario gestionar una infraestructura compleja. Esta configuración permite que cualquier motor compatible con Iceberg pueda acceder y gestionar tus datos de forma coherente, lo que facilita la creación de un entorno de lakehouse unificado, abierto y escalable.
Proporciona información valiosa y predicciones en tiempo real para los servicios financieros
Puedes usar Apache Iceberg para evolucionar conjuntos de datos de data lake, como transacciones o feeds de mercado. BigLake permite a BigQuery consultar tablas de Iceberg junto con el almacenamiento nativo sin mover los datos. Puedes ingerir flujos en tiempo real en BigQuery y combinarlos con datos históricos de Iceberg a través de BigLake para obtener un análisis completo e inmediato. BigQuery ML genera información valiosa en tiempo real, como la volatilidad del mercado y la detección de fraudes, así como modelos predictivos, como el riesgo crediticio y el comportamiento de los clientes.
Proporciona información valiosa y predicciones en tiempo real para los servicios financieros
Puedes usar Apache Iceberg para evolucionar conjuntos de datos de data lake, como transacciones o feeds de mercado. BigLake permite a BigQuery consultar tablas de Iceberg junto con el almacenamiento nativo sin mover los datos. Puedes ingerir flujos en tiempo real en BigQuery y combinarlos con datos históricos de Iceberg a través de BigLake para obtener un análisis completo e inmediato. BigQuery ML genera información valiosa en tiempo real, como la volatilidad del mercado y la detección de fraudes, así como modelos predictivos, como el riesgo crediticio y el comportamiento de los clientes.
BigLake proporciona un acceso seguro y coherente a una única copia de los datos en Cloud Storage. Dataplex Universal Catalog cataloga automáticamente esos datos para que todos los usuarios y motores de datos puedan acceder a ellos. De esta forma, se garantiza la coherencia de las definiciones de datos, la facilidad de descubrimiento y la gobernanza unificada, lo que elimina los silos y fomenta la colaboración en una única fuente de información veraz.
BigLake proporciona un acceso seguro y coherente a una única copia de los datos en Cloud Storage. Dataplex Universal Catalog cataloga automáticamente esos datos para que todos los usuarios y motores de datos puedan acceder a ellos. De esta forma, se garantiza la coherencia de las definiciones de datos, la facilidad de descubrimiento y la gobernanza unificada, lo que elimina los silos y fomenta la colaboración en una única fuente de información veraz.
Precios
Cómo funcionan los precios de BigLake | Los precios de BigLake se basan en la gestión de tablas, el almacenamiento de metadatos y el acceso a metadatos | |
---|---|---|
Servicios y uso | Descripción | Precio (USD) |
Gestión de tablas de BigLake | Recursos de computación de gestión de tablas de BigLake utilizados para la optimización automática del almacenamiento de tablas. | Desde 0,12 USD por DCU por hora |
Almacenamiento de metadatos de BigLake | BigLake Metastore aplica cargos por los metadatos almacenados. El nivel gratuito incluye 1 GB de almacenamiento de metadatos al mes. | Desde 0,04 USD por GiB al mes |
Acceso a metadatos de BigQuery | Operaciones de clase A: cargos por acceso a metadatos de BigLake para operaciones de escritura, actualización, listado, creación y configuración, con un nivel gratuito de 5000 operaciones al mes incluido. | Desde 6,00 USD por millón de operaciones |
Operaciones de clase B: cargos por acceso a metadatos de BigLake para operaciones de lectura, obtención y eliminación, con un nivel gratuito de 50.000 operaciones al mes incluido. | Desde 0,90 USD por millón de operaciones |
Cómo funcionan los precios de BigLake
Los precios de BigLake se basan en la gestión de tablas, el almacenamiento de metadatos y el acceso a metadatos
Gestión de tablas de BigLake
Recursos de computación de gestión de tablas de BigLake utilizados para la optimización automática del almacenamiento de tablas.
Starting at
0,12 USD
por DCU por hora
Almacenamiento de metadatos de BigLake
BigLake Metastore aplica cargos por los metadatos almacenados. El nivel gratuito incluye 1 GB de almacenamiento de metadatos al mes.
Starting at
0,04 USD
por GiB al mes
Acceso a metadatos de BigQuery
Operaciones de clase A: cargos por acceso a metadatos de BigLake para operaciones de escritura, actualización, listado, creación y configuración, con un nivel gratuito de 5000 operaciones al mes incluido.
Starting at
6,00 USD
por millón de operaciones
Operaciones de clase B: cargos por acceso a metadatos de BigLake para operaciones de lectura, obtención y eliminación, con un nivel gratuito de 50.000 operaciones al mes incluido.
Starting at
0,90 USD
por millón de operaciones