En esta página, se describe cómo configurar Datastream para la replicación en tablas de BigLake Iceberg en BigQuery.
La transmisión a las tablas de Iceberg de BigLake te permite almacenar datos de forma rentable en el formato PARQUET
. De esta manera, puedes mantener tus datos en un bucket de Cloud Storage y usar BigQuery para realizar consultas y análisis.
Configura la transmisión a las tablas de BigLake Iceberg
Para configurar tu transmisión y transferir datos a las tablas de Iceberg de BigLake, haz lo siguiente:
- Crea un bucket de Cloud Storage en el que desees almacenar tus datos.
- Crea una conexión al recurso de Cloud en BigQuery. Para obtener información sobre cómo crear este tipo de conexión, consulta Crea y configura una conexión de recursos de Cloud.
Obtén el identificador de la cuenta de servicio de conexión:
bq show --location=LOCATION --connection --project_id=PROJECT_ID CONNECTION_NAME
Otorga acceso a la conexión de recursos de Cloud al bucket de Cloud Storage que creaste. Para ello, agrega el permiso de IAM
storage.admin
a la cuenta de servicio de la conexión:gcloud storage buckets add-iam-policy-binding gs://YOUR_GCS_BUCKET \ --member=serviceAccount:YOUR_SERVICE_ACCOUNT_ID \ --role=roles/storage.admin
Crea una transmisión de tablas de BigLake Iceberg.
Para obtener información sobre cómo crear una transmisión de tablas de Iceberg de BigLake con la consola de Google Cloud , consulta Crea una transmisión.
Para obtener información sobre cómo crear una solicitud para transmitir datos a tablas de BigLake Iceberg con REST,
Google Cloud CLI
o Terraform, consulta Administra transmisiones con la API.
¿Qué sigue?
- Para obtener más información sobre los streams, consulta Ciclo de vida de los streams.
- Para obtener más información sobre cómo crear una transmisión, consulta Crea una transmisión.
- Para obtener información sobre cómo crear un perfil de conexión que puedas usar con una transmisión de tablas de Iceberg de BigLake, consulta Crea un perfil de conexión para BigQuery.