BigLake Iceberg-Tabellen in BigQuery konfigurieren

Auf dieser Seite wird beschrieben, wie Sie Datastream für die Replikation in BigLake Iceberg-Tabellen in BigQuery konfigurieren.

Durch das Streamen in BigLake Iceberg-Tabellen können Sie Daten kostengünstig im Format PARQUET speichern. So können Sie Ihre Daten in einem Cloud Storage-Bucket speichern und BigQuery für Abfragen und Analysen verwenden.

Streaming zu BigLake Iceberg-Tabellen konfigurieren

So richten Sie Ihren Stream zum Aufnehmen von Daten in BigLake Iceberg-Tabellen ein:

  1. Erstellen Sie einen Cloud Storage-Bucket, in dem Sie Ihre Daten speichern möchten.
  2. Cloud-Ressourcenverbindung in BigQuery erstellen Informationen zum Erstellen dieser Art von Verbindung finden Sie unter Cloud-Ressourcen-Verbindung erstellen und einrichten.
  3. Rufen Sie die ID des Dienstkontos der Verbindung ab:

    bq show --location=LOCATION --connection --project_id=PROJECT_ID
    CONNECTION_NAME
    
  4. Gewähren Sie der Cloud-Ressourcenverbindung Zugriff auf den erstellten Cloud Storage-Bucket. Fügen Sie dazu dem Dienstkonto der Verbindung die IAM-Berechtigung storage.admin hinzu:

    gcloud storage buckets add-iam-policy-binding gs://YOUR_GCS_BUCKET \
    --member=serviceAccount:YOUR_SERVICE_ACCOUNT_ID \
    --role=roles/storage.admin
    
  5. Erstellen Sie einen Stream für BigLake-Iceberg-Tabellen.

    Informationen zum Erstellen eines Streams für BigLake-Iceberg-Tabellen über die Google Cloud Konsole finden Sie unter Stream erstellen.

    Informationen zum Erstellen einer Anfrage zum Streamen von Daten in BigLake-Iceberg-Tabellen mit REST, Google Cloud CLI oder Terraform finden Sie unter Streams mit der API verwalten.

Nächste Schritte