Auf dieser Seite wird beschrieben, wie Sie Datastream für die Replikation in BigLake Iceberg-Tabellen in BigQuery konfigurieren.
Durch das Streamen in BigLake Iceberg-Tabellen können Sie Daten kostengünstig im Format PARQUET
speichern. So können Sie Ihre Daten in einem Cloud Storage-Bucket speichern und BigQuery für Abfragen und Analysen verwenden.
Streaming zu BigLake Iceberg-Tabellen konfigurieren
So richten Sie Ihren Stream zum Aufnehmen von Daten in BigLake Iceberg-Tabellen ein:
- Erstellen Sie einen Cloud Storage-Bucket, in dem Sie Ihre Daten speichern möchten.
- Cloud-Ressourcenverbindung in BigQuery erstellen Informationen zum Erstellen dieser Art von Verbindung finden Sie unter Cloud-Ressourcen-Verbindung erstellen und einrichten.
Rufen Sie die ID des Dienstkontos der Verbindung ab:
bq show --location=LOCATION --connection --project_id=PROJECT_ID CONNECTION_NAME
Gewähren Sie der Cloud-Ressourcenverbindung Zugriff auf den erstellten Cloud Storage-Bucket. Fügen Sie dazu dem Dienstkonto der Verbindung die IAM-Berechtigung
storage.admin
hinzu:gcloud storage buckets add-iam-policy-binding gs://YOUR_GCS_BUCKET \ --member=serviceAccount:YOUR_SERVICE_ACCOUNT_ID \ --role=roles/storage.admin
Erstellen Sie einen Stream für BigLake-Iceberg-Tabellen.
Informationen zum Erstellen eines Streams für BigLake-Iceberg-Tabellen über die Google Cloud Konsole finden Sie unter Stream erstellen.
Informationen zum Erstellen einer Anfrage zum Streamen von Daten in BigLake-Iceberg-Tabellen mit REST,
Google Cloud CLI
oder Terraform finden Sie unter Streams mit der API verwalten.
Nächste Schritte
- Weitere Informationen zu Streams finden Sie unter Stream-Lebenszyklus.
- Informationen zum Erstellen eines Streams finden Sie unter Stream erstellen.
- Informationen zum Erstellen eines Verbindungsprofils, das Sie mit einem Stream für BigLake Iceberg-Tabellen verwenden können, finden Sie unter Verbindungsprofil für BigQuery erstellen.