CSV-Datei exportieren

Auf dieser Seite wird beschrieben, wie Sie Daten aus AlloyDB for PostgreSQL-Clustern in einen Cloud Storage-Bucket im CSV-Format exportieren, das von anderen Tools und Umgebungen verwendet werden kann.

Informationen zum Migrieren einer gesamten Datenbank von einem unterstützten Datenbankserver zu einer neuen AlloyDB-Instanz finden Sie unter Datenbank mit dem Database Migration Service zu AlloyDB migrieren. Wenn Sie aus der exportierten Datei eine neue Instanz erstellen möchten, können Sie stattdessen auch einen Cluster aus einer gespeicherten Sicherung wiederherstellen.

Sie können den Export von Daten aus AlloyDB for PostgreSQL-Clustern abbrechen. Weitere Informationen finden Sie unter Datenexport abbrechen.

Hinweise

  • Bevor Sie einen Exportvorgang starten, sollten Sie Folgendes beachten: Exportvorgänge verwenden Datenbankressourcen, stören den normalen Datenbankbetrieb jedoch nicht, wenn die Instanz nicht unterdimensioniert ist.
  • SELECT_QUERY kann Kommentare oder Leerzeichen am Anfang und Ende enthalten. Kommentare werden ignoriert und Leerzeichen werden vor dem Ausführen der Exportabfrage entfernt.
  • Gebühren für die interregionale Datenübertragung fallen an, wenn sich der Ziel-Bucket in einer anderen Region als der Quellcluster befindet. Weitere Informationen finden Sie unter AlloyDB for PostgreSQL – Preise.
  • Es können mehrere Exportvorgänge gleichzeitig ausgeführt werden.
  • Die Komprimierung ist aktiviert, wenn der Objektname mit der Erweiterung .gz endet. Das Objekt wird dann im .gz-Format nach Cloud Storage exportiert.
  • Für Zeichenwerte in CSV-Optionen wie field_delimiter, quote_character und escape_character sind nur ASCII-Zeichen im Hexadezimalcode (mit oder ohne das Präfix 0x) zulässig.

Erforderliche Rollen und Berechtigungen für den Export aus AlloyDB

Damit Daten aus AlloyDB in Cloud Storage exportiert werden können, muss der Nutzer, der den Export initiiert, eine der folgenden Rollen für die Identitäts- und Zugriffsverwaltung (Identity and Access Management, IAM) haben:

Außerdem muss das Dienstkonto für den AlloyDB-Cluster eine der folgenden Rollen haben:

  • storage.objectAdmin IAM-Rolle.
  • Eine benutzerdefinierte Rolle mit den folgenden Berechtigungen:
    • storage.objects.create

Informationen zu IAM-Rollen finden Sie unter Identity and Access Management.

Daten in eine CSV-Datei exportieren

Während eines CSV-Exports können Sie die zu exportierenden Schemas angeben. Alle Schemas auf Datenbankebene können exportiert werden.

Zum Anpassen des CSV-Dateiformats können Sie die gcloud CLI oder die REST API verwenden.

gcloud

  1. Cloud Storage-Bucket erstellen
  2. Gewähren Sie dem Dienstkonto Berechtigungen für den Cloud Storage-Bucket für den Exportvorgang. Verwenden Sie das Dienstkontoformat, um das Dienstkonto für das Projekt zu identifizieren, aus dem Sie exportieren. Das Dienstkonto hat das folgende Format:

    service-PROJECT_NUMBER@gcp-sa-alloydb.iam.gserviceaccount.com
  3. Weisen Sie mit gcloud storage buckets add-iam-policy-binding die IAM-Rolle storage.objectAdmin dem Dienstkonto zu. Weitere Informationen zum Festlegen von IAM-Berechtigungen finden Sie unter IAM-Berechtigungen verwenden.

  4. Exportieren Sie die Datenbank in Ihren Cloud Storage-Bucket.

    Führen Sie den Befehl zum Exportieren der CSV-Datei aus: gcloud alloydb clusters export.

    In der folgenden Tabelle sind die Optionen zum Exportieren von Daten im CSV-Format aufgeführt:

    • --select-query (erforderlich): Die SELECT-Abfrage, mit der die Daten extrahiert werden.
    • --async (Optional): Gibt die Steuerung sofort zurück, ohne auf den Abschluss des Vorgangs zu warten.
    • --field-delimiter (optional): Gibt das Zeichen an, das Spalten in jeder Zeile der Datei trennt. Der Standardwert ist ein Komma. Der Wert dieses Arguments muss ein Zeichen im Hex-ASCII-Code sein.
    • --quote-character (Optional): Gibt das Anführungszeichen an, das verwendet werden soll, wenn ein Datenwert in Anführungszeichen gesetzt wird. Der Standardwert ist ein doppeltes Anführungszeichen. Der Wert dieses Arguments muss ein Zeichen im Hex-ASCII-Code sein.
    • --escape-character (Optional): Gibt das Zeichen an, das vor einem Datenzeichen stehen muss, das maskiert werden soll. Der Standardwert ist derselbe wie bei --quote-character. Der Wert dieses Arguments muss ein Zeichen im Hex-ASCII-Code sein.

    Wenn Sie diese Funktionen verwenden möchten, fügen Sie diese Optionen in den gcloud CLI-Befehl ein.

    Andernfalls entfernen Sie diese Parameter aus dem folgenden Befehl:

    gcloud alloydb clusters export CLUSTER_NAME
      --region=REGION
      --database=DATABASE_NAME
      --gcs-uri="gs://BUCKET_NAME/OBJECT_NAME"
      --select-query=SELECT_QUERY
      --field-delimiter=FIELD_DELIMITER
      --quote-character=QUOTE_CHARACTER
      --escape-character=ESCAPE_CHARACTER
      --csv
  5. Wenn Sie die zuvor festgelegte IAM-Rolle nicht beibehalten möchten, entfernen Sie sie jetzt.

REST Version 1

  1. Erstellen Sie einen Bucket für den Export:

    gcloud storage buckets create gs://BUCKET_NAME --location=LOCATION_NAME --project=PROJECT_NAME>
  2. Verwenden Sie das Dienstkontoformat, um das Dienstkonto für das Projekt zu identifizieren, aus dem Sie exportieren.

    Das Dienstkonto hat das folgende Format:

     service-PROJECT_NUMBER@gcp-sa-alloydb.iam.gserviceaccount.com

    Diesem muss die Berechtigung für den Cloud Storage-Bucket für den Exportvorgang erteilt werden.

  3. Weisen Sie mit gcloud storage buckets add-iam-policy-binding die storage.objectAdmin IAM-Rolle dem Dienstkonto zu. Weitere Informationen zum Festlegen von IAM-Berechtigungen finden Sie unter IAM-Berechtigungen verwenden.

  4. Exportieren Sie Ihre Datenbank.

    Verwenden Sie die folgende HTTP-Methode und URL:

    POST https://alloydb.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/clusters/CLUSTER_ID:export

    Ersetzen Sie diese Werte in den folgenden Anfragedaten:

    • PROJECT_ID: Projekt-ID.
    • REGION: Die Region, in der der AlloyDB-Cluster bereitgestellt wird.
    • CLUSTER_ID: die Cluster-ID.
    • BUCKET_NAME: der Name des Cloud Storage-Buckets.
    • PATH_TO_CSV_FILE: Der Pfad zur CSV-Datei.
    • DATABASE_NAME: Der Name einer Datenbank im AlloyDB-Cluster.
    • SELECT_QUERY: Die SQL-Abfrage für den Export.

    • ESCAPE_CHARACTER (Optional): Das Zeichen, das vor einem Datenzeichen stehen muss, das maskiert werden soll. Der Wert dieses Arguments muss ein Zeichen im Hex-ASCII-Code sein. Beispiel: 22 steht für ein doppeltes Anführungszeichen.

    • QUOTE_CHARACTER (optional): Das Zeichen, das Werte aus Spalten mit dem Datentyp „String“ umschließt. Der Wert dieses Arguments muss ein Zeichen im Hex-ASCII-Code sein. Beispielsweise steht 22 für ein doppeltes Anführungszeichen.

    • FIELD_DELIMITER (optional): Das Zeichen, das die Spaltenwerte aufteilt. Der Wert dieses Arguments muss ein Zeichen im Hex-ASCII-Code sein. 2C steht beispielsweise für ein Komma.

    JSON-Text anfordern:

    {
      "gcs_destination": {
        "uri": "gs://BUCKET_NAME/PATH_TO_CSV_FILE"
      },
      "database": "DATABASE_NAME",
      "csv_export_options": {
        "select_query": "SELECT_QUERY",
        "escape_character": "ESCAPE_CHARACTER",
        "quote_character": "QUOTE_CHARACTER",
        "field_delimiter": "FIELD_DELIMITER"
      }
    }
    

    Wenn Sie die Anfrage senden möchten, haben Sie folgende Möglichkeiten:

curl (Linux, macOS oder Cloud Shell)

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

       curl -X POST \
             -H "Authorization: Bearer $(gcloud auth print-access-token)" \
             -H "Content-Type: application/json; charset=utf-8" \
             -d @request.json \
             "https://alloydb.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/clusters/CLUSTER_ID:export"
  

PowerShell (Windows)

Speichern Sie den Anfragetext in einer Datei mit dem Namen request.json und führen Sie den folgenden Befehl aus:

    $cred = gcloud auth print-access-token
    $headers = @{ "Authorization" = "Bearer $cred" }

    Invoke-WebRequest `
      -Method POST `
      -Headers $headers `
      -ContentType: "application/json; charset=utf-8" `
      -InFile request.json `
      -Uri "https://alloydb.googleapis.com/v1/projects/PROJECT_ID/locations/REGION/clusters/CLUSTER_ID:export"| Select-Object -Expand Content
  

Sie erhalten eine JSON-Antwort ähnlich der folgenden:

Antwort

    {
     "name": "projects/PROJECT_ID/locations/REGION/operations/OPERATION_ID",
     "metadata": {
      "@type": "type.googleapis.com/google.cloud.alloydb.v1.OperationMetadata",
      "createTime": "2024-09-17T06:05:31.244428646Z",
      "target": "projects/PROJECT_ID/locations/REGION/clusters/TARGET_CLUSTER",
      "verb": "export",
      "requestedCancellation": false,
      "apiVersion": "v1"
     },
     "done": false
    }
  

Wenn Sie die zuvor festgelegten IAM-Berechtigungen nicht beibehalten möchten, entfernen Sie diese jetzt.

Die vollständige Liste der Parameter für die Anfrage finden Sie unter clusters:export.

Format einer CSV-Exportdatei anpassen

Zum Anpassen des CSV-Dateiformats können Sie die gcloud CLI oder die REST API verwenden. Wenn Sie einen Export ausführen, können Sie die folgenden Formatierungsoptionen festlegen:


CSV-Option

Standardwert

gcloud-Flag

REST API-Attribut

Beschreibung

Escape

Der Standardwert entspricht dem Wert von QUOTE.
--escape-character escape_character Zeichen, das vor einem Datenzeichen stehen muss, das maskiert werden soll.

Angebot
"22"
ASCII-Hexadezimalcode für doppelte Anführungszeichen.
--quote-character quote_character Gibt das Anführungszeichen an, das verwendet werden soll, wenn ein Datenwert in Anführungszeichen gesetzt wird.
Feldtrennzeichen "2C"
ASCII-Hexadezimalcode für Komma.
--field-delimiter field_delimiter Zeichen, das die Spaltenwerte aufteilt.

Ein gcloud CLI-Befehl mit diesen Argumenten kann beispielsweise so aussehen:

gcloud alloydb clusters export CLUSTER_NAME \
--region=REGION \
--database=DATABASE_NAME \
--gcs-uri='gs://BUCKET_NAME/PATH_TO_CSV_FILE' \
--select-query=SELECT_QUERY \
--field-delimiter='2C' \
--quote-character='22' \
--escape-character='5C'
--csv

Der entsprechende REST API-Anfragetext sieht etwa so aus:

{
 "exportContext":
   {
      "gcs_destination": {
        "uri": "gs://BUCKET_NAME/PATH_TO_CSV_FILE",
      },
      "database": "DATABASE_NAME",
      "csv_export_options":
       {
           "select_query": "SELECT_QUERY",
           "escape_character": "5C",
           "quote_character": "22",
           "field_delimiter": "2C",
       }
   }
}

Beim CSV-Export wird standardmäßig eine Standard-CSV-Ausgabe erstellt. Wenn Sie mehr Optionen benötigen, als AlloyDB bereitstellt, können Sie die folgende Anweisung in einem psql-Client verwenden:

     \copy `TABLE_NAME` TO `CSV_FILE_NAME.csv' WITH
          (FORMAT csv, ESCAPE 'ESCAPE_CHARACTER', QUOTE 'QUOTE_CHARACTER',
          DELIMITER 'DELIMITER_CHARACTER', ENCODING 'UTF8', NULL 'NULL_MARKER_STRING');

Nächste Schritte