这是indexloc提供的服务,不要输入任何密码

Integrasi data dan ELT

BigQuery, platform data Google Cloud yang terkelola sepenuhnya, adalah solusi hemat biaya dan skalabel untuk integrasi dan analisis data.

Ringkasan

Integrasi data dan ELT dengan BigQuery

ELT (Extract, Load, Transform) adalah pola yang direkomendasikan Google Cloud untuk integrasi data. ELT melibatkan proses mengekstrak data dari sistem sumber, memuatnya ke BigQuery, lalu mengubahnya ke format yang diinginkan untuk dianalisis. Tidak seperti ETL (Extract, Load, Transform), yang melibatkan transformasi data sebelum dimuat ke data warehouse, pendekatan ELT memungkinkan Anda menggunakan kemampuan penuh BigQuery untuk melakukan transformasi data dan pengguna SQL mana pun untuk mengembangkan pipeline integrasi data secara efektif.

Peningkatan waktu penyiapan produk dan penghematan biaya dengan ELT

Pendekatan ELT mempercepat waktu penyiapan produk dengan menawarkan framework yang familiar dan berpusat pada data yang meminimalkan kurva pembelajaran. ELT juga menghilangkan kebutuhan akan infrastruktur ETL terpisah, sehingga mengurangi biaya yang terkait dengan transformasi data sebelum dimuat.

Skalabilitas dan performa dengan tata kelola bawaan

Arsitektur BigQuery memungkinkan skalabilitas besar dan pemrosesan paralel, sehingga memungkinkan penanganan set data besar dan transformasi kompleks secara efisien. ELT memfasilitasi tata kelola data dengan memusatkan data di BigQuery, sehingga memungkinkan kualitas data yang konsisten dan kebijakan keamanan yang terintegrasi dengan platform.

Integrasi data dengan fleksibilitas dan pilihan

BigQuery mendukung berbagai sumber dan format data, termasuk Apache Iceberg, yang memberikan fleksibilitas dalam mengintegrasikan beragam data. Selain pilihan data, ada juga fleksibilitas dalam pilihan bahasa. Kecocokan SQL dengan sejumlah pipeline SDLC merupakan manfaat utama ELT.


Menghadirkan data ke BigQuery

Menghadirkan data ke BigQueryJalur integrasi data BigQuery dengan ELT.
TahapSolusi

Mengekstrak dan memuat

Pemuatan batchBigQuery Data Transfer Service (DTS) mengotomatiskan pemuatan data massal dari sumber data yang didukung ke BigQuery.

Pemuatan streaming: Langganan BigQuery Pub/Sub menulis pesan Pub/Sub ke tabel BigQuery yang ada saat pesan diterima.

Change data capture (CDC)Datastream mendukung change data capture (CDC) yang tidak mengganggu dari database ke BigQuery.

Federasi ke sumber data eksternal: BigQuery mendukung federasi ke sejumlah sumber data eksternal yang tidak memerlukan perpindahan data.

Transformasi

Kemampuan transformasi BigQuery dibuat dengan Dataform, alat untuk membangun, menguji, dan mendokumentasikan transformasi data SQL secara kolaboratif dengan bahasa pengolahan data (DML) BigQuery. Untuk mempermudah transformasi data, kami telah membuat dua fitur canggih yang memanfaatkan Dataform:

Transformasi data yang didukung AI: Persiapan data BigQuery (dalam Pratinjau) memberikan saran cerdas untuk membersihkan, mentransformasi, dan memperkaya data, yang dapat mengurangi waktu dan upaya yang diperlukan untuk tugas persiapan data.

Transformasi data visual berbasis SQL: Alur kerja BigQuery (dalam Pratinjau) memberikan pengalaman visual kepada pengguna untuk membangun alur kerja sederhana secara interaktif.

Migrasi data berskala besar

Selain pola yang dibahas di atas, migrasi ke Google Cloud mungkin melibatkan migrasi data massal dari data warehouse yang ada ke BigQuery. BigQuery Migration Service adalah layanan terkelola sepenuhnya yang memungkinkan pelanggan memuat data warehouse yang ada ke BigQuery untuk analisis data lebih lanjut.

Menghadirkan data ke BigQuery

Jalur integrasi data BigQuery dengan ELT.

Mengekstrak dan memuat

Solusi

Pemuatan batchBigQuery Data Transfer Service (DTS) mengotomatiskan pemuatan data massal dari sumber data yang didukung ke BigQuery.

Pemuatan streaming: Langganan BigQuery Pub/Sub menulis pesan Pub/Sub ke tabel BigQuery yang ada saat pesan diterima.

Change data capture (CDC)Datastream mendukung change data capture (CDC) yang tidak mengganggu dari database ke BigQuery.

Federasi ke sumber data eksternal: BigQuery mendukung federasi ke sejumlah sumber data eksternal yang tidak memerlukan perpindahan data.

Transformasi

Solusi

Kemampuan transformasi BigQuery dibuat dengan Dataform, alat untuk membangun, menguji, dan mendokumentasikan transformasi data SQL secara kolaboratif dengan bahasa pengolahan data (DML) BigQuery. Untuk mempermudah transformasi data, kami telah membuat dua fitur canggih yang memanfaatkan Dataform:

Transformasi data yang didukung AI: Persiapan data BigQuery (dalam Pratinjau) memberikan saran cerdas untuk membersihkan, mentransformasi, dan memperkaya data, yang dapat mengurangi waktu dan upaya yang diperlukan untuk tugas persiapan data.

Transformasi data visual berbasis SQL: Alur kerja BigQuery (dalam Pratinjau) memberikan pengalaman visual kepada pengguna untuk membangun alur kerja sederhana secara interaktif.

Migrasi data berskala besar

Solusi

Selain pola yang dibahas di atas, migrasi ke Google Cloud mungkin melibatkan migrasi data massal dari data warehouse yang ada ke BigQuery. BigQuery Migration Service adalah layanan terkelola sepenuhnya yang memungkinkan pelanggan memuat data warehouse yang ada ke BigQuery untuk analisis data lebih lanjut.

Cara Kerjanya

BigQuery menawarkan portofolio produk dan kemampuan yang beragam kepada data engineer dan developer aplikasi untuk membantu membangun, menjadwalkan, dan mengelola pipeline. Penawaran yang beragam memberi Anda fleksibilitas untuk memilih antara paradigma ETL dan ELT.


ETL vs ELT
Tonton video ini untuk mempelajari perbedaan antara ELT dan ETL

Penggunaan Umum

Integrasi data menyeluruh dengan BigQuery

Arsitektur integrasi data

BigQuery adalah platform data terpadu berteknologi AI, sehingga Anda dapat menghubungkan semua data perusahaan dengan AI. BigQuery menyerap data dari berbagai sumber (pesan, database, dan lainnya) melalui batch, streaming, atau change data capture (CDC). BigQuery menyimpan, menghitung, dan mengelola data dengan lapisan transformasi berteknologi AI dan pengalaman pengguna terpadu untuk dianalisis.


Arsitektur integrasi data BigQuery

    Arsitektur integrasi data

    BigQuery adalah platform data terpadu berteknologi AI, sehingga Anda dapat menghubungkan semua data perusahaan dengan AI. BigQuery menyerap data dari berbagai sumber (pesan, database, dan lainnya) melalui batch, streaming, atau change data capture (CDC). BigQuery menyimpan, menghitung, dan mengelola data dengan lapisan transformasi berteknologi AI dan pengalaman pengguna terpadu untuk dianalisis.


    Arsitektur integrasi data BigQuery

      Membangun pipeline ELT

      Membangun pipeline ELT yang skalabel dengan Google Cloud

      Membangun pipeline ELT yang andal di Google Cloud:

      1. Pilih sumber data: Lokal, aplikasi cloud, atau lainnya.
      2. Menyerap data: Gunakan Datastream untuk penyerapan real-time atau BigQuery Data Transfer Service untuk pemuatan penuh.
      3. Mentransformasi data: Membersihkan data dengan persiapan data, atau membangun pipeline dengan Dataform.
      4. Visualisasi dengan Looker Studio: Membuat laporan dan dasbor.

      Konfigurasi ini memberikan skalabilitas, kemampuan real-time, dan transformasi data yang efisien untuk analisis yang komprehensif.

      Membangun arsitektur pipeline ELT

        Membangun pipeline ELT yang skalabel dengan Google Cloud

        Membangun pipeline ELT yang andal di Google Cloud:

        1. Pilih sumber data: Lokal, aplikasi cloud, atau lainnya.
        2. Menyerap data: Gunakan Datastream untuk penyerapan real-time atau BigQuery Data Transfer Service untuk pemuatan penuh.
        3. Mentransformasi data: Membersihkan data dengan persiapan data, atau membangun pipeline dengan Dataform.
        4. Visualisasi dengan Looker Studio: Membuat laporan dan dasbor.

        Konfigurasi ini memberikan skalabilitas, kemampuan real-time, dan transformasi data yang efisien untuk analisis yang komprehensif.

        Membangun arsitektur pipeline ELT
          Membuat solusi
          Masalah apa yang ingin Anda temukan solusinya?
          What you'll get:
          Panduan langkah demi langkah
          Arsitektur referensi
          Solusi siap pakai yang tersedia
          Layanan ini dibangun dengan Vertex AI. Anda harus berusia 18 tahun ke atas untuk menggunakannya. Jangan memasukkan informasi sensitif, rahasia, atau pribadi.

          Memulai bukti konsep Anda

          Mulai menggunakan BigQuery

          Punya proyek besar?

          Integrasi data dengan Google Cloud

          Pendekatan integrasi data ETL

          Menjelajahi partner integrasi data