概要
ELT(抽出、読み込み、変換)は、Google Cloud が推奨するデータ統合パターンです。ELT では、ソースシステムからデータを抽出し、BigQuery に読み込み、分析に使用する形式に変換します。データ ウェアハウスに読み込む前にデータを変換する ETL(抽出、変換、読み込み)とは異なり、ELT アプローチでは、BigQuery の機能をフル活用してデータ変換を実施し、SQL ユーザーがデータ統合パイプラインを効果的に開発することができます。
ELT アプローチは、学習曲線を最小限に抑える、データ中心の使い慣れたフレームワークを提供することで、製品化までの時間を短縮します。また、ELT では、ETL インフラストラクチャを別途用意する必要がないため、読み込み前のデータを変換する際にかかる費用を削減できます。
BigQuery のアーキテクチャは、大規模なスケーラビリティと並列処理を可能にし、大規模なデータセットと複雑な変換を効率的に処理できるようにします。ELT は、BigQuery にデータを一元化してデータ ガバナンスを促進し、プラットフォームに組み込まれた整合性のあるデータ品質とセキュリティ ポリシーを実現します。
BigQuery は、Apache Iceberg などのさまざまなデータソースと形式をサポートしており、多様なデータを柔軟に統合できます。データの選択に加えて、言語の選択も柔軟に行えます。ELT の主なメリットは、SQL が多数の SDLC パイプラインに適合することです。
BigQuery へのデータの移行
BigQuery へのデータの移行 | BigQuery のデータ統合パスと ELT |
---|---|
ステージ | 解決策 |
抽出と読み込み | バッチ読み込み: BigQuery Data Transfer Service(DTS)は、サポートされているデータソースから BigQuery へのデータの一括読み込みを自動化します。 ストリーミング読み込み: Pub/Sub BigQuery サブスクリプションは、受信した Pub/Sub メッセージを既存の BigQuery テーブルに書き込みます。 変更データ キャプチャ(CDC): Datastream は、データベースから BigQuery への非干渉型の変更データ キャプチャ(CDC)を可能にします。 外部データソースへの連携: BigQuery は、データの移動を必要としない外部データソースへの連携をサポートしています。 |
変換 | BigQuery の変換機能は、BigQuery データ操作言語(DML)を使用して SQL データ変換を共同で構築、テスト、文書化するためのツールである Dataform で構築されています。お客様がデータを簡単に変換できるように、Dataform を活用した 2 つの優れたエクスペリエンスを用意しました。 AI によるデータ変換: BigQuery のデータ準備(プレビュー版)は、データのクリーニング、変換、拡充のためのインテリジェントな提案を提供します。これにより、データ準備タスクに必要な時間と労力を削減できます。 SQL ベースの視覚的データ変換: BigQuery ワークフロー(プレビュー版)は、シンプルなワークフローをインタラクティブに構築するための視覚的なユーザー エクスペリエンスを提供します。 |
大規模なデータ移行 | 上記のパターンに加えて、Google Cloud への移行には、既存のデータ ウェアハウスから BigQuery への大量データの移行が伴う場合があります。 BigQuery Migration Service は、お客様が既存のデータ ウェアハウスを BigQuery に読み込んで、さらなるデータ分析を行うことができるフルマネージド サービスです。 |
BigQuery へのデータの移行
BigQuery のデータ統合パスと ELT
抽出と読み込み
バッチ読み込み: BigQuery Data Transfer Service(DTS)は、サポートされているデータソースから BigQuery へのデータの一括読み込みを自動化します。
ストリーミング読み込み: Pub/Sub BigQuery サブスクリプションは、受信した Pub/Sub メッセージを既存の BigQuery テーブルに書き込みます。
変更データ キャプチャ(CDC): Datastream は、データベースから BigQuery への非干渉型の変更データ キャプチャ(CDC)を可能にします。
外部データソースへの連携: BigQuery は、データの移動を必要としない外部データソースへの連携をサポートしています。
変換
BigQuery の変換機能は、BigQuery データ操作言語(DML)を使用して SQL データ変換を共同で構築、テスト、文書化するためのツールである Dataform で構築されています。お客様がデータを簡単に変換できるように、Dataform を活用した 2 つの優れたエクスペリエンスを用意しました。
AI によるデータ変換: BigQuery のデータ準備(プレビュー版)は、データのクリーニング、変換、拡充のためのインテリジェントな提案を提供します。これにより、データ準備タスクに必要な時間と労力を削減できます。
SQL ベースの視覚的データ変換: BigQuery ワークフロー(プレビュー版)は、シンプルなワークフローをインタラクティブに構築するための視覚的なユーザー エクスペリエンスを提供します。
大規模なデータ移行
上記のパターンに加えて、Google Cloud への移行には、既存のデータ ウェアハウスから BigQuery への大量データの移行が伴う場合があります。 BigQuery Migration Service は、お客様が既存のデータ ウェアハウスを BigQuery に読み込んで、さらなるデータ分析を行うことができるフルマネージド サービスです。
一般的な使用例
Google Cloud で強力な ELT パイプラインを構築する:
この設定により、包括的な分析のためのスケーラビリティ、リアルタイム機能、効率的なデータ変換が実現します。
Google Cloud で強力な ELT パイプラインを構築する:
この設定により、包括的な分析のためのスケーラビリティ、リアルタイム機能、効率的なデータ変換が実現します。