这是indexloc提供的服务,不要输入任何密码

데이터 통합 및 ELT

Google Cloud의 완전 관리형 데이터 플랫폼인 BigQuery는 데이터 통합 및 분석을 위한 비용 효율적이고 확장 가능한 솔루션입니다.

개요

BigQuery를 사용한 데이터 통합 및 ELT

ELT(추출, 로드, 변환)은 Google Cloud에서 데이터 통합을 위해 권장하는 패턴입니다. ELT에는 소스 시스템에서 데이터를 추출하고 BigQuery에 로드한 다음 분석을 위해 원하는 형식으로 변환하는 작업이 포함됩니다. 데이터 웨어하우스에 로드하기 전에 데이터를 변환하는 ETL(추출, 변환, 로드)과 달리 ELT 접근 방식을 사용하면 BigQuery의 모든 기능을 활용하여 데이터 변환을 수행하고 모든 SQL 사용자가 데이터 통합 파이프라인을 효과적으로 개발할 수 있습니다.

ELT를 통한 TTM(time to market) 가속화 및 비용 절감

ELT 접근 방식은 학습 곡선을 최소화하는 익숙한 데이터 중심 프레임워크를 제공하여 TTM(time to market)을 가속화합니다. ELT는 별도의 ETL 인프라가 필요하지 않으므로 로드 전에 데이터 변환과 관련된 비용을 절감할 수 있습니다.

기본 제공 거버넌스를 통한 확장성 및 성능

BigQuery의 아키텍처는 대규모 확장성과 병렬 처리를 지원하여 대규모 데이터 세트와 복잡한 변환을 효율적으로 처리할 수 있습니다. ELT는 BigQuery에 데이터를 중앙 집중화하여 데이터 거버넌스를 용이하게 만들고 플랫폼에 내장된 일관된 데이터 품질 및 보안 정책을 지원합니다.

유연성과 선택권을 갖춘 데이터 통합

BigQuery는 Apache Iceberg를 비롯한 다양한 데이터 소스와 형식을 지원하여 다양한 데이터를 유연하게 통합할 수 있습니다. 또한 데이터 선택 외에도 언어 선택에 유연성이 있습니다. ELT의 주요 이점은 SQL이 여러 SDLC 파이프라인에 적합하다는 것입니다.


BigQuery로 데이터 가져오기

BigQuery로 데이터 가져오기ELT를 사용한 BigQuery의 데이터 통합 경로
단계솔루션

추출 및 로드

일괄 로드BigQuery Data Transfer Service(DTS)는 지원되는 데이터 소스에서 BigQuery로 데이터를 일괄 로드하는 과정을 자동화합니다.

스트리밍 부하: Pub/Sub BigQuery 구독은 수신되는 Pub/Sub 메시지를 기존 BigQuery 테이블에 기록합니다.

변경 데이터 캡처(CDC)Datastream은 데이터베이스에서 BigQuery로의 비간섭 변경 데이터 캡처(CDC)를 지원합니다.

외부 데이터 소스와의 제휴: BigQuery는 데이터 이동이 필요하지 않은 여러 외부 데이터 소스와의 제휴를 지원합니다.

변환

BigQuery의 변환 기능은 BigQuery DML로 SQL 데이터 변환을 공동으로 빌드, 테스트, 문서화하는 도구인 Dataform으로 빌드됩니다. 데이터를 더 쉽게 변환할 수 있도록 Dataform을 활용하는 두 가지 강력한 환경을 만들었습니다.

AI 기반 데이터 변환: BigQuery 데이터 준비(프리뷰 버전)는 데이터 정리, 변환, 보강을 위한 지능형 추천을 제공하므로 데이터 준비 작업에 필요한 시간과 노력을 줄일 수 있습니다.

SQL 기반 시각적 데이터 변환: BigQuery 워크플로(프리뷰 버전)는 단순한 워크플로를 대화식으로 빌드할 수 있는 시각적 사용자 환경을 제공합니다.

대규모 데이터 마이그레이션

위에 설명한 패턴 외에도 Google Cloud로 마이그레이션할 때 기존 데이터 웨어하우스에서 BigQuery로 대량의 데이터를 마이그레이션해야 할 수 있습니다. BigQuery Migration Service고객이 추가 데이터 분석을 위해 기존 데이터 웨어하우스를 BigQuery로 로드할 수 있는 완전 관리형 서비스입니다.

BigQuery로 데이터 가져오기

ELT를 사용한 BigQuery의 데이터 통합 경로

추출 및 로드

솔루션

일괄 로드BigQuery Data Transfer Service(DTS)는 지원되는 데이터 소스에서 BigQuery로 데이터를 일괄 로드하는 과정을 자동화합니다.

스트리밍 부하: Pub/Sub BigQuery 구독은 수신되는 Pub/Sub 메시지를 기존 BigQuery 테이블에 기록합니다.

변경 데이터 캡처(CDC)Datastream은 데이터베이스에서 BigQuery로의 비간섭 변경 데이터 캡처(CDC)를 지원합니다.

외부 데이터 소스와의 제휴: BigQuery는 데이터 이동이 필요하지 않은 여러 외부 데이터 소스와의 제휴를 지원합니다.

변환

솔루션

BigQuery의 변환 기능은 BigQuery DML로 SQL 데이터 변환을 공동으로 빌드, 테스트, 문서화하는 도구인 Dataform으로 빌드됩니다. 데이터를 더 쉽게 변환할 수 있도록 Dataform을 활용하는 두 가지 강력한 환경을 만들었습니다.

AI 기반 데이터 변환: BigQuery 데이터 준비(프리뷰 버전)는 데이터 정리, 변환, 보강을 위한 지능형 추천을 제공하므로 데이터 준비 작업에 필요한 시간과 노력을 줄일 수 있습니다.

SQL 기반 시각적 데이터 변환: BigQuery 워크플로(프리뷰 버전)는 단순한 워크플로를 대화식으로 빌드할 수 있는 시각적 사용자 환경을 제공합니다.

대규모 데이터 마이그레이션

솔루션

위에 설명한 패턴 외에도 Google Cloud로 마이그레이션할 때 기존 데이터 웨어하우스에서 BigQuery로 대량의 데이터를 마이그레이션해야 할 수 있습니다. BigQuery Migration Service고객이 추가 데이터 분석을 위해 기존 데이터 웨어하우스를 BigQuery로 로드할 수 있는 완전 관리형 서비스입니다.

작동 방식

BigQuery는 데이터 엔지니어와 애플리케이션 개발자에게 파이프라인을 빌드, 예약, 관리하는 데 도움이 되는 풍부한 제품 및 기능 포트폴리오를 제공합니다. 광범위한 서비스 제품군은 ETL과 ELT 패러다임 중에서 선택할 수 있는 유연성을 제공합니다.


ETL 및 ELT 비교
이 동영상을 시청하고 ELT와 ETL의 차이점을 알아보세요.

일반적인 용도

BigQuery와의 엔드 투 엔드 데이터 통합

데이터 통합 아키텍처

BigQuery는 AI를 지원하는 통합 데이터 플랫폼으로, 모든 엔터프라이즈 데이터를 AI와 연결할 수 있습니다. BigQuery는 일괄, 스트리밍 또는 변경 데이터 캡처(CDC)를 통해 다양한 소스(메시지, 데이터베이스 등)에서 데이터를 수집합니다. BigQuery는 AI 기반 변환 레이어와 분석을 위한 통합된 사용자 환경을 통해 데이터를 저장, 계산, 관리합니다.


BigQuery 데이터 통합 아키텍처

    데이터 통합 아키텍처

    BigQuery는 AI를 지원하는 통합 데이터 플랫폼으로, 모든 엔터프라이즈 데이터를 AI와 연결할 수 있습니다. BigQuery는 일괄, 스트리밍 또는 변경 데이터 캡처(CDC)를 통해 다양한 소스(메시지, 데이터베이스 등)에서 데이터를 수집합니다. BigQuery는 AI 기반 변환 레이어와 분석을 위한 통합된 사용자 환경을 통해 데이터를 저장, 계산, 관리합니다.


    BigQuery 데이터 통합 아키텍처

      ELT 파이프라인 빌드

      Google Cloud로 확장 가능한 ELT 파이프라인 빌드

      Google Cloud에서 강력한 ELT 파이프라인을 빌드하세요.

      1. 데이터 소스 선택: 온프레미스, 클라우드 앱 또는 기타
      2. 데이터 수집: 실시간 데이터 수집에는 Datastream을, 전체 로드에는 BigQuery Data Transfer Service를 사용합니다.
      3. 데이터 변환: 데이터 준비로 정리하거나 Dataform으로 파이프라인을 빌드합니다.
      4. Looker Studio로 시각화: 보고서 및 대시보드를 만듭니다.

      이 설정은 포괄적인 분석을 위한 확장성, 실시간 기능, 효율적인 데이터 변환을 제공합니다.

      ELT 파이프라인 아키텍처 빌드

        Google Cloud로 확장 가능한 ELT 파이프라인 빌드

        Google Cloud에서 강력한 ELT 파이프라인을 빌드하세요.

        1. 데이터 소스 선택: 온프레미스, 클라우드 앱 또는 기타
        2. 데이터 수집: 실시간 데이터 수집에는 Datastream을, 전체 로드에는 BigQuery Data Transfer Service를 사용합니다.
        3. 데이터 변환: 데이터 준비로 정리하거나 Dataform으로 파이프라인을 빌드합니다.
        4. Looker Studio로 시각화: 보고서 및 대시보드를 만듭니다.

        이 설정은 포괄적인 분석을 위한 확장성, 실시간 기능, 효율적인 데이터 변환을 제공합니다.

        ELT 파이프라인 아키텍처 빌드
          솔루션 생성
          어떤 문제를 해결하려고 하시나요?
          What you'll get:
          단계별 안내
          참조 아키텍처
          사용 가능한 사전 빌드 솔루션
          이 서비스는 Vertex AI로 빌드되었습니다. 이 서비스를 사용하려면 만 18세 이상이어야 합니다. 민감한 정보, 기밀 정보 또는 개인 정보를 입력하지 마세요.

          개념 증명 시작

          BigQuery 시작하기

          대규모 프로젝트가 있나요?

          Google Cloud와 데이터 통합

          ETL 데이터 통합 접근 방식

          데이터 통합 파트너 살펴보기

          Google Cloud