这是indexloc提供的服务,不要输入任何密码

在 Google Cloud 中建構開放式、代管的智慧型 data lakehouse

透過與 Google 領先業界的 AI 技術整合的高效能 data lakehouse,統合及治理多模態資料。充分運用 Apache Iceberg 和業界首屈一指的無伺服器 Spark 自動調度資源功能,簡化資料處理、數據分析和 AI 計畫。

將 Google 的強大功能導入開放式 data lakehouse

整合開放資料格式的創新技術、智慧型「從資料到 AI」治理機制、加速資料處理功能,以及先進的 AI 輔助開發工具,協助您簡化資料管理流程,加速創新。

BigLake

透過企業級儲存空間管理服務,享有 Apache Iceberg 的開放性

BigLake 提供原生 Iceberg 儲存引擎,可與 Cloud Storage 互通,並提供統一的執行階段中繼資料管理機制、進階數據分析和資料科學功能,以及內建治理機制的自動化資料管理機制。任何與 Iceberg 相容的引擎,都能使用 BigLake 的自動化資料表管理功能,進而提升查詢效能並降低成本。


“與 Google Cloud 合作對我們來說至關重要,因為這有助於我們建構 Snap 的下一代開放式 lakehouse,並在開發人員社群中普及 Spark 和 Iceberg!”

Snap 資深軟體工程師兼資深部門主管 Zhengyi Liu

BigLake

透過企業級儲存空間管理服務,享有 Apache Iceberg 的開放性

BigLake 提供原生 Iceberg 儲存引擎,可與 Cloud Storage 互通,並提供統一的執行階段中繼資料管理機制、進階數據分析和資料科學功能,以及內建治理機制的自動化資料管理機制。任何與 Iceberg 相容的引擎,都能使用 BigLake 的自動化資料表管理功能,進而提升查詢效能並降低成本。


“與 Google Cloud 合作對我們來說至關重要,因為這有助於我們建構 Snap 的下一代開放式 lakehouse,並在開發人員社群中普及 Spark 和 Iceberg!”

Snap 資深軟體工程師兼資深部門主管 Zhengyi Liu

Google Cloud Serverless for Apache Spark

無伺服器 Spark 提供高效能和極快的處理速度,而且無須管理叢集

使用 Google Cloud Serverless for Apache Spark,推動 lakehouse 轉型。使用全新的 Lightning Engine,您可以快速啟動應用程式,且不會造成作業負擔,同時還能提升 Spark 工作負載的效能。搭配使用強大的 Gemini,可提升工作效率,並將 TCO 降低高達 60%


“我們認為 SQL 和 Spark 是相輔相成的兩種存取及轉換資料的方式。在需要複雜商業邏輯的用途上,Spark 特別有用,雖然這類用途較少見,但對業務至關重要。有了整合式 SQL、Spark 和 AI 平台,並透過筆記本進行開發,這些重要用途將大幅簡化。”

Trivago 內容工程部門主管 Andrés Sopeña Pérez

Dataplex Universal Catalog

簡化資料探索作業,提升 data lakehouse 的可信度和理解度

Dataplex Universal Catalog 是 Google Cloud 的統合式「從資料到 AI」治理解決方案。這項 AI 輔助目錄會將 Google Cloud 中的業務、技術和作業中繼資料集中管理,並提供 AI 輔助洞察資料。這個平台支援 Apache Iceberg 等開放格式,可讓您在整個 lakehouse 中實現整合式治理。


“Dataplex 有助於將我們的資料平台轉變成安全、高效率且可擴充的資料生態系統。著重於資料治理、探索、觀測和安全性法規遵循,協助我們因應數位時代的資料管理難題。有了 Dataplex,我們的團隊就能充分發揮資料的潛力,推動 Box.Inc 持續成長及創新。”

Box.Inc 資深產品經理 Asmita Kulkarni

BigQuery Studio 和 IDE 擴充功能

透過簡化開發與作業流程,強化 Apache Spark 在 lakehouse 架構中執行進階資料科學和 AI/機器學習工作負載的能力

Dataproc 為機器學習執行階段提供全新創新功能,並搭配 GPU 驅動程式和常見的機器學習程式庫,進而提升 Spark 在 lakehouse 中的 AI/機器學習效能。BigQuery Studio 和第三方 IDE 中的 Colab Enterprise 筆記本提供整合式 MLOps 和 Vertex AI,以及簡化的正式環境 pipeline,可加速資料科學工作。


“Shopify 投入資源聘請具備多元技能的團隊,以便掌握資料科學和工程領域的最新趨勢。在 BigQuery Studio 的早期測試中,我們很喜歡 Google 能為不同使用者連結不同工具,並提供簡單的使用體驗。我們認為這項功能可為團隊成員減少阻礙,同時不犧牲預期的 BigQuery 規模。”

Shopify 資料工程部門主管 Zac Roberts

立即展開您的 data lakehouse 旅程

無論您是要遷移舊版系統,還是建構以 Iceberg 為優先的 lakehouse,Google Cloud 的技術都能協助您建構開放式、代管式且可支援 AI 的 lakehouse。