整合開放資料格式的創新技術、智慧型「從資料到 AI」治理機制、加速資料處理功能,以及先進的 AI 輔助開發工具,協助您簡化資料管理流程,加速創新。
BigLake
透過企業級儲存空間管理服務,享有 Apache Iceberg 的開放性
BigLake 提供原生 Iceberg 儲存引擎,可與 Cloud Storage 互通,並提供統一的執行階段中繼資料管理機制、進階數據分析和資料科學功能,以及內建治理機制的自動化資料管理機制。任何與 Iceberg 相容的引擎,都能使用 BigLake 的自動化資料表管理功能,進而提升查詢效能並降低成本。
“與 Google Cloud 合作對我們來說至關重要,因為這有助於我們建構 Snap 的下一代開放式 lakehouse,並在開發人員社群中普及 Spark 和 Iceberg!”
Snap 資深軟體工程師兼資深部門主管 Zhengyi Liu
Google Cloud Serverless for Apache Spark
無伺服器 Spark 提供高效能和極快的處理速度,而且無須管理叢集
使用 Google Cloud Serverless for Apache Spark,推動 lakehouse 轉型。使用全新的 Lightning Engine,您可以快速啟動應用程式,且不會造成作業負擔,同時還能提升 Spark 工作負載的效能。搭配使用強大的 Gemini,可提升工作效率,並將 TCO 降低高達 60%。
“我們認為 SQL 和 Spark 是相輔相成的兩種存取及轉換資料的方式。在需要複雜商業邏輯的用途上,Spark 特別有用,雖然這類用途較少見,但對業務至關重要。有了整合式 SQL、Spark 和 AI 平台,並透過筆記本進行開發,這些重要用途將大幅簡化。”
Trivago 內容工程部門主管 Andrés Sopeña Pérez
Dataplex Universal Catalog
簡化資料探索作業,提升 data lakehouse 的可信度和理解度
Dataplex Universal Catalog 是 Google Cloud 的統合式「從資料到 AI」治理解決方案。這項 AI 輔助目錄會將 Google Cloud 中的業務、技術和作業中繼資料集中管理,並提供 AI 輔助洞察資料。這個平台支援 Apache Iceberg 等開放格式,可讓您在整個 lakehouse 中實現整合式治理。
“Dataplex 有助於將我們的資料平台轉變成安全、高效率且可擴充的資料生態系統。著重於資料治理、探索、觀測和安全性法規遵循,協助我們因應數位時代的資料管理難題。有了 Dataplex,我們的團隊就能充分發揮資料的潛力,推動 Box.Inc 持續成長及創新。”
Box.Inc 資深產品經理 Asmita Kulkarni
BigQuery Studio 和 IDE 擴充功能
透過簡化開發與作業流程,強化 Apache Spark 在 lakehouse 架構中執行進階資料科學和 AI/機器學習工作負載的能力
Dataproc 為機器學習執行階段提供全新創新功能,並搭配 GPU 驅動程式和常見的機器學習程式庫,進而提升 Spark 在 lakehouse 中的 AI/機器學習效能。BigQuery Studio 和第三方 IDE 中的 Colab Enterprise 筆記本提供整合式 MLOps 和 Vertex AI,以及簡化的正式環境 pipeline,可加速資料科學工作。
“Shopify 投入資源聘請具備多元技能的團隊,以便掌握資料科學和工程領域的最新趨勢。在 BigQuery Studio 的早期測試中,我們很喜歡 Google 能為不同使用者連結不同工具,並提供簡單的使用體驗。我們認為這項功能可為團隊成員減少阻礙,同時不犧牲預期的 BigQuery 規模。”
Shopify 資料工程部門主管 Zac Roberts
BigLake
透過企業級儲存空間管理服務,享有 Apache Iceberg 的開放性
BigLake 提供原生 Iceberg 儲存引擎,可與 Cloud Storage 互通,並提供統一的執行階段中繼資料管理機制、進階數據分析和資料科學功能,以及內建治理機制的自動化資料管理機制。任何與 Iceberg 相容的引擎,都能使用 BigLake 的自動化資料表管理功能,進而提升查詢效能並降低成本。
“與 Google Cloud 合作對我們來說至關重要,因為這有助於我們建構 Snap 的下一代開放式 lakehouse,並在開發人員社群中普及 Spark 和 Iceberg!”
Snap 資深軟體工程師兼資深部門主管 Zhengyi Liu
Google Cloud Serverless for Apache Spark
無伺服器 Spark 提供高效能和極快的處理速度,而且無須管理叢集
使用 Google Cloud Serverless for Apache Spark,推動 lakehouse 轉型。使用全新的 Lightning Engine,您可以快速啟動應用程式,且不會造成作業負擔,同時還能提升 Spark 工作負載的效能。搭配使用強大的 Gemini,可提升工作效率,並將 TCO 降低高達 60%。
“我們認為 SQL 和 Spark 是相輔相成的兩種存取及轉換資料的方式。在需要複雜商業邏輯的用途上,Spark 特別有用,雖然這類用途較少見,但對業務至關重要。有了整合式 SQL、Spark 和 AI 平台,並透過筆記本進行開發,這些重要用途將大幅簡化。”
Trivago 內容工程部門主管 Andrés Sopeña Pérez
Dataplex Universal Catalog
簡化資料探索作業,提升 data lakehouse 的可信度和理解度
Dataplex Universal Catalog 是 Google Cloud 的統合式「從資料到 AI」治理解決方案。這項 AI 輔助目錄會將 Google Cloud 中的業務、技術和作業中繼資料集中管理,並提供 AI 輔助洞察資料。這個平台支援 Apache Iceberg 等開放格式,可讓您在整個 lakehouse 中實現整合式治理。
“Dataplex 有助於將我們的資料平台轉變成安全、高效率且可擴充的資料生態系統。著重於資料治理、探索、觀測和安全性法規遵循,協助我們因應數位時代的資料管理難題。有了 Dataplex,我們的團隊就能充分發揮資料的潛力,推動 Box.Inc 持續成長及創新。”
Box.Inc 資深產品經理 Asmita Kulkarni
BigQuery Studio 和 IDE 擴充功能
透過簡化開發與作業流程,強化 Apache Spark 在 lakehouse 架構中執行進階資料科學和 AI/機器學習工作負載的能力
Dataproc 為機器學習執行階段提供全新創新功能,並搭配 GPU 驅動程式和常見的機器學習程式庫,進而提升 Spark 在 lakehouse 中的 AI/機器學習效能。BigQuery Studio 和第三方 IDE 中的 Colab Enterprise 筆記本提供整合式 MLOps 和 Vertex AI,以及簡化的正式環境 pipeline,可加速資料科學工作。
“Shopify 投入資源聘請具備多元技能的團隊,以便掌握資料科學和工程領域的最新趨勢。在 BigQuery Studio 的早期測試中,我們很喜歡 Google 能為不同使用者連結不同工具,並提供簡單的使用體驗。我們認為這項功能可為團隊成員減少阻礙,同時不犧牲預期的 BigQuery 規模。”
Shopify 資料工程部門主管 Zac Roberts