在 Gemini 協助下分析資料

本教學課程將說明如何使用 Gemini in BigQuery 的 AI 輔助功能來分析資料。

以本教學課程的範例來說,請假設您是需要從資料集分析及預測產品銷售情形的資料分析師。

本教學課程假設您熟悉 SQL 和基本資料分析工作,但不必具備 Google Cloud 產品知識。如果您剛開始使用 BigQuery,請參考 BigQuery 快速入門導覽課程

目標

  • 使用 Gemini in BigQuery 回答有關 BigQuery 如何處理特定資料分析工作的問題。
  • 透過提示讓 BigQuery 中的 Gemini 尋找資料集,並說明及產生 SQL 查詢。
  • 建構機器學習 (ML) 模型,預測未來週期。

費用

本教學課程使用下列可計費的 Google Cloud 產品:

如要根據預測用量估算費用,請使用Pricing Calculator

事前準備

  1. In the Google Cloud console, on the project selector page, select or create a Google Cloud project.

    Go to project selector

  2. 確認已為 Google Cloud 專案設定 Gemini in BigQuery。
  3. 前往 Google Cloud 控制台的「BigQuery」頁面。

    前往 BigQuery

  4. 建立名為 bqml_tutorial 的資料集。您可以使用資料集儲存資料庫物件,包括資料表和模型。

  5. 如要啟用完成本教學課程所需的 BigQuery 中的 Gemini 功能,請在 BigQuery 工具列中依序按一下「pen_spark Gemini」,然後選取下列選項:

    • 自動補全
    • 自動產生
    • 說明

瞭解 BigQuery 功能

在開始之前,建議您進一步瞭解 BigQuery 如何處理資料查詢。如需說明,可以向 BigQuery 中的 Gemini 傳送自然語言陳述式 (即提示),例如:

  • 「How do I get started with BigQuery?」(如何開始使用 BigQuery?)
  • 「What are the benefits of using BigQuery for data analysis?」(將 BigQuery 用於資料分析的好處為何?)
  • 「How does BigQuery handle auto-scaling for queries?」(BigQuery 如何針對查詢自動調整資源配置?)

Gemini in BigQuery 也能提供資料分析方法相關資訊。針對這類協助,你可以傳送提示,例如:

  • 「How do I create a time series forecasting model in BigQuery?」(如何在 BigQuery 中建立時間序列預測模型?)
  • 「如何將不同類型的資料載入 BigQuery?」

存取及分析資料

Gemini in BigQuery 可協助您瞭解可以存取的資料,以及如何分析這些資料。

在這個範例中,假設你需要下列協助:

  • 找出要分析的銷售資料集和資料表。
  • 瞭解資料表和查詢在銷售資料集中的關聯方式。
  • 瞭解複雜查詢,並撰寫使用資料集的查詢。

尋找資料

在開始查詢資料前,您需要知道自己可存取哪些資料。每種資料產品整理和儲存資料的方式不盡相同。

如需說明,可以向 Gemini in BigQuery 傳送提示,例如「How do I learn which datasets and tables are available to me in BigQuery?」(如何查看我可以在 BigQuery 使用哪些資料集和資料表?)。

  1. 前往 Google Cloud 控制台的「BigQuery」頁面。

    前往 BigQuery

  2. 在 Google Cloud 控制台工具列中,按一下「spark」「Open or close Gemini Cloud Assist chat」。

  3. 在「Cloud Assist」面板中輸入提示 How do I learn which datasets and tables are available to me in BigQuery?

  4. 按一下 send「Send prompt」

    瞭解 Gemini for Google Cloud 如何使用您的資料,以及使用時機

    回應中包含多種方式,可用於列出資料集中的專案、資料集或資料表。

  5. 選用:如要重設對話記錄,請在「Cloud Assist」面板中依序按一下 delete「清除對話」和「重設對話」

瞭解並在 BigQuery 中編寫 SQL

在本例中,假設您已選取要分析的資料,現在想查詢該資料。無論是協助您瞭解複雜且難以剖析的查詢,還是產生新的 SQL 查詢,BigQuery 中的 Gemini 都能協助您使用 SQL。

透過提示讓 Gemini 說明 SQL 查詢

假設您想瞭解他人撰寫的複雜查詢。Gemini in BigQuery 可用平實的語言說明查詢,例如查詢語法、底層結構定義和業務情境。

  1. 前往 Google Cloud 控制台的「BigQuery」頁面。

    前往 BigQuery

  2. 在查詢編輯器中,開啟或貼上要讓 Gemini 說明的查詢。例如:

    SELECT
      u.id AS user_id,
      u.first_name,
      u.last_name,
      avg(oi.sale_price) AS avg_sale_price
    FROM `bigquery-public-data.thelook_ecommerce.users` AS u
    JOIN `bigquery-public-data.thelook_ecommerce.order_items` AS oi
      ON u.id = oi.user_id
    GROUP BY 1, 2, 3
    ORDER BY avg_sale_price DESC
    LIMIT 10
    
  3. 醒目顯示查詢,然後按一下「auto_awesome」auto_awesome「Explain this selected query」(說明所選查詢)。

    在「Cloud Assist」面板中,系統會傳回類似以下的回應:

    The intent of this query is to find the top 10 users by average sale price.
    The query first joins the users and order_items tables on the user_id
    column. It then groups the results by user_id, first_name, and last_name,
    and calculates the average sale price for each group. The results are then
    ordered by average sale price in descending order, and the top 10 results
    are returned.
    

產生 SQL 查詢,根據日期和產品分類銷售資料

在這個範例中,您要產生查詢,列出每天的熱銷產品。接著,您可以使用 thelook_ecommerce 資料集中的資料表,透過提示讓 BigQuery 中的 Gemini 產生查詢,根據訂單產品和產品名稱計算銷售量。

這類查詢通常很複雜,但您可以使用 BigQuery 中的 Gemini 自動建立陳述式。您可以提供提示,要求 Gemini 根據資料結構定義產生 SQL 查詢。即使您沒有編寫程式碼、不太瞭解資料結構定義,或只具備 SQL 語法的基礎知識,Gemini 都可以建議一或多個 SQL 陳述式。

如要提示 BigQuery 中的 Gemini 產生列出熱門產品的查詢,請按照下列步驟操作:

  1. 前往 Google Cloud 控制台的「BigQuery」頁面。

    前往 BigQuery

  2. 在導覽選單中,按一下「Studio」

  3. 按一下 「SQL 查詢」。「探索工具」窗格會自動載入所選資料庫。

  4. 在查詢編輯器中輸入下列提示,然後按下 Enter 鍵

    # select the sum of sales by date and product casted to day from bigquery-public-data.thelook_ecommerce.order_items joined with bigquery-public-data.thelook_ecommerce.products
    

    井字 (#) 字元會提示 BigQuery 中的 Gemini 產生 SQL。#Gemini in BigQuery 會建議下列類似的 SQL 查詢:

    SELECT
      sum(sale_price),
      DATE(created_at),
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3
    
  5. 如要接受建議的程式碼,請按下 Tab 鍵並點按「執行」,開始執行 SQL 陳述式。您也可以捲動瀏覽建議的 SQL,接受陳述式建議的特定字詞。

  6. 在「查詢結果」窗格,檢視查詢結果。

建構預測模型並查看結果

在這個範例中,您會使用 BigQuery ML 執行以下操作:

  • 使用趨勢查詢建構預測模型。
  • 使用 BigQuery 中的 Gemini 提供說明及協助撰寫查詢,以查看預測模型的結果。

您將搭配使用以下範例查詢與實際銷售資料,這類資料會輸入至模型。查詢會用來建立機器學習模型。

  1. 如要建立機器學習預測模型,請在查詢編輯器中執行下列 SQL 查詢:

    CREATE MODEL bqml_tutorial.sales_forecasting_model
      OPTIONS (
        MODEL_TYPE = 'ARIMA_PLUS',
        time_series_timestamp_col = 'date_col',
        time_series_data_col = 'total_sales',
        time_series_id_col = 'product_id')
    AS
    SELECT
      sum(sale_price) AS total_sales,
      DATE(created_at) AS date_col,
      product_id
    FROM
      `bigquery-public-data.thelook_ecommerce.order_items`
        AS t1
    INNER JOIN `bigquery-public-data.thelook_ecommerce.products` AS t2
      ON t1.product_id = t2.id
    GROUP BY 2, 3;
    

    您可以使用 BigQuery 中的 Gemini 瞭解這項查詢

    建立模型後,「查詢結果」窗格中的「結果」分頁會顯示類似以下的訊息:

    Successfully created model named sales_forecasting_model.
    
  2. 在「Cloud Assist」面板中,輸入 BigQuery 中的 Gemini 提示,讓 Gemini 協助您撰寫查詢,在模型完成時取得預測結果,例如輸入 How can I get a forecast in SQL from the model?

    系統會根據提示的上下文,在回覆中提供預測銷售情形的機器學習模型範例:

    SELECT
      *
    FROM
      ML.FORECAST(
        MODEL `PROJECT_ID.bqml_tutorial.sales_forecasting_model`,
        STRUCT(
          7 AS horizon,
          0.95 AS confidence_level))
    

    在這個回應中,PROJECT_ID 是您的Google Cloud 專案。

  3. 在「Cloud Assist」面板中,複製 SQL 查詢。

  4. 在查詢編輯器中執行 SQL 查詢。

清除所用資源

本教學課程需使用資源,如要避免系統向您的 Google Cloud 帳戶收取相關費用,請刪除在本課程中建立的 Google Cloud 專案。或者,您也可以刪除個別資源。

刪除專案

  1. In the Google Cloud console, go to the Manage resources page.

    Go to Manage resources

  2. In the project list, select the project that you want to delete, and then click Delete.
  3. In the dialog, type the project ID, and then click Shut down to delete the project.

刪除資料集

刪除專案將移除專案中所有的資料集與資料表。如果您希望重新使用專案,可以刪除本教學課程中建立的資料集。

  1. 前往 Google Cloud 控制台的「BigQuery」頁面。

    前往 BigQuery

  2. 在導覽選單中,選取您建立的 bqml_tutorial 資料集。

  3. 如要刪除資料集、資料表和所有資料,請按一下「刪除資料集」

  4. 如要確認刪除,請在「Delete dataset」對話方塊中輸入資料集名稱 (bqml_tutorial),然後按一下「Delete」

後續步驟