隨著社群媒體、行動裝置等數位平台的普及,影像、音訊、視訊和文件等非結構化資料呈現爆炸式增長。這一趨勢讓企業和組織面臨前所未有的挑戰,如何從大量非結構化資料中挖掘出有價值的見解成為關鍵。

為應對這一挑戰,Google 推出了 AI 雲資料平台 BigQuery 與完全託管的 AI 開發平台 Vertex AI 的整合方案。這一整合為新一代 AI 應用程式的構建提供了強大支持,讓企業能夠利用各種生成式 AI 模型(如 Gemini),以及 AI 服務(如 Document AITranslation AI ),更有效處理 BigQuery 物件表中的非結構化資料。BigQuery 已經支持使用 Vertex AI 中託管的各類大型語言模型(LLM)來進行數據分析,模型包括 Gemini 1.0 ProGemini 1.0 Pro Vision 在文本摘要和情緒分析等分析狀態中表現尤為出色,通常皆可再短時間內達成目標。

若是以上功能無法滿足您的需求,BigQuery 也有支持使用 LoRA 技術進行模型微調,在 LoRA 中需要精細定義模型行為,或者當 prompt 無法穩定產生預期結果時,顯得尤其重要。LoRA 技術微調讓模型能夠學習特定回應方式,採取新的行為並隨時更新最新資訊。

最近,Google Cloud在 BigQuery 中添加了對 Gemini 模型最新的支持,以及資安安全的部分: 

  1. Gemini 1.5 模型支援提升:ML.GENERATE_TEXT SQL 函數現已支援 Gemini 1.5 Pro 和 Gemini 1.5 Flash 基礎模型,讓 BigQuery 使用者能以更高品質執行自然語言處理 (NLP)、視覺任務、音訊分析及 PDF 檔案摘要等多模態應用。
  2. 增強的 AI 安全性與精準回應: Google Cloud 強化了 ML.GENERATE_TEXT SQL 函數,新增 Google 搜尋基礎與負責任 AI (RAI) 回應的可自訂安全性設定,使用者可定義仇恨言論、危險內容等的阻止閾值,確保生成內容的安全與精準。
  3. Gemini 1.0 模型的調整與評估: Google Cloud 擴展了 CREATE MODEL DDL 和 ML.EVALUATE SQL 函數,支持 BigQuery 使用者微調及評估 Gemini 1.0 Pro 模型,進一步自訂 AI 能力。

以下部分我們實際展示,如何深入地研究新功能。

BigQuery ML 和 Gemini 1.5

若要在 BigQuery 中使用 Gemini 1.5 Pro,請先建立代表託管 Vertex AI Gemini 端點的遠端模型。此步驟通常只需要幾秒鐘。建立模型後,使用該模型產生文本,將資料直接與 BigQuery 表結合。

 

CREATE MODEL `mydataset.gemini_1_5_pro`

REMOTE WITH CONNECTION `us.bqml_llm_connection`

OPTIONS(endpoint = ‘gemini-1.5-pro’);

 

在 Gemini 1.5 中,ML.GENERATE_TEXT() 函數可以接受 BigQuery 託管表作為輸入,自動將 Prompt  語句附加到每個資料庫記錄以自訂每行的提示。 「溫度」 Prompt  參數控制產生反應的隨機性。

SELECT *

FROM

 ML.GENERATE_TEXT(

   MODEL mydataset.gemini_1_5_pro,

   (

     SELECT CONCAT(

            ‘Create a descriptive paragraph of no more than 25 words for a product with in a department named ‘, department,

            ‘, category named “‘, category, ‘”‘,

            ‘and the following name: ‘, name

        )

 AS prompt

     FROM mydataset.my_table

   ),

   STRUCT(0.8 AS temperature));

 

在 Gemini 1.5 模型中,ML.GENERATE_TEXT() 函數現在還可以將物件表作為輸入進行處理,從而允許您處理非結構化數據,例如圖像、視訊、音訊檔案和文件。使用物件表時,提示是放置在 STRUCT 選項中的單一字串。然後,該提示將逐行單獨應用於表格中的每個物件。

 

本文內容翻譯並改寫自 Google Cloud 官方部落格,為您提供最前沿的科技趨勢與應用實例。宏庭科技一直致力於利用 AI 技術,幫助企業挖掘和分析數據,進而實現卓越的商業效益。我們深知,在這個數位化與人工智能快速發展的時代,持續掌握最新的科技資訊至關重要。近期,宏庭科技更協助台灣某知名連鎖餐飲品牌,運用 Google Maps 輿情分析技術,深入剖析周圍商家的情緒與外觀表現,為該品牌制定精準的商業策略。如果您對這些技術感興趣或希望瞭解更多如何應用於企業的具體案例,歡迎隨時與宏庭科技聯繫。我們期待成為您的數位轉型合作夥伴,並為您帶來最新、最熱門的科技話題,助力企業在競爭中脫穎而出。