在 9 月的 Gemini for Work 活動中,Google Cloud 展示了生成式 AI 如何重塑企業的工作模式。且觀察年度動向,也可以清楚地看見一個趨勢:「如果說 2023 年是探索與實驗 AI 的時代,那麼今年 2024 則是將 AI 真正落地,帶來現實世界影響的關鍵時刻。」
生成式 AI 擁有改變工作方式的巨大潛力,但前提是輸出必須具備可靠性與相關性。然而,大語言模型(LLMs)知識在訓練期間被靜態化,因此無法即時存取最新資訊或內部數據。此外,LLMs 的設計特性使其具有創造性與機率性,因此可能出現幻覺或生成不準確的內容。再加上,這些模型缺乏內建的來源歸屬功能,使得提供最新且具上下文相關性的回應更加困難。
為了解決這些挑戰,Google Cloud 推出了一系列技術,包括基礎模型接地(Grounding)、檢索增強生成(RAG),以及搜尋技術等。Grounding 意味著將外部事實性資料與 LLM 連結,使生成的回應更貼近現實並降低幻覺風險。RAG 則是一種透過知識庫檢索相關資訊並作為上下文提供的基礎技術,而搜尋則是 RAG 背後的核心驅動技術,確保系統能在知識庫中快速定位正確資訊。
要釋放生成式 AI 的真正潛力,企業需要將 LLMs 與 Google 所謂的「企業真相」(Enterprise Truth)相連結。「企業真相」指的是值得信賴的內部數據來源,涵蓋文件、電子郵件、儲存系統中的資料,以及第三方應用程序,甚至來自網路的最新資訊,這些都能幫助知識型工作者更高效地完成工作。透過連結「企業真相」與 LLMs,能夠提供更準確、具上下文相關性且最新的回應,讓生成式 AI 真正發揮現實世界的影響力。這不僅意味著客戶服務的提升,能提供更精準且個人化的支援,還包括自動化任務的改進,例如生成報告、摘要文件等工作更為準確。此外,透過分析多元數據來源深入挖掘趨勢與機會,企業能獲得更深刻的洞察,最終以更全面的客戶需求與市場趨勢為基礎,開發新產品與服務,推動創新發展。
利用網路獲取最新知識
LLMs 有一個根本的限制,學習的知識依賴他們接受培訓的數據,隨著時間的推移,這些數據會變得過時。這將影響到任何需要最新消息的回答品質,例如最新新聞、體育賽事或音樂會的日期。以 Google 搜尋為基礎,語言模型可以從網路上找到新鮮資訊,甚至提供來源連結,以便您可以進行事實查核或了解更多資訊。Google Search 的 grounding 功能已內建於 Gemini 模型中,只需切換開啟,Gemini 即可利用 Google Search 提供基於最新資訊的回應。
如果您不確定您的請求是否需要使用 Google 搜索,您現在可以使用新的「動態檢索」(dynamic retrieval) 功能。只需打開它,Gemini 就會解釋您的查詢,並預測是否需要最新資訊以提高答案的準確度。您還可以設定預測分數的門檻,當超過該門檻時,Gemini 會自動啟用 Google Search grounding 功能。這意味著您可以兼顧兩個優勢,在需要時獲得高品質的回應,同時降低成本,因為 Gemini 只會在必要時調用 Google Search,滿足用戶查詢需求。
利用數據連結整個企業的數據真相
連接到新的消息只是一個開始,真正的價值在於將生成式 AI 與企業專屬的數據相結合。檢索增強生成(RAG)是一種技術,可通過連接 LLMs 與非訓練數據來源,幫助模型在生成回應前檢索相關資訊。然而,市面上的 RAG 解決方案良莠不齊,其中許多無法滿足企業需求,因為它們在質量、可靠性或可擴展性上存在不足。生成式 AI 應用的質量,取決於它檢索企業數據的能力。
這正是 Vertex AI 的強項所在!無論您需要的是開箱即用的簡單解決方案、自行通過 API 構建 RAG 系統,還是使用高效能的向量嵌入進行檢索,Vertex AI 都提供了一套全面的選項來滿足您的需求。
以下是企業 RAG 的簡單指南:
首先,對於大多數企業應用,建議使用開箱即用的 RAG。Vertex AI Search 透過 Google 級別的高品質 RAG(也就是搜尋技術),簡化了端點到端點的資訊發現流程。利用 Vertex AI Search,Google Cloud 將全權管理您的 RAG 服務,涵蓋構建 RAG 系統所需的所有環節,包括光學字符識別(OCR)、數據理解與標註、智能分段、嵌入、索引、存儲、查詢改寫、拼寫檢查等。更重要的是,Vertex AI Search 可輕鬆連接到您的內部數據,例如文件、網站、資料庫、結構化數據,甚至是第三方應用(如 JIRA 或 Slack),內建的連接器讓這一切變得更簡單。整個系統的設置只需幾分鐘即可完成,若需了解更多,可以查看另一篇詳細說明 RAG 介紹文章。
開發者可以透過 Vertex Grounded Generation Playground 在 GitHub 上,體驗將 Google Search 和企業數據結合的 grounding 技術
接著,針對特定需求構建自己的 RAG 系統:如果您需要打造專屬的檢索增強生成(RAG)系統,Vertex AI 提供了多種現成的 API,包括版面解析、排序、grounding 生成、grounding 檢查、文本嵌入和向量搜尋等功能。其中,版面解析器可將非結構化文件轉換為結構化的數據表示,並具備對圖表和數據的多模態理解能力,極大提升了文檔檢索的質量——例如處理嵌入表格和圖片的 PDF 文件,這對許多 RAG 系統來說是一大挑戰。
Google Cloud 的向量搜尋產品具備高效能,特別適合企業進行客製化資訊檢索與嵌入應用。該技術可擴展至數十億個向量,並能在毫秒內找到最接近的數據資訊,非常適合大型企業的需求。此外,向量搜尋現在支援結合嵌入式搜尋與語義搜尋技術的混合搜尋,確保用戶獲得最相關且精準的回應。
無論您如何構建生成式 AI 應用,全面的評估都是確保其符合特定需求的關鍵。Vertex AI 的生成式 AI 評估服務能讓您定義專屬的評估標準,準確掌握模型在特定應用場景中的表現,無論是創造內容還是分析文件,均能獲得量身定制的洞察。
宏庭科技利用數據帶動產業進步與營收
生成式 AI 初期帶來的興奮逐漸轉向更務實的方向,聚焦於實現現實應用與可量化的商業價值。而如何落地正是達成這一目標的關鍵,宏庭科技身為 Google Cloud 菁英夥伴,曾執行多項大型專案,幫助企業數位轉型外,也協助導入 AI 模型,生成文案內容根植於企業自身的真實數據與背景,進一步轉化為有價值的洞察。
宏庭科技曾成功協助全球零售企業運用檢索增強生成(RAG)技術,將分散的客戶資料進行整合與分析,實現高度個性化的商品推薦。透過 RAG 技術,零售商能夠精準提取與客戶需求相關的資訊,提供即時且具參考價值的建議,特別是在高單價商品的選購情境中,有效緩解客戶的決策壓力。此外,該技術還幫助企業提升了搜尋結果的相關性與準確性,進一步優化了整體購物體驗,實現商業價值與客戶滿意度的雙贏。
本文內容翻譯並改寫自 Google Cloud 官方部落格,為您提供最前沿的科技趨勢與應用實例。本文探討了 Google Cloud 對於 Vertex AI 及 RAG 技術落地,可查看更多宏庭科技的成功案例。宏庭科技身為 Google Cloud 的菁英合作夥伴,將持續致力於推動這些創新技術的實際應用,協助企業客戶把握 AI 帶來的商業契機。若您有興趣了解更多如何運用 Vertex AI 來加速您的工作進程,歡迎與我們聯繫,宏庭科技期待成為您數位轉型的最佳夥伴。若您對 Google Cloud 的多元應用有興趣,請密切關注我們的活動訊息,期待在活動中與您相見!