接地與 RAG — Generative AI Leader 學習筆記

Q: 接地和 RAG 有什麼區別？

答： 接地 是目標——將模型的回答連結至可驗證的權威來源，讓它停止產生幻覺。**RAG（檢索增強生成）**是實現接地的主流技術：先檢索相關文件，再以這些文件生成答案。簡言之，接地是結果，RAG 是方法。在 Google Cloud 上，基於 RAG 的接地透過 Vertex AI Search 和 Vertex AI Agent Builder 提供。

Q: 我應該用接地還是微調，來讓模型獲得公司資訊？

答： 使用 接地（RAG） 。微調是用於教導模型某種 行為、語氣或輸出格式 ——不是用於注入事實。微調成本高昂、需要訓練週期、在資訊變動後會過時，也無法產生引用來源。接地讓你只需更新 Vertex AI Search 中的文件即可更新知識，立即生效，且具備可稽核的引用來源。許多系統兩者並用：以微調處理風格，以接地處理事實。

Q: Vertex AI Search 和 Vertex AI Agent Builder 有什麼區別？

答： Vertex AI Search 是受管理的檢索引擎——它擷取、索引和語意搜尋你的語料庫，提供 RAG 的「檢索」那一半。 Vertex AI Agent Builder 位於其上方，透過結合 Vertex AI Search 檢索、Gemini 生成、對話管理和引用來源，提供完整的接地對話式應用程式——聊天機器人或代理人。需要搜尋時用 Vertex AI Search；需要完整的接地代理人時用 Agent Builder。

Q: 向量嵌入和向量搜尋用白話怎麼說？

答： 向量嵌入 將一段文字轉換為一組代表其意義的數字列表，就像在一張巨大的「意義地圖」上標出每個概念的位置。 向量搜尋 在那張地圖上找最近的鄰居，讓問題能夠檢索出意思相同但用詞不同的文件——例如「忘記密碼」能匹配到關於「登入憑證」的文件。向量搜尋讓 RAG 的檢索成為語意性而非關鍵字性的，而 Vertex AI Search 為你執行這些工作。

Q: 接地能完全消除幻覺嗎？

答： 不能。接地大幅 降低 幻覺，方法是向模型提供真實事實，並指示它只從該脈絡作答；配置良好的接地系統在無從回答時說「我不知道」而非捏造答案。但模型仍然可能誤讀段落。關鍵的好處是接地讓錯誤 可被偵測 ：引用來源讓人類可以對每個聲明與來源進行核查，這也是接地成為面向客戶及受監管使用案例標準做法的原因。

Q: 何時應該用 Grounding with Google Search，何時應該用自有資料接地？

答： 當問題關乎 公開世界且即時性重要 時，使用 Grounding with Google Search ——時事、最新產品新聞、最新的公開事實。當問題關乎 貴公司的私有知識 時，使用 透過 Vertex AI Search 以企業自有資料進行接地 ——內部政策、產品文件、目錄、合約。許多生產助理結合兩種來源，依問題類型選擇。

什麼是接地，為何重要

對 Generative AI Leader 考試而言，接地（Grounding）與 RAG 是將有趣的展示品與可以放心交給客戶使用的系統區分開來的關鍵概念。大型語言模型（LLM）本身是個聰明卻不可靠的敘事者：它訓練於某個時間點的公開文字快照，不知道公司最新的價目表或上一季的政策更新，而當它不知道答案時，往往會以十足的自信捏造一個。這種捏造稱為幻覺（Hallucination），是 GenAI 專案無法上線最常見的原因。

接地是將模型的回答連結至可驗證的權威來源的做法，讓模型所說的內容可以被核查。不再讓模型憑記憶回答，而是為它提供相關且可信賴的材料——最新的搜尋結果、產品文件、人資政策——並指示它依據這些材料作答。模型從一個無所不知的人變成先閱讀簡報再開口的分析師。

檢索增強生成（Retrieval-Augmented Generation，RAG）是接地的主流技術模式。RAG 分兩步：先檢索與使用者問題最相關的文件，再生成以這些文件為脈絡的答案。作為 Generative AI Leader，你不需要自己建置檢索引擎——Google Cloud 已將其封裝為 Vertex AI Search 和 Vertex AI Agent Builder。你的任務是判斷何時商業問題需要接地、為何它對面向客戶的場景是更安全的選擇，以及如何與微調區分。

白話文解釋

接地與 RAG 聽起來像深層機器學習的管線，但核心概念其實非常人性化：一個可信任的答案，必定有來源可以指明。以下三個類比說明接地的原理、RAG 的先檢索再生成流程，以及 Vertex AI Search 和 Agent Builder 如何將這個概念轉化為受管理的產品。

類比一：開卷考試 vs 閉卷考試（接地 vs 未接地生成）

想像兩位學生參加同一場艱難的考試。第一位學生參加閉卷考試：沒有筆記、沒有課本，只靠記憶。遇到只記得一半的題目，就寫下最有把握的猜測，並且措辭十分肯定——答個半對總比空白好。第二位學生參加開卷考試：課本就放在桌上，每個答案都必須引用出處頁碼。第二位學生答每題較慢，但答案正確、可查核，而且極難被判錯。

未接地的 LLM 就是那位閉卷學生。它完全依靠訓練過程中吸收的內容作答，一旦記憶模糊，便產生聽起來很有把握的幻覺。接地後的模型是開卷學生。透過接地，Vertex AI 從 Google Search 或企業資料庫中檢索相關段落，連同問題一起送給模型。模型被指示依據所提供的段落回答，並附上引用來源，指向確切的原始出處。

對 Generative AI Leader 考試而言，這個心智模型需要牢記：接地不會讓模型變聰明，而是改變了考試規則。一個銀行聊天機器人，引用內部文件中的現行利率並附上文件連結，是在參加開卷考試。一個從訓練記憶中背誦利率的聊天機器人，是在參加閉卷考試——在受監管的產業中，閉卷是不被接受的。Grounding with Google Search 是獲取最新公開事實的開卷書；透過 Vertex AI Search 進行的企業資料接地是獲取私有公司知識的開卷書。

類比二：律師在給出建議前先引用判例（RAG 的先檢索再生成流程）

一位好律師不會憑空回答客戶的問題。當客戶詢問「我可以提前終止這份合約嗎？」，律師會先走向法律圖書館——實體或數位皆可——檢索與這個情況相符的相關法條、合約條款和先例案件。只有在這之後，他才坐下來撰寫建議，而且建議中充滿引用：「依據第十二條，並與二○一九年判決一致，您可以……」。檢索步驟發生在前，並形塑了撰寫步驟。

這種兩段式節奏正是檢索增強生成。第一階段是檢索：使用者的問題被轉換為查詢，搜尋系統找出與之最相關的幾份文件。第二階段是生成：LLM 接收問題加上那些檢索到的文件，並以此為依據撰寫答案。律師的法律圖書館就是你的知識語料庫——你的客服文章、產品手冊、人資手冊、合約。律師的研究能力就是檢索引擎，在 Google Cloud 中是 Vertex AI Search。律師的起草能力就是負責生成的 Gemini 模型。

Generative AI Leader 考試希望你看清楚這個順序的重要性。如果律師先寫好建議，事後才查法律，那就是未接地的模型在為猜測找理由。RAG 強制執行「先研究，後撰寫」，這也是為什麼建立在 Vertex AI Agent Builder 上的 RAG 助理，可以回答模型在訓練期間從未見過的文件問題——包括你今天早上才上傳的文件。語料庫可以持續更新而無需重新訓練模型，就像法律圖書館增加新判決，律師不必重回學校一樣。

類比三：記者在刊登前核實事實（引用來源作為信任訊號）

一位負責任的記者不會在至少一個可信來源確認之前發布聲明，而刊出的報導會點名那個來源：「財政部指出……」、「本報記者審閱的文件顯示……」。這個具名來源讓讀者——以及編輯——能夠信任報導並加以核查。沒有來源的謠言部落格可能很有娛樂性，但嚴肅的讀者不會當作事實。有無引用來源，是新聞報導與流言蜚語的分野。

接地給 GenAI 的回答提供了相同的信任訊號。在 Vertex AI 中啟用 Grounding with Google Search 後，模型的回應會附帶接地後設資料——它所使用的搜尋結果和支持連結——以及一個信心指標。透過 Vertex AI Search 以企業資料進行接地時，每個答案都附有引用來源，指向具體的內部文件和段落。閱讀聊天機器人答案的業務人員可以點擊查看並核實，就像讀者核查記者來源一樣。

對 Generative AI Leader 考試而言，把引用來源視為業務控制措施，而非裝飾性功能。引用來源讓法規遵循長官能夠稽核面向客戶的助理，讓客服人員在轉達答案前確認內容，也讓終端使用者自行建立信任。它們還創造了問責機制：如果來源文件有誤，你修正文件，往後的每個答案都會自動改善——無需重新訓練模型。一個以 Agent Builder 建立的助理回答「您的退款期限為三十天〔退款政策，第三節〕」，是在像記者一樣刊登。一個回答「您的退款期限大概是三十天」且沒有連結的，是在散播流言。

RAG 管線的逐步說明

為了在考試中能推理接地的問題，你應該能夠用業務流程的語言描述 RAG 管線，即使你永遠不會親自寫程式碼。

步驟一：擷取並索引知識語料庫

在任何問題能夠被回答之前，公司的文件必須先進入可搜尋的儲存庫。PDF、網頁、客服工單、維基文章和資料庫記錄被擷取進來，切分成可處理的段落（Chunks），然後建立索引。在 Google Cloud 中，Vertex AI Search 負責從 Cloud Storage、BigQuery、網站和第三方連接器等來源進行這個擷取工作。這個語料庫就是模型將要閱讀的「開卷書」。

步驟二：將文字轉換為向量嵌入

每個文字段落都被轉換為向量嵌入（Vector Embedding）——一組以數字捕捉文字意義的列表。關於「年假」的段落和關於「休假政策」的段落，在這個數字空間中位置相近，儘管它們幾乎沒有共同的關鍵字。Vertex AI 上 Google 的文字嵌入模型會產生這些向量。向量嵌入讓語意搜尋成為可能——依意義而非確切字詞進行搜尋。

步驟三：以向量搜尋進行檢索

當使用者提出問題時，問題也被轉換為向量嵌入，**向量搜尋（Vector Search）**找出嵌入最接近它的段落。向量空間中的接近，代表意義上的接近。結果是一份最相關段落的短清單——通常是前幾名——準備好交給模型。

步驟四：擴增提示詞

檢索到的段落連同使用者的原始問題，以及「僅依據以下脈絡回答並引用來源」之類的指示，一起被插入提示詞（Prompt）中。這個步驟就是「檢索增強生成」中的「增強」。模型現在擁有一份聚焦的簡報，而非開放式的問題。

步驟五：生成接地後的答案

Gemini 模型從所提供的脈絡中撰寫答案，並附帶引用來源，連結回原始段落。如果脈絡中沒有答案，一個配置良好的接地系統會回答「我沒有這項資訊」，而非憑空捏造——這正是面向客戶使用時所需要的行為。

牢記五步驟 RAG 管線的順序：（一）擷取並索引語料庫、（二）將文字轉換為向量嵌入、（三）以向量搜尋檢索相關段落、（四）用這些段落擴增提示詞、（五）生成附有引用來源的接地答案。在 Google Cloud 上，步驟一至三由 Vertex AI Search 處理，Vertex AI Agent Builder 將全部五個步驟串接為受管理的應用程式。考試期待你能說出先檢索再生成的順序，而非數學原理。參見 https://cloud.google.com/vertex-ai/generative-ai/docs/grounding/overview。

檢索增強生成（Retrieval-Augmented Generation，RAG） 是一種架構，先從外部知識來源檢索相關文件，再以這些文件為條件生成答案，藉此改善 LLM 的回應品質。它讓模型能夠利用訓練期間從未見過的私有或最新資訊來回答問題，並支援引用來源，使答案可被驗證。在 Google Cloud 中，RAG 透過 Vertex AI Search 和 Vertex AI Agent Builder 以受管理的功能形式提供。參見 https://cloud.google.com/vertex-ai/generative-ai/docs/grounding/overview。

向量嵌入與向量搜尋的白話說明

接地討論中不斷出現兩個術語：嵌入（Embeddings） 和向量搜尋（Vector Search）。作為 Generative AI Leader，你需要有概念性而非數學性的掌握。

向量嵌入是將一段文字——一個句子、一段落、一份產品描述——轉換為一組代表其意義的數字列表的方式。可以把它想像成在一張巨大的「意義地圖」上，為每個概念賦予一組 GPS 座標。「如何重設密碼」和「我忘記登入憑證」這兩個句子在這張地圖上位置接近，因為它們表達的意思幾乎相同，即便它們幾乎沒有共同的字詞。

向量搜尋（也稱為語意搜尋或相似性搜尋）是在那張意義地圖上查找最近鄰的動作。當使用者提出問題時，你把問題放到地圖上，取得坐落在最近位置的文件。這比傳統的關鍵字搜尋更適合用於接地：關鍵字搜尋可能漏掉一份使用「憑證」字眼而使用者鍵入「密碼」的相關文件，但向量搜尋因為意義相符而能找到它。

考試時，記住這條鏈：文件變成嵌入 → 嵌入儲存在索引中 → 問題變成嵌入 → 向量搜尋找出最接近的文件嵌入 → 這些文件為答案提供接地。 Vertex AI Search 作為受管理的服務為你執行所有這些工作，因此業務團隊無需聘用搜尋工程團隊即可獲得語意檢索能力。

Google Cloud 上接地的兩種方式

Generative AI Leader 考試期待你能區分兩種接地來源，因為它們解決的是不同的業務問題。

Grounding with Google Search

Grounding with Google Search 將 Gemini 連結至即時的 Google Search 結果。啟用後，模型可以引入最新的、公開的、全網規模的事實——今天的新聞、近期的產品發布、當前的事件細節——這些都不在它的訓練資料中。回應會附帶接地後設資料和支持連結，並降低對時效性問題的幻覺率。當問題關乎公開世界且即時性重要時，這是正確的選擇：「這個產品最新發布了哪些功能？」、「目前關於 X 的法規是什麼？」

以企業自有資料進行接地

以企業資料進行接地透過 Vertex AI Search 將模型連結至你的私有語料庫。模型從你的客服文章、內部維基、合約和目錄作答——這些內容是 Google Search 永遠看不到的。當問題關乎貴公司的特定知識時，這是正確的選擇：「我們的退換貨政策是什麼？」、「我們的 SLA 承諾了什麼？」、「如何設定我們的產品？」答案附有指向內部文件的引用來源。

許多真實系統將兩者結合：客服代理對政策問題使用企業資料接地，對一般背景使用 Google Search 接地。考試情境關鍵字告訴你選哪一個——「內部的」、「私有的」、「我們的文件」指向企業資料接地；「最新的」、「時事新聞」、「公開網路」指向 Grounding with Google Search。

對 Generative AI Leader 考試而言，要將接地來源與問題類型對應起來。Grounding with Google Search 提供最新的、公開的、全網規模的事實，當情境強調即時性或外部資訊時，它是正確答案。透過 Vertex AI Search 以企業自有資料進行接地提供私有的公司知識，當情境強調內部文件、政策或目錄時，它是正確答案。選錯來源——例如，用 Grounding with Google Search 來回答內部人資政策的問題——會產生不相關或空洞的結果。參見 https://cloud.google.com/vertex-ai/generative-ai/docs/grounding/overview。

Vertex AI Search — 受管理的檢索

Vertex AI Search 是 Google Cloud 的受管理企業搜尋與檢索產品，也是企業資料接地背後的引擎。它讓企業連接資料來源——存放 PDF 的 Cloud Storage 儲存貯體、BigQuery 資料表、網站，以及連接至 Confluence 或 Jira 等系統的連接器——並在短時間內獲得 Google 品質的搜尋體驗，具備語意理解和排序能力。

在 RAG 中，Vertex AI Search 提供管線的檢索那一半。它處理擷取、切段、嵌入、索引和排序，讓建置者不必自行組裝這些元件。開發人員可以呼叫 Vertex AI Search 取得最相關的段落，直接送進 Gemini 提示詞。由於 Google 維護搜尋基礎設施，語料庫可以擴展到數百萬份文件，而無需客戶自行運行向量資料庫。

以考試術語來說，其業務價值是縮短上市時間並降低營運負擔。企業可以在幾天內建立起有接地能力的知識助理，而非花數個月自行打造客製化的檢索技術棧。若要了解它如何融入更廣泛的生成式平台，請參閱 Vertex AI for Generative AI 章節。

Vertex AI Agent Builder — 受管理的 RAG 與代理人

Vertex AI Agent Builder 位於 Vertex AI Search 上方一個層次。Vertex AI Search 提供檢索，Agent Builder 則提供完整的對話式應用程式——一個以你的資料為基礎進行接地的聊天機器人或代理人——並將先檢索再生成的 RAG 流程整合為一。它結合了負責生成的 Gemini、負責檢索的 Vertex AI Search、對話管理，以及讓代理人執行多步驟動作的協調機制。

對 Generative AI Leader 而言，關鍵認知是：Agent Builder 是建立生產等級 RAG 應用程式的受管理低程式碼途徑。團隊不必撰寫檢索迴圈、管理向量索引或手工製作提示詞擴增；他們只需將 Agent Builder 指向資料儲存庫並設定行為即可。結果是一個以引用來源回答公司資料問題的接地代理人，在無法回答時會升級處理，並在底層文件變更時保持最新狀態。

Agent Builder 典型的考試相關使用案例：以產品文件為基礎的全天候客服助理、以政策文件為基礎的內部人資服務台、以目錄為基礎的電商購物助理，以及以公司維基為基礎的員工知識代理人。在每個案例中，接地都是讓助理可以安全對外開放的原因，因為每個答案都錨定於可稽核的來源。

在考試中，當情境要求以最快、最省力的方式建立以公司資料為基礎的接地聊天機器人或代理人時，答案是 Vertex AI Agent Builder，而非「建立客製化 RAG 管線」，也不是「微調模型」。Agent Builder 將 Vertex AI Search 檢索、Gemini 生成和引用來源處理整合為一個受管理的產品，讓業務團隊能在幾天內上線。只有在情境明確要求非常規控制時，才需要使用客製化 RAG 工程。參見 https://cloud.google.com/products/agent-builder。

接地 vs 微調 — 關鍵區別

考試很喜歡測試考生能否在接地與**微調（Fine-Tuning）**之間做出選擇，因為業務相關人員經常混淆兩者。它們解決的是不同的問題。

接地（RAG） 在提問當下為模型添加知識，不改變模型的權重。你透過更新 Vertex AI Search 中的文件來更新知識——立即生效，不需要訓練週期。當問題是**「模型缺乏事實」**時，接地是正確答案：它不知道你的政策、你的價格、今天的新聞。接地也提供引用來源，且維持最新狀態的成本遠低於微調。

微調透過額外的訓練範例改變模型本身，教會模型一種技能、語氣、格式或行為——例如，始終以你的品牌語調回應，或可靠地產生特定的結構化輸出。當問題是**「模型缺乏某種行為或風格」**而非事實時，微調是正確答案。它更昂貴，需要訓練週期，且在需求改變時必須重複進行。

考試的簡單決策規則：需要最新或私有事實 → 接地；需要一致的技能、語氣或格式 → 微調。 許多成熟的系統兩者並用——以微調模型處理語氣，以 RAG 接地處理事實。若要深入了解訓練面，請參閱模型調校與微調章節。

Generative AI Leader 考試中一個非常常見的誤讀，是選擇微調來「教模型公司最新的產品目錄或政策文件」。微調是注入事實的錯誤工具：成本高昂、價格一旦變動就會過時，而且無法產生引用來源。新增最新或私有知識的正確答案是透過 Vertex AI Search 以 RAG 進行接地，因為語料庫可以立即更新而無需重新訓練，且每個答案都可被稽核。微調是用於行為和風格，不是用於事實。參見 https://cloud.google.com/vertex-ai/generative-ai/docs/grounding/overview。

接地如何降低幻覺

接地存在的業務理由，是消弭幻覺——模型充滿自信卻不正確的輸出。未接地的模型以合理的捏造填補知識空缺。接地以兩種方式彌補這些空缺。第一，它直接在提示詞中提供缺失的事實，讓模型不再需要猜測。第二，配置良好的接地系統指示模型只從所提供的脈絡中作答，並在脈絡中沒有答案時說「我沒有這項資訊」——將一個充滿自信的錯誤答案轉變為誠實的不知道。

接地不能讓幻覺在字面上變為不可能；模型仍然可能誤讀段落或超出脈絡範圍作答。但它大幅降低了發生頻率，而且至關重要的是，讓錯誤可被偵測，因為引用來源讓人類可以對每個聲明進行核查。若要深入了解模型為何會產生幻覺及其局限性，請參閱幻覺與模型局限性章節。

引用來源作為業務信任訊號

值得再次強調，為什麼引用來源值得領導者（而不只是工程師）關注。引用來源將一個答案從「相信我」轉變為「自己去查」。這個單一特性帶來幾個業務成果：

可稽核性： 法規遵循和法務團隊可以審查面向客戶的助理，因為每個答案都能追溯到一份文件。
加快人工審核： 客服人員可以點擊來源，在幾秒內確認建議的答案。
終端使用者信任： 客戶自行建立信任；附有連結來源的答案感覺更有權威性。
更低廉的更正成本： 如果答案有誤，你修正來源文件，往後的每個答案都自動改善，無需重新訓練模型。

在考試中，當情境強調受監管的產業、面向客戶的部署，或需要驗證答案時，引用來源——也就是接地——是決定性因素。展示品可以省略引用來源；銀行、醫療或保險業的生產系統不能。

接地與 RAG 的業務使用案例

Generative AI Leader 考試以情境為導向。牢記以下標準的接地使用案例及對應的 Google Cloud 產品。

面向客戶的客服助理

一家電信公司希望提供全天候的聊天機器人，準確回答帳單和方案問題。以 Vertex AI Agent Builder 建立，透過 Vertex AI Search 以客服知識庫進行接地。每個答案引用一篇政策文章，讓助理可以安全地對外開放，且法規遵循團隊易於稽核。

內部知識助理

一家擁有一萬名員工的企業，希望員工能夠用自然語言提出人資、IT 和財務問題，而不必翻查維基。以 Agent Builder 對內部文件進行接地，提供單一的助理，以附引用來源的當前政策作答——且在政策文件修訂後立即更新。

研究與分析輔助工具

一家顧問公司希望分析師能夠查詢數千份過往報告。Vertex AI Search 對報告語料庫提供語意檢索，接地後的 Gemini 附引用來源地摘要研究發現，讓分析師在引用前可以驗證。

即時資訊問答

一家媒體公司希望提供能回答時事問題的助理。這裡Grounding with Google Search 是正確的來源，因為其價值在於即時性和公開報導，而非私有文件。

熟悉使用案例才能在考試中得分。掌握關鍵字對應：「以我們的文件為基礎的面向客戶聊天機器人」或「以公司政策為基礎的內部服務台」指向 Vertex AI Agent Builder 搭配企業資料接地；「搜尋我們的文件庫」指向 Vertex AI Search；「回答當前公開事件或最新新聞」指向 Grounding with Google Search；「模型需要最新或私有事實及可驗證的答案」指向接地／RAG 而非微調。參見 https://cloud.google.com/enterprise-search。

不適合使用接地的情況

接地功能強大，但考試可能測試你是否了解其局限性。以下情況接地幾乎沒有附加價值：

任務是純粹的創意發想，沒有事實錨定——撰寫虛構故事、腦力激盪廣告標語。沒有什麼可以檢索的。
需求是某種行為或格式，例如一致的品牌語調或嚴格的 JSON 輸出。那是微調或提示詞設計的問題。
沒有可信賴的語料庫。 RAG 的品質取決於背後的文件；以雜亂、過時或自相矛盾的知識庫進行接地，只會產生雜亂的答案。垃圾進，接地後的垃圾出。

領導者的結論：接地是事實性、面向客戶、知識庫使用案例的預設選擇，但它不是萬能的解決方案。乾淨、受治理的資料基礎必須先建立好。

成本與付出的考量

對業務決策者而言，接地的成本故事與各種替代方案相比是有利的。受管理的 RAG 途徑——Vertex AI Search 加上 Agent Builder——主要按使用量計費（查詢次數、生成 Token 數和索引資料量），避免了建立和運營客製化檢索及向量資料庫技術棧的前期成本。維持接地系統最新狀態的成本也很低：你更新文件而非模型權重，因此沒有反覆發生的訓練費用。

與之對比的是微調，每次需求變更都會產生訓練成本，且仍然無法提供引用來源。對大多數以事實和知識為導向的使用案例而言，接地兼具更低的總持有成本和更低的風險。考試的計費邏輯呼應了更廣泛的 Google Cloud 模式：優先使用能解決問題的最高層次受管理服務——Agent Builder 優先於手工打造的管線——只有在需求真正有所要求時才降至客製化工程。

常見問題

接地和 RAG 有什麼區別？

答：接地是目標——將模型的回答連結至可驗證的權威來源，讓它停止產生幻覺。**RAG（檢索增強生成）**是實現接地的主流技術：先檢索相關文件，再以這些文件生成答案。簡言之，接地是結果，RAG 是方法。在 Google Cloud 上，基於 RAG 的接地透過 Vertex AI Search 和 Vertex AI Agent Builder 提供。

我應該用接地還是微調，來讓模型獲得公司資訊？

答：使用接地（RAG）。微調是用於教導模型某種行為、語氣或輸出格式——不是用於注入事實。微調成本高昂、需要訓練週期、在資訊變動後會過時，也無法產生引用來源。接地讓你只需更新 Vertex AI Search 中的文件即可更新知識，立即生效，且具備可稽核的引用來源。許多系統兩者並用：以微調處理風格，以接地處理事實。

Vertex AI Search 和 Vertex AI Agent Builder 有什麼區別？

答： Vertex AI Search 是受管理的檢索引擎——它擷取、索引和語意搜尋你的語料庫，提供 RAG 的「檢索」那一半。Vertex AI Agent Builder 位於其上方，透過結合 Vertex AI Search 檢索、Gemini 生成、對話管理和引用來源，提供完整的接地對話式應用程式——聊天機器人或代理人。需要搜尋時用 Vertex AI Search；需要完整的接地代理人時用 Agent Builder。

向量嵌入和向量搜尋用白話怎麼說？

答： 向量嵌入將一段文字轉換為一組代表其意義的數字列表，就像在一張巨大的「意義地圖」上標出每個概念的位置。向量搜尋在那張地圖上找最近的鄰居，讓問題能夠檢索出意思相同但用詞不同的文件——例如「忘記密碼」能匹配到關於「登入憑證」的文件。向量搜尋讓 RAG 的檢索成為語意性而非關鍵字性的，而 Vertex AI Search 為你執行這些工作。

接地能完全消除幻覺嗎？

答：不能。接地大幅降低幻覺，方法是向模型提供真實事實，並指示它只從該脈絡作答；配置良好的接地系統在無從回答時說「我不知道」而非捏造答案。但模型仍然可能誤讀段落。關鍵的好處是接地讓錯誤可被偵測：引用來源讓人類可以對每個聲明與來源進行核查，這也是接地成為面向客戶及受監管使用案例標準做法的原因。

何時應該用 Grounding with Google Search，何時應該用自有資料接地？

答：當問題關乎公開世界且即時性重要時，使用 Grounding with Google Search——時事、最新產品新聞、最新的公開事實。當問題關乎貴公司的私有知識時，使用透過 Vertex AI Search 以企業自有資料進行接地——內部政策、產品文件、目錄、合約。許多生產助理結合兩種來源，依問題類型選擇。

總結：Generative AI Leader 的接地與 RAG

接地與 RAG 是讓 Generative AI 可以安全部署於客戶端和整個企業的關鍵。接地將答案連結至可驗證的來源；RAG 是實現接地的先檢索再生成方法。在 Google Cloud 上，Vertex AI Search 提供受管理的語意檢索，Vertex AI Agent Builder 將完整的 RAG 流程封裝為附引用來源的接地對話式代理人。Generative AI Leader 應能選擇正確的接地來源（Grounding with Google Search 用於最新的公開事實，企業資料用於私有知識）、區分接地與微調（事實 vs 行為）、解釋為何引用來源是業務信任訊號，並辨識接地能將脆弱的展示品轉化為生產系統的知識庫、客服和研究使用案例。

接地與檢索增強生成