RAG 是一種語境搜尋架構

．作者：Jollen／
．日期：Wed Nov 05 2025 09:00:00 GMT+0900 (日本標準時間)

正確的語境

如 Node.js & LLM 原理與實務一書（第 1 章）所的「語境」觀念，語意判斷跟語氣，取決於語境。RAG 檢索之所以重要，是因為 RAG 主要在「如何找到正確的語境」，RAG 並非傳統的關鍵字檢索：這正 RAG 為何能提升 LLM 應用程式正確性的道理－搜尋正確的語境。所謂的「正確性」，白話來講，就是讓 LLM 可以生成符合我們預期語氣的內容。

例如，本書第 1 章的「給你 50 元」例子，便有二種不同的語境：

語境：
在便利商店，準備結帳。

使用者問題：
給你 50 元。

同樣的問題，但語境不同：

語境：
在家裡，小朋友幫忙做家事，給小朋友獎勵。

使用者問題：
給你 50 元。

這就是 4.2 節－極簡 RAG 架構觀念，首要表達的技術：RAG 將搜尋到的「知識資料」與使用者問題，一併送進 LLM 模型。如此一來，當然能得到符合想要的語氣內容。一般來說，RAG 的概念上是一套知識庫，但 RAG 並不是只在資料庫裡，做關鍵字比對搜尋，也不是只把關鍵搜尋的結果丟給 LLM；RAG 要能做到語意搜尋，並把正確的語意找出來，再丟進 LLM。

向量距離

RAG 的語意搜尋，與傳統關鍵字搜尋有所不同。語意搜尋注重「關鍵字之間的關聯」，這便是「向量距離」的觀念。第 4 章的範例，就是一個「極簡向量庫」的實作教學，對初次接觸 RAG 實作的 Node.js 開發者，應該會有不少幫助。

另外，ChatGPT-5 支援更多的 token 數量，但並不表示 RAG 技術不再重要。如果說：「既然 GPT-5 支援這麼大的 token 數量（以後更多），把前文都塞給 GPT-5 模型不就好了？」這也沒有錯，因為 GPT-5 的語意檢索能力確實很強。但是，RAG 架構的本質是，提供更精準且專業的語境；如果能二相搭配，那就是加乘的效果了。

Also read

Tags: rag, llm