RAG 是一種語境搜尋架構
.作者:Jollen/
.日期:Wed Nov 05 2025 08:00:00 GMT+0800 (台北標準時間)
正確的語境
如 Node.js & LLM 原理與實務一書(第 1 章)所的「語境」觀念,語意判斷跟語氣,取決於語境。RAG 檢索之所以重要,是因為 RAG 主要在「如何找到正確的語境」,RAG 並非傳統的關鍵字檢索:這正 RAG 為何能提升 LLM 應用程式正確性的道理-搜尋正確的語境。所謂的「正確性」,白話來講,就是讓 LLM 可以生成符合我們預期語氣的內容。
例如,本書第 1 章的「給你 50 元」例子,便有二種不同的語境:
語境:
在便利商店,準備結帳。
使用者問題:
給你 50 元。
同樣的問題,但語境不同:
語境:
在家裡,小朋友幫忙做家事,給小朋友獎勵。
使用者問題:
給你 50 元。
這就是 4.2 節-極簡 RAG 架構觀念,首要表達的技術:RAG 將搜尋到的「知識資料」與使用者問題,一併送進 LLM 模型。如此一來,當然能得到符合想要的語氣內容。一般來說,RAG 的概念上是一套知識庫,但 RAG 並不是只在資料庫裡,做關鍵字比對搜尋,也不是只把關鍵搜尋的結果丟給 LLM;RAG 要能做到語意搜尋,並把正確的語意找出來,再丟進 LLM。
向量距離
RAG 的語意搜尋,與傳統關鍵字搜尋有所不同。語意搜尋注重「關鍵字之間的關聯」,這便是「向量距離」的觀念。第 4 章的範例,就是一個「極簡向量庫」的實作教學,對初次接觸 RAG 實作的 Node.js 開發者,應該會有不少幫助。
另外,ChatGPT-5 支援更多的 token 數量,但並不表示 RAG 技術不再重要。如果說:「既然 GPT-5 支援這麼大的 token 數量(以後更多),把前文都塞給 GPT-5 模型不就好了?」這也沒有錯,因為 GPT-5 的語意檢索能力確實很強。但是,RAG 架構的本質是,提供更精準且專業的語境;如果能二相搭配,那就是加乘的效果了。
Also read
Tags: rag, llm