有了前幾篇文章的觀念,以及「Node.js & LLM 原理與實務第 4 章」的基礎,我們就可以「純手工」來打造一個「極簡向量資料庫」。 (more)
有了前幾篇文章的觀念,以及「Node.js & LLM 原理與實務第 4 章」的基礎,我們就可以「純手工」來打造一個「極簡向量資料庫」。 (more)
有了「語意空間」與「距離」的觀念後,就可以實際打造一個語意搜尋系統,方式如下: 上述過程就稱為 Top-K 檢索,這是 RAG 系統中「語境擷取(Context Retrieval)」的第一步。舉例來說,若查詢「退貨流程」,系統會自動挑出語意最接近的句子,如「退款規則」、「商品退換申請」。接著,這些句子將作為 LLM 的參考語境輸入,協助模型生成更準確的回答。 (more) (more)
之前的教學,我們將語言變成可運算的數學表達式。接下來,就是要實際寫程式判斷兩個句子是否「語意相近」,最基本的方法,就是:餘弦相似度(Cosine Similarity)。 (more) (more)
「Node.js & LLM 原理與實務」書上第 4 章提到 Text Embeddeding(向量化),其中 4.4 節「向量化文本資料」介紹如何使用 text-embedding-3-small 來取得語意向量的部份,延續前二篇文章的說明(詳見 Also read),本文再行補充 2 個實例,說明向量化與語意搜尋的概念。 (more) (more)
| 文章主題 | 出版日期 |
| Embedded System (嵌入式系統) 的概念 (教學) | 2006/11/17 |
| 有效學習 Linux Device Driver (驅動程式) | 2006/04/19 |
| 基本 Linux 指令操作 | 2006/04/30 |
Copyright(c) 2006,2007,2010,2011,2020-2025 www.jollen.org. All rights reserved.
|