AI 向量是什麼?從 Embedding 到向量搜尋原理入門
用新手也能懂的方式,解釋 AI 搜尋中的向量、Embedding、向量資料庫與 RAG 是什麼、怎麼運作,以及為什麼語意搜尋和關鍵字搜尋要搭配使用。

現在很多 AI 工具都會提到「向量」、「Embedding」、「向量資料庫」、「RAG」,如果沒有先理解這些概念,很容易以為 AI 搜尋只是比較聰明的 Google。
但 AI 搜尋的底層邏輯其實不太一樣:它不只是看你輸入了哪些字,而是會把文字、圖片或文件轉成一串數字,再用數學方式找出「意思最接近」的內容。
這篇文章會用新手也能理解的方式,說明 AI 搜尋中的向量是什麼、Embedding 是什麼、向量搜尋怎麼運作,以及為什麼它會成為 AI 搜尋、企業知識庫、RAG 應用的基本功。
向量是什麼?
在 AI 裡,向量可以先理解成「一串數字」。例如一段文字經過 AI 模型處理後,可能會變成像這樣的數字列表:
[0.12, -0.83, 1.44, 0.07, -0.31, ...]
這串數字不是隨便產生的,而是模型用來表示這段文字的意思、語氣、主題、上下文與其他抽象特徵。OpenAI 官方文件也說明,Embedding 是由浮點數組成的向量,兩個向量之間的距離可以用來衡量文字之間的相關性。OpenAI Embeddings 文件
你可以把它想像成一張巨大的語意地圖。意思相近的句子會被放在比較近的位置,意思差很多的句子則會被放在比較遠的位置。
Embedding 是什麼?
Embedding 可以理解成「把內容轉成向量」的過程,也可以指轉換後得到的那組向量。
例如「如何申請護照?」這句話,AI 會把它轉成一組向量;「護照過期怎麼辦?」也會被轉成另一組向量。因為這兩句話都和護照相關,所以它們在向量空間中的位置通常會比較接近。
Embedding 不只可以用在文字,也可以用在圖片、聲音、影片、商品、使用者資料等各種內容。當資料都被轉成向量後,AI 就能用同一套方式去比較它們的相似度。
這也是為什麼 AI 搜尋可以做到傳統關鍵字搜尋比較難做到的事情,例如「用意思搜尋文件」、「用文字搜尋圖片」、「用問題找出相關知識庫內容」。Google 的機器學習教材也把 embedding 描述為能將資料轉成較低維度表示,並保留有意義關係的方法。Google Machine Learning Crash Course:Embeddings
傳統搜尋 vs AI 向量搜尋
傳統搜尋主要看「字有沒有出現」。如果你搜尋「筆電電池很快沒電」,系統通常會找包含「筆電」、「電池」、「沒電」這些字的網頁或文件。
AI 向量搜尋則更像是在找「意思接近的內容」。即使文章裡沒有出現完全一樣的字,只要意思相近,也可能被找出來。
| 搜尋方式 | 主要依據 | 適合情境 |
|---|---|---|
| 關鍵字搜尋 | 字詞是否出現、出現頻率、標題與頁面結構 | 找人名、型號、法條、日期、精確詞彙 |
| 向量搜尋 | 語意是否接近、概念是否相似 | 問答、知識庫、客服文件、找相似內容 |
| 混合搜尋 | 關鍵字搜尋 + 向量搜尋 + 重新排序 | 企業搜尋、AI 搜尋產品、RAG 系統 |
所以一句話可以這樣記:傳統搜尋像在找「字」,向量搜尋像在找「意思」。

AI 搜尋的基本流程
AI 搜尋並不是你輸入問題後,模型就憑空知道答案。比較常見的流程,是先把大量文件整理好,再讓模型從資料中找出可能有用的內容。
- 收集資料:例如網頁、PDF、FAQ、內部文件、商品資料、客服紀錄。
- 切分內容:把長文件切成一小段一小段,這常被稱為 chunking。
- 轉成向量:用 embedding model 把每一段文字轉成向量。
- 存進索引或資料庫:把向量和原文、標題、來源、時間等資訊一起保存。
- 使用者提問:把使用者的問題也轉成向量。
- 比較相似度:找出和問題向量最接近的文件片段。
- 回傳或生成答案:把找到的內容交給 AI,讓它整理成可讀的回答。
這整套流程,就是很多 AI 搜尋、企業知識庫與 RAG 系統的基礎。

相似度是怎麼算的?
向量搜尋的核心,是比較兩個向量有多接近。常見方法包含 cosine similarity、dot product、Euclidean distance 等,其中 cosine similarity 很常被拿來比較文字向量的方向是否相似。
不需要一開始就害怕數學,你可以先用地圖來理解:兩個點越靠近,代表意思可能越相似;兩個點距離越遠,代表意思可能差比較多。
例如:
- 「iPhone 怎麼截圖」和「蘋果手機螢幕截圖方法」距離可能很近。
- 「iPhone 怎麼截圖」和「義大利麵怎麼煮」距離通常會很遠。
- 「AI 搜尋原理」和「向量資料庫是什麼」距離可能會比表面字詞看起來更接近。
這也是向量搜尋好用的地方:它不只看文字表面,而是比較語意上的接近程度。
透過《SEO 排名攻略學》獲得穩定的 SEO 流量與實戰經驗。
再搭配《AI SEO 流量變革》看懂 AI 搜尋趨勢,搶佔 AI 搜尋紅利。

向量資料庫是什麼?
當資料量很小時,其實可以直接把所有向量逐一拿來比較。但如果有十萬篇、百萬篇甚至更多文件,逐一比較就會很慢。
這時候就需要向量索引或向量資料庫,幫助系統快速找到最接近的向量。常見的技術包含 HNSW、FAISS、Annoy、ScaNN,以及許多商業或開源向量資料庫。
FAISS 是 Meta 開源的向量相似度搜尋工具,主要用來處理 dense vectors 的 similarity search 和 clustering;HNSW 則是一種常見的 approximate nearest neighbor 搜尋方法,透過圖結構讓大量向量搜尋變得更快。FAISS 文件、HNSW 論文
不過要注意:向量資料庫不是 AI 本身,它比較像是 AI 搜尋系統裡的「高速索引」。真正影響搜尋品質的,通常還包含資料整理、切段方式、embedding model、排序方法與評測方式。
RAG 是什麼?為什麼也跟向量有關?
RAG 的全名是 Retrieval-Augmented Generation,可以翻成「檢索增強生成」。它的核心概念是:不要只讓 AI 靠模型記憶回答,而是先從外部資料找內容,再根據找到的資料生成答案。
簡單講,RAG 的流程通常是:
- 使用者提出問題。
- 系統用向量搜尋找出相關文件。
- 把找到的文件放進 AI 的上下文。
- AI 根據這些資料整理回答。
這種做法常用在企業知識庫、客服機器人、法規查詢、產品文件搜尋、內部 SOP 問答等情境。RAG 原始研究也提到,它結合了模型本身的參數記憶與外部非參數記憶,讓模型能參考檢索到的內容生成答案。Retrieval-Augmented Generation 論文
但 RAG 不是萬靈丹。如果前面找錯資料,後面生成的答案也可能錯;如果切段切得不好,AI 也可能拿不到完整脈絡。
為什麼不能只靠向量搜尋?
向量搜尋很強,但它不是所有問題的最佳解。它擅長找語意相似,卻不一定擅長精確條件。
例如你要找「2025 年 3 月 1 日生效的條款」、「型號 A1234」、「訂單編號 XZ-9981」、「第 17 條第 2 項」,這類問題通常需要關鍵字搜尋、欄位過濾、metadata filter 或資料庫查詢搭配使用。
在資訊檢索研究中,BEIR benchmark 的結果也提醒我們,BM25 這類傳統關鍵字方法仍然是很強的基準線,而 reranking 和 late interaction 模型在某些任務上表現更好,但成本也更高。BEIR 論文
因此比較成熟的 AI 搜尋系統,通常不會只靠向量,而會使用 hybrid search,也就是把關鍵字搜尋、向量搜尋、篩選條件與重新排序一起使用。
實作 AI 搜尋時,最重要的不是只買向量資料庫
很多人聽到 AI 搜尋,第一個想到的是「我要不要用向量資料庫?」但實際上,更重要的是資料怎麼整理、怎麼切、怎麼評估。
以下幾個地方,通常比工具選型更關鍵:
- 資料品質:錯誤、過期、重複、權限混亂的資料,會直接降低搜尋品質。
- Chunking:文件切太碎會失去上下文,切太長又可能混入太多無關內容。
- Embedding model:不同模型對中文、繁體中文、專業術語、程式碼、法律文件的效果不一定相同。
- Metadata:例如日期、部門、文件類型、權限、版本,這些不應該只靠向量判斷。
- Reranking:先用向量找候選結果,再用更精細的模型重新排序,通常能提升品質。
- 評測資料集:不要只看 demo,應該準備真實問題和標準答案,測試搜尋結果是否真的有用。
如果你是做企業知識庫,真正要問的不是「哪個向量資料庫最紅」,而是「使用者會問什麼問題」、「正確答案在哪些文件裡」、「系統有沒有找出正確片段」。
向量搜尋的常見應用
理解向量後,你會發現很多 AI 應用其實都是同一套原理的變形。
- AI 搜尋引擎:用語意找資料,而不是只靠關鍵字。
- 企業知識庫:讓員工用自然語言查內部文件、SOP、會議紀錄。
- 客服機器人:根據使用者問題,找出最相關的 FAQ 或產品文件。
- 推薦系統:比較使用者向量和商品向量,推薦可能感興趣的內容。
- 相似文章推薦:找出和目前文章主題接近的內容。
- 圖片搜尋:把圖片和文字放到相近的語意空間,做到用文字找圖片。
- RAG 問答:先檢索資料,再讓 AI 根據資料回答。
所以向量不是某個單一工具的功能,而是一種讓 AI 能夠比較資料意義的基礎技術。如果你更關心的是怎麼讓自己的內容在這類 AI 搜尋裡被找到,可以延伸了解 GEO(生成式引擎優化)。
透過《SEO 排名攻略學》獲得穩定的 SEO 流量與實戰經驗。
再搭配《AI SEO 流量變革》看懂 AI 搜尋趨勢,搶佔 AI 搜尋紅利。

相關研究可以怎麼讀?
如果你只是想使用 AI 搜尋,不一定要讀論文。但如果你想更深入理解原理,可以從以下幾個方向開始。
- Sentence-BERT:讓句子可以被轉成適合比較相似度的 sentence embeddings,是語意搜尋很重要的基礎研究。Sentence-BERT 論文
- DPR:Dense Passage Retrieval 用 dual-encoder 把問題和段落轉成向量,推動 dense retrieval 在問答任務中的應用。DPR 論文
- BEIR:用多種資料集評測資訊檢索模型,提醒我們不要只用單一任務判斷搜尋系統好壞。BEIR 論文
- RAG:把檢索系統和生成式 AI 結合,是現在 AI 搜尋和知識庫問答的重要架構。RAG 論文
剛開始不需要一次讀完所有研究,先理解「內容轉向量」、「比較相似度」、「找資料再回答」這三件事,就已經掌握 AI 搜尋的核心了。
給新手的學習順序
如果你想把 AI 搜尋學扎實,我會建議照這個順序理解:
- 先理解向量:知道 AI 如何把文字變成數字。
- 再理解 Embedding:知道不同內容如何被轉成可比較的表示。
- 接著理解相似度:知道系統如何判斷兩段文字是否接近。
- 再理解向量資料庫:知道大量向量如何被快速搜尋。
- 最後理解 RAG:知道 AI 如何先找資料,再根據資料回答。
這樣學會比較穩,因為你不是只記名詞,而是知道每個技術在搜尋流程中扮演什麼角色。
實用指令參考
如果你想用 ChatGPT 或其他 AI 工具練習這個主題,可以直接使用以下指令:
- 「請用新手能理解的方式解釋向量、Embedding、向量資料庫和 RAG 的關係。」
- 「請用一個企業知識庫的例子,說明 AI 搜尋從文件匯入到回答問題的完整流程。」
- 「請比較關鍵字搜尋、向量搜尋和混合搜尋的差異,並列出各自適合的情境。」
- 「如果我要做一個客服 FAQ 的 AI 搜尋系統,請幫我規劃資料切分、Embedding、搜尋和評測流程。」
- 「請幫我設計一組測試問題,用來評估我的 RAG 系統是否真的找得到正確文件。」
總結
向量是 AI 搜尋的基本功,因為它讓機器可以用數字表示文字、圖片、聲音和文件的意義。當資料都被轉成向量後,系統就能比較彼此的距離,找出和使用者問題最接近的內容。
不過,好的 AI 搜尋不是只靠向量資料庫就能完成。真正重要的是資料品質、切段方式、Embedding 模型、關鍵字搭配、重新排序、權限控管與實際評測。
如果你想理解 AI 搜尋,可以先記住這句話:AI 搜尋的核心不是讓模型憑空回答,而是先把資料變成可搜尋的向量,再讓 AI 根據找到的內容回答。



