AI 向量是什麼？從 Embedding 到向量搜尋原理入門

這也是為什麼 AI 搜尋可以做到傳統關鍵字搜尋比較難做到的事情，例如「用意思搜尋文件」、「用文字搜尋圖片」、「用問題找出相關知識庫內容」。Google 的機器學習教材也把 embedding 描述為能將資料轉成較低維度表示，並保留有意義關係的方法。Google Machine Learning Crash Course：Embeddings

傳統搜尋 vs AI 向量搜尋

傳統搜尋主要看「字有沒有出現」。如果你搜尋「筆電電池很快沒電」，系統通常會找包含「筆電」、「電池」、「沒電」這些字的網頁或文件。

AI 向量搜尋則更像是在找「意思接近的內容」。即使文章裡沒有出現完全一樣的字，只要意思相近，也可能被找出來。

搜尋方式	主要依據	適合情境
關鍵字搜尋	字詞是否出現、出現頻率、標題與頁面結構	找人名、型號、法條、日期、精確詞彙
向量搜尋	語意是否接近、概念是否相似	問答、知識庫、客服文件、找相似內容
混合搜尋	關鍵字搜尋 + 向量搜尋 + 重新排序	企業搜尋、AI 搜尋產品、RAG 系統

所以一句話可以這樣記：傳統搜尋像在找「字」，向量搜尋像在找「意思」。

AI 搜尋的基本流程

AI 搜尋並不是你輸入問題後，模型就憑空知道答案。比較常見的流程，是先把大量文件整理好，再讓模型從資料中找出可能有用的內容。

收集資料：例如網頁、PDF、FAQ、內部文件、商品資料、客服紀錄。
切分內容：把長文件切成一小段一小段，這常被稱為 chunking。
轉成向量：用 embedding model 把每一段文字轉成向量。
存進索引或資料庫：把向量和原文、標題、來源、時間等資訊一起保存。
使用者提問：把使用者的問題也轉成向量。
比較相似度：找出和問題向量最接近的文件片段。
回傳或生成答案：把找到的內容交給 AI，讓它整理成可讀的回答。

這整套流程，就是很多 AI 搜尋、企業知識庫與 RAG 系統的基礎。

相似度是怎麼算的？

向量搜尋的核心，是比較兩個向量有多接近。常見方法包含 cosine similarity、dot product、Euclidean distance 等，其中 cosine similarity 很常被拿來比較文字向量的方向是否相似。

不需要一開始就害怕數學，你可以先用地圖來理解：兩個點越靠近，代表意思可能越相似；兩個點距離越遠，代表意思可能差比較多。

例如：

「iPhone 怎麼截圖」和「蘋果手機螢幕截圖方法」距離可能很近。
「iPhone 怎麼截圖」和「義大利麵怎麼煮」距離通常會很遠。
「AI 搜尋原理」和「向量資料庫是什麼」距離可能會比表面字詞看起來更接近。

這也是向量搜尋好用的地方：它不只看文字表面，而是比較語意上的接近程度。

工商時間

如果你想要更系統化、更輕鬆的學好 SEO 與 AI SEO，歡迎參考我與知識衛星合作的 SEO 線上課程：《SEO 排名攻略學》、《AI SEO 流量變革》。

透過《SEO 排名攻略學》獲得穩定的 SEO 流量與實戰經驗。
再搭配《AI SEO 流量變革》看懂 AI 搜尋趨勢，搶佔 AI 搜尋紅利。

向量資料庫是什麼？

當資料量很小時，其實可以直接把所有向量逐一拿來比較。但如果有十萬篇、百萬篇甚至更多文件，逐一比較就會很慢。

這時候就需要向量索引或向量資料庫，幫助系統快速找到最接近的向量。常見的技術包含 HNSW、FAISS、Annoy、ScaNN，以及許多商業或開源向量資料庫。

FAISS 是 Meta 開源的向量相似度搜尋工具，主要用來處理 dense vectors 的 similarity search 和 clustering；HNSW 則是一種常見的 approximate nearest neighbor 搜尋方法，透過圖結構讓大量向量搜尋變得更快。FAISS 文件、HNSW 論文

不過要注意：向量資料庫不是 AI 本身，它比較像是 AI 搜尋系統裡的「高速索引」。真正影響搜尋品質的，通常還包含資料整理、切段方式、embedding model、排序方法與評測方式。

RAG 是什麼？為什麼也跟向量有關？

RAG 的全名是 Retrieval-Augmented Generation，可以翻成「檢索增強生成」。它的核心概念是：不要只讓 AI 靠模型記憶回答，而是先從外部資料找內容，再根據找到的資料生成答案。

簡單講，RAG 的流程通常是：

使用者提出問題。
系統用向量搜尋找出相關文件。
把找到的文件放進 AI 的上下文。
AI 根據這些資料整理回答。

這種做法常用在企業知識庫、客服機器人、法規查詢、產品文件搜尋、內部 SOP 問答等情境。RAG 原始研究也提到，它結合了模型本身的參數記憶與外部非參數記憶，讓模型能參考檢索到的內容生成答案。Retrieval-Augmented Generation 論文

但 RAG 不是萬靈丹。如果前面找錯資料，後面生成的答案也可能錯；如果切段切得不好，AI 也可能拿不到完整脈絡。

為什麼不能只靠向量搜尋？

向量搜尋很強，但它不是所有問題的最佳解。它擅長找語意相似，卻不一定擅長精確條件。

例如你要找「2025 年 3 月 1 日生效的條款」、「型號 A1234」、「訂單編號 XZ-9981」、「第 17 條第 2 項」，這類問題通常需要關鍵字搜尋、欄位過濾、metadata filter 或資料庫查詢搭配使用。

在資訊檢索研究中，BEIR benchmark 的結果也提醒我們，BM25 這類傳統關鍵字方法仍然是很強的基準線，而 reranking 和 late interaction 模型在某些任務上表現更好，但成本也更高。BEIR 論文

因此比較成熟的 AI 搜尋系統，通常不會只靠向量，而會使用 hybrid search，也就是把關鍵字搜尋、向量搜尋、篩選條件與重新排序一起使用。

實作 AI 搜尋時，最重要的不是只買向量資料庫

很多人聽到 AI 搜尋，第一個想到的是「我要不要用向量資料庫？」但實際上，更重要的是資料怎麼整理、怎麼切、怎麼評估。

以下幾個地方，通常比工具選型更關鍵：

資料品質：錯誤、過期、重複、權限混亂的資料，會直接降低搜尋品質。
Chunking：文件切太碎會失去上下文，切太長又可能混入太多無關內容。
Embedding model：不同模型對中文、繁體中文、專業術語、程式碼、法律文件的效果不一定相同。
Metadata：例如日期、部門、文件類型、權限、版本，這些不應該只靠向量判斷。
Reranking：先用向量找候選結果，再用更精細的模型重新排序，通常能提升品質。
評測資料集：不要只看 demo，應該準備真實問題和標準答案，測試搜尋結果是否真的有用。

如果你是做企業知識庫，真正要問的不是「哪個向量資料庫最紅」，而是「使用者會問什麼問題」、「正確答案在哪些文件裡」、「系統有沒有找出正確片段」。

向量搜尋的常見應用

理解向量後，你會發現很多 AI 應用其實都是同一套原理的變形。

AI 搜尋引擎：用語意找資料，而不是只靠關鍵字。
企業知識庫：讓員工用自然語言查內部文件、SOP、會議紀錄。
客服機器人：根據使用者問題，找出最相關的 FAQ 或產品文件。
推薦系統：比較使用者向量和商品向量，推薦可能感興趣的內容。
相似文章推薦：找出和目前文章主題接近的內容。
圖片搜尋：把圖片和文字放到相近的語意空間，做到用文字找圖片。
RAG 問答：先檢索資料，再讓 AI 根據資料回答。

所以向量不是某個單一工具的功能，而是一種讓 AI 能夠比較資料意義的基礎技術。如果你更關心的是怎麼讓自己的內容在這類 AI 搜尋裡被找到，可以延伸了解 GEO（生成式引擎優化）。

工商時間

相關研究可以怎麼讀？

如果你只是想使用 AI 搜尋，不一定要讀論文。但如果你想更深入理解原理，可以從以下幾個方向開始。

Sentence-BERT：讓句子可以被轉成適合比較相似度的 sentence embeddings，是語意搜尋很重要的基礎研究。Sentence-BERT 論文
DPR：Dense Passage Retrieval 用 dual-encoder 把問題和段落轉成向量，推動 dense retrieval 在問答任務中的應用。DPR 論文
BEIR：用多種資料集評測資訊檢索模型，提醒我們不要只用單一任務判斷搜尋系統好壞。BEIR 論文
RAG：把檢索系統和生成式 AI 結合，是現在 AI 搜尋和知識庫問答的重要架構。RAG 論文

剛開始不需要一次讀完所有研究，先理解「內容轉向量」、「比較相似度」、「找資料再回答」這三件事，就已經掌握 AI 搜尋的核心了。

給新手的學習順序

如果你想把 AI 搜尋學扎實，我會建議照這個順序理解：

先理解向量：知道 AI 如何把文字變成數字。
再理解 Embedding：知道不同內容如何被轉成可比較的表示。
接著理解相似度：知道系統如何判斷兩段文字是否接近。
再理解向量資料庫：知道大量向量如何被快速搜尋。
最後理解 RAG：知道 AI 如何先找資料，再根據資料回答。

這樣學會比較穩，因為你不是只記名詞，而是知道每個技術在搜尋流程中扮演什麼角色。

實用指令參考

如果你想用 ChatGPT 或其他 AI 工具練習這個主題，可以直接使用以下指令：

「請用新手能理解的方式解釋向量、Embedding、向量資料庫和 RAG 的關係。」
「請用一個企業知識庫的例子，說明 AI 搜尋從文件匯入到回答問題的完整流程。」
「請比較關鍵字搜尋、向量搜尋和混合搜尋的差異，並列出各自適合的情境。」
「如果我要做一個客服 FAQ 的 AI 搜尋系統，請幫我規劃資料切分、Embedding、搜尋和評測流程。」
「請幫我設計一組測試問題，用來評估我的 RAG 系統是否真的找得到正確文件。」

總結

向量是 AI 搜尋的基本功，因為它讓機器可以用數字表示文字、圖片、聲音和文件的意義。當資料都被轉成向量後，系統就能比較彼此的距離，找出和使用者問題最接近的內容。

不過，好的 AI 搜尋不是只靠向量資料庫就能完成。真正重要的是資料品質、切段方式、Embedding 模型、關鍵字搭配、重新排序、權限控管與實際評測。

如果你想理解 AI 搜尋，可以先記住這句話：AI 搜尋的核心不是讓模型憑空回答，而是先把資料變成可搜尋的向量，再讓 AI 根據找到的內容回答。

向量是什麼？

Embedding 是什麼？

傳統搜尋 vs AI 向量搜尋

AI 搜尋的基本流程

相似度是怎麼算的？

向量資料庫是什麼？

RAG 是什麼？為什麼也跟向量有關？

為什麼不能只靠向量搜尋？

實作 AI 搜尋時，最重要的不是只買向量資料庫

向量搜尋的常見應用

相關研究可以怎麼讀？

給新手的學習順序

實用指令參考

總結

Frank Chiu

訂閱電子報

相關文章

Repo 是什麼？GitHub Repository 新手入門：用法與避坑

Hermes Agent 是什麼？功能、安裝、情境與風險整理

Prompt 是什麼？AI 提示詞入門：寫法、範例與錯誤