Favicon02

AI 向量是什麼?從 Embedding 到向量搜尋原理入門

用新手也能懂的方式,解釋 AI 搜尋中的向量、Embedding、向量資料庫與 RAG 是什麼、怎麼運作,以及為什麼語意搜尋和關鍵字搜尋要搭配使用。

現在很多 AI 工具都會提到「向量」、「Embedding」、「向量資料庫」、「RAG」,如果沒有先理解這些概念,很容易以為 AI 搜尋只是比較聰明的 Google。

但 AI 搜尋的底層邏輯其實不太一樣:它不只是看你輸入了哪些字,而是會把文字、圖片或文件轉成一串數字,再用數學方式找出「意思最接近」的內容。

這篇文章會用新手也能理解的方式,說明 AI 搜尋中的向量是什麼、Embedding 是什麼、向量搜尋怎麼運作,以及為什麼它會成為 AI 搜尋、企業知識庫、RAG 應用的基本功。


向量是什麼?

在 AI 裡,向量可以先理解成「一串數字」。例如一段文字經過 AI 模型處理後,可能會變成像這樣的數字列表:

[0.12, -0.83, 1.44, 0.07, -0.31, ...]

這串數字不是隨便產生的,而是模型用來表示這段文字的意思、語氣、主題、上下文與其他抽象特徵。OpenAI 官方文件也說明,Embedding 是由浮點數組成的向量,兩個向量之間的距離可以用來衡量文字之間的相關性。OpenAI Embeddings 文件

你可以把它想像成一張巨大的語意地圖。意思相近的句子會被放在比較近的位置,意思差很多的句子則會被放在比較遠的位置。


Embedding 是什麼?

Embedding 可以理解成「把內容轉成向量」的過程,也可以指轉換後得到的那組向量。

例如「如何申請護照?」這句話,AI 會把它轉成一組向量;「護照過期怎麼辦?」也會被轉成另一組向量。因為這兩句話都和護照相關,所以它們在向量空間中的位置通常會比較接近。

Embedding 不只可以用在文字,也可以用在圖片、聲音、影片、商品、使用者資料等各種內容。當資料都被轉成向量後,AI 就能用同一套方式去比較它們的相似度。

這也是為什麼 AI 搜尋可以做到傳統關鍵字搜尋比較難做到的事情,例如「用意思搜尋文件」、「用文字搜尋圖片」、「用問題找出相關知識庫內容」。Google 的機器學習教材也把 embedding 描述為能將資料轉成較低維度表示,並保留有意義關係的方法。Google Machine Learning Crash Course:Embeddings


傳統搜尋 vs AI 向量搜尋

傳統搜尋主要看「字有沒有出現」。如果你搜尋「筆電電池很快沒電」,系統通常會找包含「筆電」、「電池」、「沒電」這些字的網頁或文件。

AI 向量搜尋則更像是在找「意思接近的內容」。即使文章裡沒有出現完全一樣的字,只要意思相近,也可能被找出來。

搜尋方式 主要依據 適合情境
關鍵字搜尋 字詞是否出現、出現頻率、標題與頁面結構 找人名、型號、法條、日期、精確詞彙
向量搜尋 語意是否接近、概念是否相似 問答、知識庫、客服文件、找相似內容
混合搜尋 關鍵字搜尋 + 向量搜尋 + 重新排序 企業搜尋、AI 搜尋產品、RAG 系統

所以一句話可以這樣記:傳統搜尋像在找「字」,向量搜尋像在找「意思」。

關鍵字搜尋、向量搜尋與混合搜尋的差異比較

AI 搜尋的基本流程

AI 搜尋並不是你輸入問題後,模型就憑空知道答案。比較常見的流程,是先把大量文件整理好,再讓模型從資料中找出可能有用的內容。

  1. 收集資料:例如網頁、PDF、FAQ、內部文件、商品資料、客服紀錄。
  2. 切分內容:把長文件切成一小段一小段,這常被稱為 chunking。
  3. 轉成向量:用 embedding model 把每一段文字轉成向量。
  4. 存進索引或資料庫:把向量和原文、標題、來源、時間等資訊一起保存。
  5. 使用者提問:把使用者的問題也轉成向量。
  6. 比較相似度:找出和問題向量最接近的文件片段。
  7. 回傳或生成答案:把找到的內容交給 AI,讓它整理成可讀的回答。

這整套流程,就是很多 AI 搜尋、企業知識庫與 RAG 系統的基礎。

AI 搜尋從資料匯入到回答問題的基本流程

相似度是怎麼算的?

向量搜尋的核心,是比較兩個向量有多接近。常見方法包含 cosine similarity、dot product、Euclidean distance 等,其中 cosine similarity 很常被拿來比較文字向量的方向是否相似。

不需要一開始就害怕數學,你可以先用地圖來理解:兩個點越靠近,代表意思可能越相似;兩個點距離越遠,代表意思可能差比較多。

例如:

  • 「iPhone 怎麼截圖」和「蘋果手機螢幕截圖方法」距離可能很近。
  • 「iPhone 怎麼截圖」和「義大利麵怎麼煮」距離通常會很遠。
  • 「AI 搜尋原理」和「向量資料庫是什麼」距離可能會比表面字詞看起來更接近。

這也是向量搜尋好用的地方:它不只看文字表面,而是比較語意上的接近程度。



向量資料庫是什麼?

當資料量很小時,其實可以直接把所有向量逐一拿來比較。但如果有十萬篇、百萬篇甚至更多文件,逐一比較就會很慢。

這時候就需要向量索引或向量資料庫,幫助系統快速找到最接近的向量。常見的技術包含 HNSW、FAISS、Annoy、ScaNN,以及許多商業或開源向量資料庫。

FAISS 是 Meta 開源的向量相似度搜尋工具,主要用來處理 dense vectors 的 similarity search 和 clustering;HNSW 則是一種常見的 approximate nearest neighbor 搜尋方法,透過圖結構讓大量向量搜尋變得更快。FAISS 文件HNSW 論文

不過要注意:向量資料庫不是 AI 本身,它比較像是 AI 搜尋系統裡的「高速索引」。真正影響搜尋品質的,通常還包含資料整理、切段方式、embedding model、排序方法與評測方式。


RAG 是什麼?為什麼也跟向量有關?

RAG 的全名是 Retrieval-Augmented Generation,可以翻成「檢索增強生成」。它的核心概念是:不要只讓 AI 靠模型記憶回答,而是先從外部資料找內容,再根據找到的資料生成答案。

簡單講,RAG 的流程通常是:

  1. 使用者提出問題。
  2. 系統用向量搜尋找出相關文件。
  3. 把找到的文件放進 AI 的上下文。
  4. AI 根據這些資料整理回答。

這種做法常用在企業知識庫、客服機器人、法規查詢、產品文件搜尋、內部 SOP 問答等情境。RAG 原始研究也提到,它結合了模型本身的參數記憶與外部非參數記憶,讓模型能參考檢索到的內容生成答案。Retrieval-Augmented Generation 論文

但 RAG 不是萬靈丹。如果前面找錯資料,後面生成的答案也可能錯;如果切段切得不好,AI 也可能拿不到完整脈絡。


為什麼不能只靠向量搜尋?

向量搜尋很強,但它不是所有問題的最佳解。它擅長找語意相似,卻不一定擅長精確條件。

例如你要找「2025 年 3 月 1 日生效的條款」、「型號 A1234」、「訂單編號 XZ-9981」、「第 17 條第 2 項」,這類問題通常需要關鍵字搜尋、欄位過濾、metadata filter 或資料庫查詢搭配使用。

在資訊檢索研究中,BEIR benchmark 的結果也提醒我們,BM25 這類傳統關鍵字方法仍然是很強的基準線,而 reranking 和 late interaction 模型在某些任務上表現更好,但成本也更高。BEIR 論文

因此比較成熟的 AI 搜尋系統,通常不會只靠向量,而會使用 hybrid search,也就是把關鍵字搜尋、向量搜尋、篩選條件與重新排序一起使用。


實作 AI 搜尋時,最重要的不是只買向量資料庫

很多人聽到 AI 搜尋,第一個想到的是「我要不要用向量資料庫?」但實際上,更重要的是資料怎麼整理、怎麼切、怎麼評估。

以下幾個地方,通常比工具選型更關鍵:

  • 資料品質:錯誤、過期、重複、權限混亂的資料,會直接降低搜尋品質。
  • Chunking:文件切太碎會失去上下文,切太長又可能混入太多無關內容。
  • Embedding model:不同模型對中文、繁體中文、專業術語、程式碼、法律文件的效果不一定相同。
  • Metadata:例如日期、部門、文件類型、權限、版本,這些不應該只靠向量判斷。
  • Reranking:先用向量找候選結果,再用更精細的模型重新排序,通常能提升品質。
  • 評測資料集:不要只看 demo,應該準備真實問題和標準答案,測試搜尋結果是否真的有用。

如果你是做企業知識庫,真正要問的不是「哪個向量資料庫最紅」,而是「使用者會問什麼問題」、「正確答案在哪些文件裡」、「系統有沒有找出正確片段」。


向量搜尋的常見應用

理解向量後,你會發現很多 AI 應用其實都是同一套原理的變形。

  • AI 搜尋引擎:用語意找資料,而不是只靠關鍵字。
  • 企業知識庫:讓員工用自然語言查內部文件、SOP、會議紀錄。
  • 客服機器人:根據使用者問題,找出最相關的 FAQ 或產品文件。
  • 推薦系統:比較使用者向量和商品向量,推薦可能感興趣的內容。
  • 相似文章推薦:找出和目前文章主題接近的內容。
  • 圖片搜尋:把圖片和文字放到相近的語意空間,做到用文字找圖片。
  • RAG 問答:先檢索資料,再讓 AI 根據資料回答。

所以向量不是某個單一工具的功能,而是一種讓 AI 能夠比較資料意義的基礎技術。如果你更關心的是怎麼讓自己的內容在這類 AI 搜尋裡被找到,可以延伸了解 GEO(生成式引擎優化)



相關研究可以怎麼讀?

如果你只是想使用 AI 搜尋,不一定要讀論文。但如果你想更深入理解原理,可以從以下幾個方向開始。

  • Sentence-BERT:讓句子可以被轉成適合比較相似度的 sentence embeddings,是語意搜尋很重要的基礎研究。Sentence-BERT 論文
  • DPR:Dense Passage Retrieval 用 dual-encoder 把問題和段落轉成向量,推動 dense retrieval 在問答任務中的應用。DPR 論文
  • BEIR:用多種資料集評測資訊檢索模型,提醒我們不要只用單一任務判斷搜尋系統好壞。BEIR 論文
  • RAG:把檢索系統和生成式 AI 結合,是現在 AI 搜尋和知識庫問答的重要架構。RAG 論文

剛開始不需要一次讀完所有研究,先理解「內容轉向量」、「比較相似度」、「找資料再回答」這三件事,就已經掌握 AI 搜尋的核心了。


給新手的學習順序

如果你想把 AI 搜尋學扎實,我會建議照這個順序理解:

  1. 先理解向量:知道 AI 如何把文字變成數字。
  2. 再理解 Embedding:知道不同內容如何被轉成可比較的表示。
  3. 接著理解相似度:知道系統如何判斷兩段文字是否接近。
  4. 再理解向量資料庫:知道大量向量如何被快速搜尋。
  5. 最後理解 RAG:知道 AI 如何先找資料,再根據資料回答。

這樣學會比較穩,因為你不是只記名詞,而是知道每個技術在搜尋流程中扮演什麼角色。


實用指令參考

如果你想用 ChatGPT 或其他 AI 工具練習這個主題,可以直接使用以下指令:

  • 「請用新手能理解的方式解釋向量、Embedding、向量資料庫和 RAG 的關係。」
  • 「請用一個企業知識庫的例子,說明 AI 搜尋從文件匯入到回答問題的完整流程。」
  • 「請比較關鍵字搜尋、向量搜尋和混合搜尋的差異,並列出各自適合的情境。」
  • 「如果我要做一個客服 FAQ 的 AI 搜尋系統,請幫我規劃資料切分、Embedding、搜尋和評測流程。」
  • 「請幫我設計一組測試問題,用來評估我的 RAG 系統是否真的找得到正確文件。」

總結

向量是 AI 搜尋的基本功,因為它讓機器可以用數字表示文字、圖片、聲音和文件的意義。當資料都被轉成向量後,系統就能比較彼此的距離,找出和使用者問題最接近的內容。

不過,好的 AI 搜尋不是只靠向量資料庫就能完成。真正重要的是資料品質、切段方式、Embedding 模型、關鍵字搭配、重新排序、權限控管與實際評測。

如果你想理解 AI 搜尋,可以先記住這句話:AI 搜尋的核心不是讓模型憑空回答,而是先把資料變成可搜尋的向量,再讓 AI 根據找到的內容回答。

Frank Chiu
Frank Chiu

SEO/GEO 顧問、行銷顧問。協助本地企業與跨國企業導入 SEO、GEO 跟行銷方案,包括:雀巢、凱基銀行、大人學、居家先生、IKEA、vocus 等。

訂閱電子報