跳轉到

排序器

這頁能幫你做什麼

排序器 (Ranker) 用來把一批文件依「跟查詢有多相關」重新排序。檢索器 (Retriever) 從知識庫 (Knowledge Base) 撈回一堆候選文件後,前幾名不一定最貼題;接上排序器,就能再做一次精排,把最相關的內容往前推,提升回答品質。簡單說:檢索器負責「廣撒網撈回來」,排序器負責「精排挑最準」。建立好排序器後,就能在排序器 (Ranker) 任務檢索 (Retrieval) 任務的「排序器」設定裡指定它。

開始前

前置需求

  • Embedding 類型會用到嵌入模型 (Embedding Model);可在表單指定,未指定則使用系統預設嵌入模型。
  • CohereAmazon 類型透過 Amazon Bedrock 提供,需所在 AWS 區域支援對應模型。
  • Jaccard Similarity 類型不需要任何額外資源。

操作步驟

  1. 從左側資源選單進入「排序器」清單頁,點右上角沒有文字的「+」圖示按鈕開啟建立表單。

    建立排序器表單,選「Embedding」類型後的樣子

  2. 在「名稱」欄輸入名稱。

  3. 在「類型」選擇排序方式(Embedding、Jaccard Similarity、Cohere 或 Amazon)。不同類型會出現不同欄位,選好後的畫面差異見下方完整欄位說明。上方圖即為選「Embedding」後的樣子。
  4. 依所選類型填寫專屬欄位(Embedding 的「嵌入模型」,或 Cohere/Amazon 的「模型」「地區」)。
  5. 按右上角的「儲存」按鈕完成建立(見步驟 1 圖右上角)。

完整欄位說明

主表單先填所有類型共通的「名稱」與「類型」,選好類型後再填該類型專屬的欄位。

共同欄位(不分類型)

欄位 必填 預設 說明
名稱 排序器的識別名稱。最多 64 個字,不可用 default 開頭。
類型 無(需選擇) 排序方式,四選一:Embedding、Jaccard Similarity、Cohere 或 Amazon。四者的適用情境與專屬欄位見下方四節。建立後無法修改

類型在建立後鎖定

編輯既有排序器時「類型」為唯讀。需要不同類型請另建一個排序器。

不確定選哪個類型?

一句話判斷:

  • 想用「語意相近」來排序、且已經有嵌入模型 → 選 Embedding,把文件與查詢都轉成向量比相似度。
  • 只是想快速、不接任何外部模型 → 選 Jaccard Similarity,純比對詞語重疊度,最輕量。
  • 內容跨語言、企業資料較複雜、要最準的語意排序 → 選 Cohere(透過 Amazon Bedrock)。
  • 想用 Amazon 原生排序模型、已在用 AWS 生態 → 選 Amazon(透過 Amazon Bedrock)。

其中 Cohere 與 Amazon 走 Amazon Bedrock,需所在 AWS 區域支援;Embedding 需要嵌入模型;Jaccard Similarity 完全不需外部資源。

Embedding

把文件與查詢都轉成向量,依向量相似度排序,能處理「語意相近但用字不同」的內容。

適合:

  • 想依語意相似性排序,而非字面重疊。
  • 已經建好嵌入模型,或想沿用系統預設嵌入模型。

選「Embedding」後的表單,會多出一個「嵌入模型」欄位:

Embedding 類型表單,含「嵌入模型」欄位

Embedding 類型的專屬欄位:

欄位 必填 預設 說明
嵌入模型 系統預設嵌入模型 指定用來產生向量的嵌入模型。未指定時使用系統預設模型。右側的編輯()鈕可挑選;可清除。

Jaccard Similarity

純比對兩段文字的詞語重疊度(Jaccard 係數)來排序,不需要任何外部模型,最輕量、最快。

適合:

  • 想要最簡單、最省成本的排序,不接任何外部模型或雲端服務。
  • 文件與查詢用詞固定、字面重疊就足以判斷相關性。

選「Jaccard Similarity」後,表單沒有任何額外欄位——填好「名稱」與「類型」即可建立:

Jaccard Similarity 類型表單,只有「名稱」與「類型」,沒有額外欄位

此類型除了共同欄位外沒有專屬欄位。

Cohere

透過 Amazon Bedrock 使用 Cohere 的排序模型,推理與多語言能力強,能準確排序複雜的企業資料,適用於精確語意理解與跨語言檢索。

適合:

  • 內容跨多種語言,或專業領域資料較複雜。
  • 想要最準的語意排序,且環境的 AWS 區域支援 Cohere 模型。

選「Cohere」後,表單會多出「模型」與「地區」兩個欄位(「模型」已自動預選唯一選項):

Cohere 類型表單,含「模型」與「地區」欄位

Cohere 類型的專屬欄位:

欄位 必填 預設 說明
模型 Cohere Rerank v3.5 Cohere 排序模型。選 Cohere 類型後已自動預選唯一選項 Cohere Rerank v3.5。
地區 無(需選擇) 模型執行的 AWS 區域。選項見下方 tip。

Amazon

透過 Amazon Bedrock 使用 Amazon 原生的排序模型,能理解文字語義並依相關性排序。

適合:

  • 已在使用 AWS 生態,想用 Amazon 原生排序模型。
  • 想要語意排序,且環境的 AWS 區域支援 Amazon 模型。

選「Amazon」後,表單同樣會多出「模型」與「地區」兩個欄位(「模型」已自動預選):

Amazon 類型表單,含「模型」與「地區」欄位

Amazon 類型的專屬欄位:

欄位 必填 預設 說明
模型 Amazon Rerank v1 Amazon 排序模型。選 Amazon 類型後已自動預選 Amazon Rerank v1。
地區 無(需選擇) 模型執行的 AWS 區域。選項見下方 tip。

「地區」怎麼選

Cohere 與 Amazon 的「地區」是模型在 Amazon Bedrock 上執行的 AWS 區域,兩者選項相同:

選項 區域
Asia Pacific (Tokyo) 東京(ap-northeast-1
Canada (Central) 加拿大中部(ca-central-1
US West (Oregon) 美西奧勒岡(us-west-2

選離你的使用者較近、且該區域已開通對應模型的區域即可;不確定時先選預設清單中的任一個試跑,遇到模型未開通的錯誤再換區域。

排序器詳細頁

建立完成後點進某個排序器,詳細頁上方有三個頁籤;下圖為「一般」頁籤的「詳細資料」卡片,可看到 ID、名稱、類型、模型、地區與目前狀態:

排序器詳細頁的「一般」頁籤,顯示 ID、名稱、類型、模型、地區與狀態,上方有「一般」「依賴資源」「被依賴資源」三個頁籤

頁籤 內容
一般 排序器的基本資料:ID、名稱、類型、模型、地區(依類型而定)與狀態。卡片右上角的複製()鈕可複製這個排序器,旁邊的收合鈕可收合卡片。
依賴資源 這個排序器用到的其他資源(例如 Embedding 類型會用到的嵌入模型)。
被依賴資源 反過來,有哪些資源用到這個排序器。

排序器沒有「驗證」功能

排序器詳細頁不提供「驗證憑證/測試連線」按鈕——它不直接連外部系統。要確認它有沒有用,請看下方「使用效果」,用實際排序結果驗證。

使用效果

排序器不能單獨執行,它的價值在於「把檢索回來的候選文件重新排好」。檢索器只負責「廣撒網」把可能相關的文件都撈回來,常常前幾名不一定最貼題;排序器接在後面做「精排」,依與查詢的相關性重新計分排序,把最相關的往前推,並可過濾掉相關性過低的雜訊文件。最後交給大型語言模型的內容因此更精準、也更省 Token。

建立好的排序器會在這些地方被選用:

  • 排序器 (Ranker) 任務:拿一份既有文件清單(通常來自上游檢索器的輸出)重新排序,是排序器最直接的使用方式。
  • 檢索 (Retrieval) 任務:在「排序器」設定指定它,讓同一個任務一次完成「檢索 + 排序」。

精排前後的差別

同一份候選文件清單,接排序器前是檢索器原本的順序(可能把字面命中但不夠貼題的文件排在前面);接排序器後會依與查詢的相關性重新排序,最相關的往前、雜訊往後或被門檻過濾掉。實際的查詢與門檻設定方式見排序器 (Ranker) 任務

下一步