排序器¶

這頁能幫你做什麼¶

排序器 (Ranker) 用來把一批文件依「跟查詢有多相關」重新排序。檢索器 (Retriever) 從知識庫 (Knowledge Base) 撈回一堆候選文件後，前幾名不一定最貼題；接上排序器，就能再做一次精排，把最相關的內容往前推，提升回答品質。簡單說：檢索器負責「廣撒網撈回來」，排序器負責「精排挑最準」。建立好排序器後，就能在排序器 (Ranker) 任務或檢索 (Retrieval) 任務的「排序器」設定裡指定它。

開始前¶

前置需求

Embedding 類型會用到嵌入模型 (Embedding Model)；可在表單指定，未指定則使用系統預設嵌入模型。
Cohere、Amazon 類型透過 Amazon Bedrock 提供，需所在 AWS 區域支援對應模型。
Jaccard Similarity 類型不需要任何額外資源。

操作步驟¶

從左側資源選單進入「排序器」清單頁，點右上角沒有文字的「+」圖示按鈕開啟建立表單。
在「名稱」欄輸入名稱。
在「類型」選擇排序方式（Embedding、Jaccard Similarity、Cohere 或 Amazon）。不同類型會出現不同欄位，選好後的畫面差異見下方完整欄位說明。上方圖即為選「Embedding」後的樣子。
依所選類型填寫專屬欄位（Embedding 的「嵌入模型」，或 Cohere／Amazon 的「模型」「地區」）。
按右上角的「儲存」按鈕完成建立（見步驟 1 圖右上角）。

完整欄位說明¶

主表單先填所有類型共通的「名稱」與「類型」，選好類型後再填該類型專屬的欄位。

共同欄位（不分類型）¶

欄位	必填	預設	說明
名稱	是	無	排序器的識別名稱。最多 64 個字，不可用 `default` 開頭。
類型	是	無（需選擇）	排序方式，四選一：Embedding、Jaccard Similarity、Cohere 或 Amazon。四者的適用情境與專屬欄位見下方四節。建立後無法修改。

類型在建立後鎖定

編輯既有排序器時「類型」為唯讀。需要不同類型請另建一個排序器。

不確定選哪個類型？

一句話判斷：

想用「語意相近」來排序、且已經有嵌入模型 → 選 Embedding，把文件與查詢都轉成向量比相似度。
只是想快速、不接任何外部模型 → 選 Jaccard Similarity，純比對詞語重疊度，最輕量。
內容跨語言、企業資料較複雜、要最準的語意排序 → 選 Cohere（透過 Amazon Bedrock）。
想用 Amazon 原生排序模型、已在用 AWS 生態 → 選 Amazon（透過 Amazon Bedrock）。

其中 Cohere 與 Amazon 走 Amazon Bedrock，需所在 AWS 區域支援；Embedding 需要嵌入模型；Jaccard Similarity 完全不需外部資源。

Embedding¶

把文件與查詢都轉成向量，依向量相似度排序，能處理「語意相近但用字不同」的內容。

適合：

想依語意相似性排序，而非字面重疊。
已經建好嵌入模型，或想沿用系統預設嵌入模型。

選「Embedding」後的表單，會多出一個「嵌入模型」欄位：

Embedding 類型表單，含「嵌入模型」欄位

Embedding 類型的專屬欄位：

欄位	必填	預設	說明
嵌入模型	否	系統預設嵌入模型	指定用來產生向量的嵌入模型。未指定時使用系統預設模型。右側的編輯（）鈕可挑選；可清除。

Jaccard Similarity¶

純比對兩段文字的詞語重疊度（Jaccard 係數）來排序，不需要任何外部模型，最輕量、最快。

適合：

想要最簡單、最省成本的排序，不接任何外部模型或雲端服務。
文件與查詢用詞固定、字面重疊就足以判斷相關性。

選「Jaccard Similarity」後，表單沒有任何額外欄位——填好「名稱」與「類型」即可建立：

Jaccard Similarity 類型表單，只有「名稱」與「類型」，沒有額外欄位

此類型除了共同欄位外沒有專屬欄位。

Cohere¶

透過 Amazon Bedrock 使用 Cohere 的排序模型，推理與多語言能力強，能準確排序複雜的企業資料，適用於精確語意理解與跨語言檢索。

適合：

內容跨多種語言，或專業領域資料較複雜。
想要最準的語意排序，且環境的 AWS 區域支援 Cohere 模型。

選「Cohere」後，表單會多出「模型」與「地區」兩個欄位（「模型」已自動預選唯一選項）：

Cohere 類型表單，含「模型」與「地區」欄位

Cohere 類型的專屬欄位：

欄位	必填	預設	說明
模型	是	Cohere Rerank v3.5	Cohere 排序模型。選 Cohere 類型後已自動預選唯一選項 Cohere Rerank v3.5。
地區	是	無（需選擇）	模型執行的 AWS 區域。選項見下方 tip。

Amazon¶

透過 Amazon Bedrock 使用 Amazon 原生的排序模型，能理解文字語義並依相關性排序。

適合：

已在使用 AWS 生態，想用 Amazon 原生排序模型。
想要語意排序，且環境的 AWS 區域支援 Amazon 模型。

選「Amazon」後，表單同樣會多出「模型」與「地區」兩個欄位（「模型」已自動預選）：

Amazon 類型表單，含「模型」與「地區」欄位

Amazon 類型的專屬欄位：

欄位	必填	預設	說明
模型	是	Amazon Rerank v1	Amazon 排序模型。選 Amazon 類型後已自動預選 Amazon Rerank v1。
地區	是	無（需選擇）	模型執行的 AWS 區域。選項見下方 tip。

「地區」怎麼選

Cohere 與 Amazon 的「地區」是模型在 Amazon Bedrock 上執行的 AWS 區域，兩者選項相同：

選項	區域
Asia Pacific (Tokyo)	東京（`ap-northeast-1`）
Canada (Central)	加拿大中部（`ca-central-1`）
US West (Oregon)	美西奧勒岡（`us-west-2`）

選離你的使用者較近、且該區域已開通對應模型的區域即可；不確定時先選預設清單中的任一個試跑，遇到模型未開通的錯誤再換區域。

排序器詳細頁¶

建立完成後點進某個排序器，詳細頁上方有三個頁籤；下圖為「一般」頁籤的「詳細資料」卡片，可看到 ID、名稱、類型、模型、地區與目前狀態：

排序器詳細頁的「一般」頁籤，顯示 ID、名稱、類型、模型、地區與狀態，上方有「一般」「依賴資源」「被依賴資源」三個頁籤

頁籤	內容
一般	排序器的基本資料：ID、名稱、類型、模型、地區（依類型而定）與狀態。卡片右上角的複製（）鈕可複製這個排序器，旁邊的收合鈕可收合卡片。
依賴資源	這個排序器用到的其他資源（例如 Embedding 類型會用到的嵌入模型）。
被依賴資源	反過來，有哪些資源用到這個排序器。

排序器沒有「驗證」功能

排序器詳細頁不提供「驗證憑證／測試連線」按鈕——它不直接連外部系統。要確認它有沒有用，請看下方「使用效果」，用實際排序結果驗證。

使用效果¶

排序器不能單獨執行，它的價值在於「把檢索回來的候選文件重新排好」。檢索器只負責「廣撒網」把可能相關的文件都撈回來，常常前幾名不一定最貼題；排序器接在後面做「精排」，依與查詢的相關性重新計分排序，把最相關的往前推，並可過濾掉相關性過低的雜訊文件。最後交給大型語言模型的內容因此更精準、也更省 Token。

建立好的排序器會在這些地方被選用：

排序器 (Ranker) 任務：拿一份既有文件清單（通常來自上游檢索器的輸出）重新排序，是排序器最直接的使用方式。
檢索 (Retrieval) 任務：在「排序器」設定指定它，讓同一個任務一次完成「檢索＋排序」。

精排前後的差別

同一份候選文件清單，接排序器前是檢索器原本的順序（可能把字面命中但不夠貼題的文件排在前面）；接排序器後會依與查詢的相關性重新排序，最相關的往前、雜訊往後或被門檻過濾掉。實際的查詢與門檻設定方式見排序器 (Ranker) 任務。

下一步¶

檢索器 (Retriever)：先撈出候選文件，再交給排序器精排。
知識庫 (Knowledge Base)：資料來源倉庫。
嵌入模型 (Embedding Model)：Embedding 類型所需的模型。
排序器 (Ranker) 任務：在工作流程中實際使用排序器。
檢索 (Retrieval) 任務：一次完成檢索＋排序。