跳轉到

排序器

這頁能幫你做什麼

排序器 (Ranker) 任務拿一份既有的文件清單(通常來自 檢索器 (Retriever) 任務的輸出),依與查詢的相關性重新排序,把最相關的文件排到最前面,並可過濾掉相關性過低的文件。這能讓後續交給大型語言模型的內容更精準、更省 Token。(本頁在工作流程編輯器的「新增狀態」面板中顯示為「排序器」。)

適合的情境例如:

  • RAG 流程中在檢索之後、餵給 LLM 之前,把段落重新排序
  • 把多個檢索器的結果合併後統一排序
  • 用相關性門檻過濾掉不夠相關的雜訊文件
  • 對專業領域內容套用特定的排序模型(如 Cohere、Amazon)

什麼時候用排序器 (Ranker) ,什麼時候用檢索 (Retrieval) ?

若你已用 檢索器 (Retriever) 任務取得文件、想自己控制排序步驟,就用本任務。若想一個任務就同時做完「檢索+排序」,可改用 檢索 (Retrieval) 任務(內含排序器設定)。

開始前

需要先準備好的資源

  • 一個 排序器 (Ranker) 資源:決定使用哪種排序演算法。建立方式見 排序器資源
  • 一份要排序的 文件清單:通常來自上游檢索器任務的輸出,用 JSONPath(例如 $.retriever_output)帶入(路徑寫法見 JSONPath 語法)。

操作步驟

  1. 在工作流程 (Workflow) 編輯畫面新增「排序器」任務。

    排序器任務設定面板

  2. 在「名稱」填入此任務在流程中的唯一名稱。

  3. 在「排序器」選擇一個排序器資源。選好後才會出現查詢與文件欄位。

    選好排序器後出現的「查詢來源」「查詢字串」等欄位

  4. 設定「查詢來源」與查詢內容,作為衡量相關性的依據。

  5. 在「文件」填入要排序的文件清單(通常用 JSONPath 指向上游輸出)。
  6. 設定「下一步」指向流程中的下一個狀態。
  7. 視需要展開「進階任務設定」調整文件數量上限與相似度門檻值。

    排序器任務展開「進階任務設定」後的欄位

  8. 切換到「輸入與輸出」、「錯誤處理」分頁調整共用設定(見 Action 通用設定)。

    「輸入與輸出」分頁

    「錯誤處理」分頁

本任務特有欄位

欄位 必填 預設 說明
名稱 此任務在工作流程中的唯一識別名稱,不可與其他狀態重複。
排序器 要使用的排序器資源。其類型決定下方會出現哪些欄位(如排序欄位或內容樣板)。也可切換為 JSONPath 動態指定。
查詢來源 自訂查詢 決定衡量相關性的查詢從何而來。可選「自訂查詢」(直接填字串)、「自訂查詢樣板」(用 Jinja 樣板組出查詢)、「既有查詢樣板」(選用已建立的樣板資源並填樣板變數)。
查詢字串 / 查詢樣板 視來源 依「查詢來源」呈現對應輸入:填字串、編輯樣板,或選樣板資源。
排序欄位 視類型 jaccard_similaritycohereamazon 類型出現。指定拿文件中哪些欄位來計算排序。cohere 以外的類型為必填。
內容樣板 是(embedding 類型) embedding 類型出現。用 Jinja 樣板把文件內容組成要做向量比對的文字。
文件 空清單 要排序的文件清單(陣列)。通常用 JSONPath 指向上游檢索器的輸出,例如 $.retriever_output
下一步 本任務完成後要轉換到的工作流程狀態;不選代表此狀態為流程結束。
附註 給維護者看的說明文字,不影響執行。

查詢與欄位隨排序器類型變動

上表的「排序欄位」「內容樣板」只在特定排序器類型出現;實際看到的欄位以你所選排序器資源的類型為準。各排序器類型差異見 排序器資源

進階任務設定(摺疊區塊)

這些欄位收在「進階任務設定」摺疊區塊內,只有在已選排序器資源後才會出現。

欄位 必填 預設 說明
文件數量上限 10 排序後最多回傳幾份文件。範圍 1~1000。
相似度門檻值 0 jaccard_similarityembedding 類型出現。低於此分數的文件會被排除。範圍 0~1(每格 0.01)。

執行設定(摺疊區塊)

這些欄位收在「執行設定」摺疊區塊內,多為共用設定,完整說明見 Action 通用設定

欄位 必填 預設 說明
上傳輸出至外部記憶體 關閉 開啟後可把任務輸出寫入外部記憶體,並設定要寫入的選擇器。
串流設定 關閉 設定是否串流輸出(共用設定)。
錯誤時中止 開啟 開啟時任務出錯就中止流程;關閉後可改填「預設輸出」,出錯時用此預設值繼續往下走。
預設輸出 僅在「錯誤時中止」關閉時出現,供你定義出錯時回傳的內容。

預期結果

選好排序器、設定查詢與文件清單後,本任務會把文件依相關性分數由高到低重新排序(並可依門檻過濾),輸出一份排好序的文件清單,可直接接給後續的 LLM 任務作為回答依據。

下一步