跳轉到

檢索

這頁能幫你做什麼

檢索 (Retrieval) 任務是「一站式」的知識庫查詢工具:你只要選好一個或多個檢索器 (Retriever) ,再選擇性地接上排序器 (Ranker) ,這個任務就會自動把「檢索候選文件」和「重新排序」兩件事一次做完,把最相關的文件交給後續任務(通常是大型語言模型)。

適合的情境例如:

  • 政府公文、SOP、法規條文的問答檢索(RAG)
  • 從產品手冊、客服知識庫找出最相關段落餵給 LLM 回答
  • 同時用語意與關鍵字多策略檢索,再用排序器挑出最佳結果

檢索 (Retrieval) 與檢索器 (Retriever) 有什麼不同?

平台有兩個看起來相似但用途不同的任務:

  • 檢索 (Retrieval) (本頁) = 多個檢索器 + 一個排序器的組合包,一個任務完成「檢索+排序」。適合直接產出一份排好序的文件清單。
  • 檢索器 (Retriever) = 只執行單一檢索器,輸出未經重新排序的原始檢索結果,欄位更細(可選檢索模式、進階過濾、混合搜尋參數等)。若你想自己控制檢索與排序兩個步驟,請改用檢索器任務搭配 排序 (Ranker) 任務。

開始前

需要先準備好的資源

  • 至少一個 檢索器 (Retriever) 資源:定義要用哪種搜尋策略與哪個知識庫。建立方式見 檢索器資源
  • (選填)一個 排序器 (Ranker) 資源:用來把檢索結果重新排序。建立方式見 排序器資源

操作步驟

  1. 在工作流程 (Workflow) 編輯畫面新增「檢索」任務。

    檢索任務設定面板

  2. 在「名稱」填入此任務在流程中的唯一名稱。

  3. 在「檢索器」逐筆新增要執行的檢索器。「檢索器」是一張含「檢索器名稱」「知識庫名稱」兩欄的表格,預設為空。按右側的「+」新增一列,在「檢索器名稱」選一個檢索器資源、在「知識庫名稱」選它要搜尋的知識庫;要做多策略檢索就重複按「+」再加一列。
  4. (選填)在「排序器」選擇一個排序器資源;選了之後才會出現「排序器設定」區塊。

    選好排序器後出現的「排序器設定」區塊

  5. 設定「下一步」指向流程中的下一個狀態。

  6. 視需要展開「執行設定」調整外部記憶體、串流與錯誤處理。

    展開「執行設定」後的共用欄位

  7. 切換到「輸入與輸出」、「錯誤處理」分頁調整共用設定(見 Action 通用設定)。

    「輸入與輸出」分頁

    「錯誤處理」分頁

本任務特有欄位

欄位 必填 預設 說明
名稱 此任務在工作流程中的唯一識別名稱,不可與其他狀態重複。
檢索器 要執行的檢索器清單,呈現為一張含「檢索器名稱」「知識庫名稱」兩欄的表格,預設為空。按「+」逐筆新增:「檢索器名稱」選一個檢索器資源(決定檢索模式),「知識庫名稱」選該筆要搜尋的知識庫。可加入多筆做多策略檢索;各檢索器的詳細欄位見 檢索器任務。也可切換為 JSONPath 動態帶入(路徑寫法見 JSONPath 語法)。
排序器 選擇一個排序器資源,對所有檢索器的結果重新排序。可清除;也可切換為 JSONPath 動態指定(路徑寫法見 JSONPath 語法)。未選則直接回傳檢索結果,不重新排序。
下一步 本任務完成後要轉換到的工作流程狀態;不選代表此狀態為流程結束。
附註 給維護者看的說明文字,不影響執行。

排序器設定區塊

只有在「排序器」選了資源後,才會出現「排序器設定」區塊。下表這些欄位會依你所選排序器資源的演算法類型動態出現,不同類型看到的欄位不一樣;多數情境直接沿用預設值即可,不必逐欄調整。

欄位 必填 預設 說明
查詢來源 自訂查詢 決定排序時用來衡量相關性的查詢從何而來。可選「自訂查詢」(直接填查詢字串)、「自訂查詢樣板」(用 Jinja 樣板組出查詢)、「既有查詢樣板」(選用已建立的樣板資源)。
查詢字串 / 查詢樣板 視來源 依「查詢來源」呈現對應輸入:填字串、編輯樣板,或選樣板資源並填入樣板變數。
排序欄位 視類型 jaccard_similaritycohereamazon 類型出現。指定要拿文件中哪些欄位來計算排序。cohere 以外的類型為必填。
內容樣板 embedding 類型出現。用 Jinja 樣板把文件內容組成要做向量比對的文字。
文件數量上限 10 排序後最多回傳幾份文件。範圍 1~1000。
相似度門檻值 0 jaccard_similarityembedding 類型出現。低於此分數的文件會被排除。範圍 0~1(每格 0.01)。

排序器設定欄位隨類型變動

上表的「排序欄位」「內容樣板」「相似度門檻值」只在特定排序器類型出現;實際看到的欄位以你所選排序器資源的類型為準。各排序器類型的差異見 排序器資源

執行設定(摺疊區塊)

這些欄位收在「執行設定」摺疊區塊內,多為共用設定,完整說明見 Action 通用設定

欄位 必填 預設 說明
上傳輸出至外部記憶體 關閉 開啟後可把任務輸出寫入外部記憶體,並設定要寫入的選擇器。
串流設定 關閉 設定是否串流輸出(共用設定)。
錯誤時中止 開啟 開啟時任務出錯就中止流程;關閉後可改填「預設輸出」,出錯時用此預設值繼續往下走。
預設輸出 僅在「錯誤時中止」關閉時出現,供你定義出錯時回傳的內容。

預期結果

設定一個語意 + 關鍵字的多策略檢索,再接上排序器,輸入查詢後即可得到一份排好序的文件清單,可直接接給後續的 LLM 任務作為回答依據。

下一步