跳轉到

知識庫

這頁能幫你做什麼

知識庫 (Knowledge Base) 是放置你公司資料的「集中倉庫」。你把文件、產品說明、法規條文、客服紀錄等內容放進來後,平台會把它們轉成可以用語意搜尋的向量資料,之後就能讓檢索器 (Retriever)檢索 (Retrieval) 任務或 Agent 的檢索工具從這裡找出最相關的內容,做出有所本的回答。簡單說:先有知識庫,後面的「問答/檢索/RAG」才有資料可用。

開始前

前置需求

操作步驟

  1. 從左側資源選單進入「知識庫」清單頁,點建立入口(空清單時是有文字的建立按鈕;清單已有項目時是右上角無文字的「+」圖示)開啟建立表單。

    知識庫建立表單,含「名稱」與「類型」兩個欄位

  2. 在「名稱」欄輸入好辨識的名稱(例如 產品手冊知識庫)。

  3. 在「類型」選擇知識庫類型(目前提供 Vector)。
  4. 按右上角的「儲存」按鈕完成建立(見上方圖右上角)。

    建立完成後會進入該知識庫的詳細頁,此時知識庫還是空的:

    知識庫詳細頁的「一般」頁籤,顯示 ID、名稱、類型、OpenSearch 索引名稱、資料欄位與狀態

  5. 接著到載入器 (Loader) 建立一個指向這個知識庫的載入器,把文件來源接進來並同步。

完整欄位說明

欄位 必填 預設 說明
名稱 知識庫的識別名稱。最多 64 個字,不可用 default 開頭。
類型 無(需選擇) 知識庫的儲存方式。目前提供 Vector:以向量資料庫儲存知識內容,支援語意檢索與相關內容比對。建立後無法修改,請一開始就選對。

類型在建立後鎖定

編輯既有知識庫時「類型」為唯讀。需要不同類型請另建一個知識庫。

知識庫詳細頁

建立完成後點進某個知識庫,詳細頁上方有三個頁籤。

「一般」頁籤

「一般」頁籤的「詳細資料」卡片顯示這個知識庫的基本資料:

知識庫詳細頁的「一般」頁籤,顯示 ID、名稱、類型、OpenSearch 索引名稱、資料欄位、系統資訊與狀態

欄位 說明
ID 知識庫的識別碼,旁邊的複製()鈕可複製。
名稱 建立時填的名稱。
類型 目前固定為 Vector。
OpenSearch 索引名稱 平台實際儲存向量資料的索引名稱,一般使用者可忽略。
資料欄位 這個知識庫目前可被檢索的欄位(例如 retriever_chunk);資料灌入後才會出現。
系統資訊 系統層級的附註,通常為空。
狀態 知識庫目前狀態(例如「就緒」)。
最後更新 最後一次變更的時間。

卡片右上角的圖示鈕可進入編輯()、複製()或刪除()這個知識庫。

「依賴資源」頁籤

當你建立了指向這個知識庫的載入器後,「依賴資源」頁籤就會列出整條資料管線用到的其他資源——載入器、檢索器、儲存庫與嵌入模型。這頁讓你一眼看出「這個知識庫背後牽動了哪些東西」,在設定權限或排查問題時特別有用。

知識庫詳細頁的「依賴資源」頁籤,列出載入器、兩個檢索器、儲存庫與嵌入模型,含名稱、ID、類型

頁籤 內容
一般 知識庫的基本資料,如上一節。
依賴資源 這個知識庫用到的其他資源(載入器、檢索器、儲存庫、嵌入模型…),如上圖。
被依賴資源 反過來,有哪些資源用到這個知識庫。

知識庫沒有「驗證」功能

知識庫詳細頁不提供「驗證憑證/測試連線」按鈕——它不直接連外部系統。要確認它有沒有用,請看下方「使用效果」,用實際檢索問答驗證。

怎麼把資料放進知識庫

知識庫建立完是空的,要靠載入器 (Loader) 把外部資料來源(Amazon S3、OpenSearch、MySQL、API Endpoint、儲存庫 (Storage))的內容讀進來、切塊、轉成向量後寫入。設定方式請見載入器 (Loader)

使用效果

知識庫的價值要「灌好資料、查得到」才看得出來。資料進了知識庫後,就能透過下列資源被使用:

下圖是一個接了知識庫的 Agent:使用者問「退換貨政策」,Agent 透過知識庫檢索工具找到先前灌進去的產品文件並據此回答——這就是知識庫發揮作用的結果。

接了知識庫的 Agent,使用者提問後透過知識庫檢索工具找到文件並作答

要把資料灌進知識庫、再接給 Agent 或工作流程使用,依序見載入器 (Loader)檢索器 (Retriever)檢索 (Retrieval) 任務

下一步