跳轉到

資料集

這頁能幫你做什麼

資料集 (Dataset) 用來整理一批「輸入 → 預期輸出」的資料,常用於評估 (Evaluation):你定義好哪些是輸入欄位、哪些是輸出欄位,填入測試樣本後,就能拿來檢驗 Agent 或工作流程的回答是否符合預期。也能用平台的生成功能,依欄位描述自動產生範例資料。簡單說:資料集是你的「測驗題庫」,方便反覆驗證成效。

開始前

前置需求

建立資料集本身不需要其他資源,只要規劃好「要哪些輸入欄位、哪些輸出欄位」即可。建立完成後即可進入評估流程。

操作步驟

  1. 從左側資源選單進入「資料集」清單頁,點建立入口(空清單時是有文字的建立按鈕;清單已有項目時是右上角無文字的「+」圖示)開啟建立表單。

    資料集建立表單,含「名稱」「輸入欄位」「輸出欄位」「描述」

  2. 在「名稱」欄輸入名稱。

  3. 在「輸入欄位」表格按右側的「+」新增輸入欄位,於彈出視窗填好欄位的名稱與描述後儲存。

    「新增欄位」對話框,含「名稱」與「描述」

  4. 在「輸出欄位」表格用同樣方式逐一新增輸出欄位(預期結果)。

  5. 視需要在「描述」填寫整個資料集的用途說明。
  6. 按右上角的「儲存」按鈕完成建立(見步驟 1 圖右上角)。

    建立完成後會進入該資料集,右上角的「評估」按鈕可進入評估流程填入或生成資料項目。

完整欄位說明

主表單

資料集建立表單,「輸入欄位」「輸出欄位」皆為表格,下方為「描述」

欄位 必填 預設 說明
名稱 資料集的識別名稱。最多 64 個字,不可用 default 開頭。
輸入欄位 表格。定義餵給 Agent/工作流程的輸入欄位,每筆有名稱與描述。在表格按「+」用「欄位設定」對話框新增(見下)。
輸出欄位 表格。定義預期結果的欄位,每筆有名稱與描述。新增方式同「輸入欄位」。
描述 多行文字,說明整個資料集的用途。

欄位設定(彈出視窗)

在「輸入欄位」或「輸出欄位」表格按「+」(或對已建欄位按編輯)時開啟,用來定義單一欄位:

「新增欄位」對話框,含必填的「名稱」與選填的「描述」

欄位 必填 預設 說明
名稱 欄位名稱,最多 64 個字。
描述 多行文字,說明此欄位代表什麼。

描述寫清楚,生成品質更好

若之後使用評估頁的「生成資料集項目」功能,大型語言模型會參考每個欄位的「描述」來產生範例資料。描述寫得越具體(例如輸入 question 描述為「使用者提出的問題」、輸出 expected_answer 描述為「客服應給出的標準答案」),自動生成的範例就越貼近你的情境。

資料集詳細頁

建立完成後點進某個資料集,詳細頁上方有三個頁籤(「一般」「依賴資源」「被依賴資源」),右上角另有「評估」按鈕。下圖為「一般」頁籤,可看到基本資料與當初設定的輸入/輸出欄位:

資料集詳細頁的「一般」頁籤,顯示 ID、名稱、描述、最新版本、狀態,以及「輸入欄位」「輸出欄位」表格;右上角有「評估」按鈕

頁籤/區塊 內容
一般 資料集的基本資料:ID、名稱、描述、最新版本、系統資訊、狀態、最後更新,以及「輸入欄位」與「輸出欄位」兩張表格。卡片右上角的圖示鈕可編輯()、複製()或刪除()。
依賴資源 這個資料集用到的其他資源。
被依賴資源 反過來,有哪些資源用到這個資料集。
「評估」按鈕 右上角,點進去進入評估頁,填入或生成資料項目並跑評估(見下方「使用效果」)。

資料集沒有「驗證」功能

資料集詳細頁不提供「驗證憑證/測試連線」按鈕——它不連外部系統。它的用途是當作評估的題庫,效果見下方「使用效果」。

使用效果

資料集本身不會執行,它的價值在於「拿去評估」:點詳細頁右上角的「評估」按鈕進入評估頁後,逐筆填入(或用「生成資料集項目」自動產生)「輸入欄位」與「輸出欄位」的內容,就成了一份標準答案題庫。接著指定要受測的 Agent 或工作流程,平台會把每筆「輸入」餵進去、把實際回答和你填的「預期輸出」比對,產出一份成效報告,讓你看出回答是否符合預期、哪些題目答錯。

簡單說:填入「輸入/預期輸出」→ 用來驗證 Agent/工作流程的回答是否符合預期。要把受測對象建好,見 Agent工作流程

下一步

  • Agent:可用資料集評估其回答品質。
  • 範本 (Template):搭配資料集設計可重複使用的提示。
  • 工作流程:同樣可用資料集驗證輸出是否符合預期。