← 返回首頁

Skill-RAG提出故障感知RAG框架,透過隱藏狀態探測與技能路由診斷查詢-證據錯位

Sumit
Sumit
@_reachsumit
9🔁 1
𝕏 (Twitter)🔥🔥
AI 中文摘要Claude 生成

Skill-RAG提出故障感知RAG框架,透過隱藏狀態探測與技能路由診斷查詢-證據錯位。

Skill-RAG是一種故障狀態感知的檢索增強生成(RAG)框架,針對現有方法僅將後檢索故障視為重試訊號、忽略查詢與證據空間結構性錯位的問題,提出輕量隱藏狀態探測器結合提示式技能路由器,精準診斷並修正故障。

框架核心機制
Skill-RAG在RAG管線兩個階段部署隱藏狀態探測器(hidden-state prober),用以偵測故障狀態。一旦偵測到故障,提示式技能路由器(prompt-based skill router)會診斷根本原因,並從四種檢索技能中選擇合適策略修正錯位,再進行下一輪生成嘗試:

  • 查詢改寫(query rewriting)
  • 問題分解(question decomposition)
  • 證據聚焦(evidence focusing)
  • 退出技能(exit skill),適用於真正無法還原的案例

此設計承認持續檢索故障多源自查詢與證據空間的對齊差距,而非相關證據缺失。

實驗驗證與效能提升
作者Kai Wei、Raymond Li、Xi Zhu、Zhaoqian Xue、Jiaojiao Han、Jingcheng Niu、Fan Yang於2026年4月17日發表的論文(arxiv.org/abs/2604.15771),在多個開放域問答(open-domain QA)與複雜推理基準測試中驗證框架。多輪檢索後的難解案例準確率大幅提升,尤其在外部分佈資料集(out-of-distribution datasets)表現突出,證明Skill-RAG有效處理頑固故障。

故障空間結構洞察
表示空間分析(representation-space analyses)顯示,四種技能對應故障狀態空間中結構化、可分離的區域,支持查詢-證據錯位為類型化(typed)而非單一現象(monolithic)的觀點。此發現批判現有自適應檢索僅優化效率,卻未診斷結構性根因,導致持久故障未解。

對RAG範式的啟示
傳統RAG雖奠基大型語言模型外部知識接地,但忽略故障診斷,Skill-RAG透過故障感知機制填補空白,強調診斷優先於盲目重試。論文觀察顯示,大量持續故障源自對齊缺口,此框架不僅提升硬案例效能,更揭示RAG需轉向類型化故障處理,以實現更穩健的知識整合。