關於提升槓桿效應的技能組合新思維:Skill Graphs 2.0
關於提升槓桿效應的技能組合新思維:Skill Graphs 2.0
最近我學到最有價值的事情之一,就是如何思考技能組合,以便在工作中獲得更大的槓桿效應。
「Skill Graphs(技能圖譜)」的概念最近引起了廣泛關注。這個想法是透過在 Markdown 文件中連結相關技能來建立一個技能圖譜,就像你在 Obsidian 中連結筆記的方式一樣。
一個技能將「知識 + 流程」編碼到一個 Markdown 文件中,並可選擇性地搭配 Agent 可以重複執行的腳本。
因此,從直覺上來看,技能圖譜非常有道理——當你嘗試將更大的流程或職能編碼為技能時,你很可能會遇到需要依賴其他技能的情況。
例如,撰寫行銷郵件的技能可能就依賴於平面設計技能。
Skill Graphs 的瓶頸
但是,當你的技能圖譜變得足夠大時,Agent 可能無法可靠地呼叫超過特定深度的技能。依賴關係越多,可靠性就越低。(Reddit 和 X 上許多實際嘗試過的人也指出了這一點)。
如果技能 A 明確指示呼叫技能 B,那通常會相當可靠。
但在一個密集的圖譜中(想像一下維基百科),依賴鏈的深度可能會非常深,因此你無法確定最終會發生什麼。
這是一個問題,因為擁有特定意圖的人類駕駛現在面臨著大量的不確定性,並且將過多的判斷權交給了 Agent(或許太多了)。
循環依賴也可能造成問題。
那麼,我們應該放棄這個想法,認為它行不通嗎?
絕對不是。
組合技能的基本理念仍然非常重要,如果你能有效地組合技能,你就能在任何類型的工作中解鎖額外的槓桿效應。
一種不同的技能組合方式
我相信解決方案在於以不同的方式組合技能。
以下是我對此的思考方式。
技能在不同層級運作:原子(Atoms)、分子(Molecules)和化合物(Compounds)。
高階技能為 Agent 提供更多關於如何編排的判斷力,低階技能則為模型提供非常明確的執行工作流程。

原子 (ATOMS)
這些是基礎層級的原子技能。它們是單一用途的建構模組,範圍狹窄——屬於原始組件。
範例:
抓取 LinkedIn 個人檔案
搜尋競爭對手的部落格文章
在 Apollo 上尋找某人
使用 Hunter 驗證電子郵件
檢查電子郵件送達率
研究某個主題
審查此 PR
這些技能應該非常可靠。幾乎是確定性的(或者說盡可能接近 LLM 所能達到的確定性)。
原子技能(通常)完全不會呼叫其他技能。
分子 (MOLECULES)
分子技能解決的是更大的問題。
一個分子技能可能會使用 2 到 10 個原子技能來完成一項有範圍限制的任務。
它應該包含關於何時以及如何呼叫原子技能的明確指令。
它會比原子技能賦予 Agent 更多的判斷空間,但提供關於何時使用哪種技能的明確指令仍然非常有幫助。
你將盡可能多的組合邏輯推入技能本身,並最小化 Agent 在執行時期的決策需求。
分子技能也應該非常可靠。範例:
- 一個結構化的工作流程,將幾個原子技能串聯起來。
使用 atom-1 和 atom-2 尋找潛在客戶 -> 然後使用 atom-3 進行篩選,並使用 atom-4 進行資料豐富化,最後使用 atom-5 將它們加入我的試算表。
- 一個知道 5 個原子技能的編排器,它會運用判斷力來組合這些技能以解決 Prompt。
可能還有其他結構。
在這裡,Agent 自然會比使用原子技能時擁有更多的判斷力和自主權,但我們仍然致力於讓事情盡可能明確。
化合物 (COMPOUNDS)
化合物技能是更高層級的編排器,用於執行多個分子技能。
「執行外撥銷售劇本 (outbound sales playbook)」
「規劃並建構此功能,然後進行審查和 QA」
這是你真正賦予 Agent 有意義自主權的層級。
這些技能本質上可能較不具確定性,因為 Agent 可能需要在許多層級上做出判斷。
這些也是最難正確實現的,而且它們可能需要人類來驅動。
是的,人類可能需要驅動這些化合物技能(至少在今天)。
槓桿效應與大腦 RAM
每個層級的槓桿效應都高出一個數量級,所以如果你驅動的是化合物技能而不是原子技能,你可能可以多做 100 倍的工作。
原因如下。
你大腦的 RAM(在記憶體中同時處理多項任務並有效切換上下文的能力)現在實際上是限制資源。
例如,考慮這種情況。
假設你的大腦能夠在最多 5 個 Agent 之間並行切換上下文。
現在假設:
1 個化合物技能編排 10 個分子技能
1 個分子技能編排 10 個原子技能(當然要可靠地執行)
如果你驅動你的 Agent 去做原子級的工作,你只是用低槓桿的工作塞滿了 1 個 RAM 插槽,因為這些工作基本上是確定性的。
當你的車有全自動駕駛功能時,為什麼你還要坐在駕駛座上?
但如果你同時驅動 5 個 Agent 來執行分子或化合物層級的工作,那就是:
5 個化合物任務
50 個分子任務
500 個原子工作單位
並行執行 5 個原子任務與並行執行 5 個化合物任務,所消耗的大腦 RAM 和時間是相似的。

在花費相同的時間和大腦 RAM 的情況下,驅動原子級工作與化合物級工作,工作產出會有巨大的差異。
這與一家擁有 1000 名員工的公司的 CTO 不會親自修復每一個 Bug 的道理是一樣的。他可以信任個人貢獻者 (IC) 可靠地完成這些工作。
瓶頸在哪裡(仍在摸索中)
當然,關鍵在於:
每一個原子技能都必須穩固
分子技能必須能可靠地串聯它們
Agent 在化合物層級需要足夠的自主權來做出真正的決策
你的判斷力是在化合物層級(或更高層級)發揮作用。
我還在摸索哪裡會出現瓶頸。
我的猜測是:跨越超過 8-10 個分子技能的化合物技能,開始觸及它們自身的可靠性上限。
在某個時刻,化合物技能將會足夠好,以至於我們需要比這更高的抽象層級。
我還沒遇到那個瓶頸。
我目前仍在驅動分子和化合物技能,即使是這樣,要做到正確也並非易事。
但目標是讓每個工作流程不斷向更高的層級邁進。
我們用這種「原子 / 分子 / 化合物」的結構建立了我們的技能庫,效果相當不錯。
我們稱它們為:
能力 (capabilities)(原子)
複合技能 (composites)(分子)
劇本 (playbooks)(化合物)
到目前為止,運作得相當順利。
最大挑戰
在每個層級上確保技能的可靠性與一致性並非易事,且測試這些技能需要花費大量時間。
我想像自動化研究 (autoresearch) 類型的解決方案或許能解決這個問題,但我還沒針對這個問題嘗試過。希望不久的將來能實現。
