← 返回首頁

關於提升槓桿效應的技能組合新思維:Skill Graphs 2.0

Shiv
Shiv
@shivsakhuja
37🔁 3
𝕏 (Twitter)🔥🔥

關於提升槓桿效應的技能組合新思維:Skill Graphs 2.0

最近我學到最有價值的事情之一,就是如何思考技能組合,以便在工作中獲得更大的槓桿效應。

「Skill Graphs(技能圖譜)」的概念最近引起了廣泛關注。這個想法是透過在 Markdown 文件中連結相關技能來建立一個技能圖譜,就像你在 Obsidian 中連結筆記的方式一樣。

一個技能將「知識 + 流程」編碼到一個 Markdown 文件中,並可選擇性地搭配 Agent 可以重複執行的腳本。

因此,從直覺上來看,技能圖譜非常有道理——當你嘗試將更大的流程或職能編碼為技能時,你很可能會遇到需要依賴其他技能的情況。

例如,撰寫行銷郵件的技能可能就依賴於平面設計技能。

Skill Graphs 的瓶頸

但是,當你的技能圖譜變得足夠大時,Agent 可能無法可靠地呼叫超過特定深度的技能。依賴關係越多,可靠性就越低。(Reddit 和 X 上許多實際嘗試過的人也指出了這一點)。

如果技能 A 明確指示呼叫技能 B,那通常會相當可靠。

但在一個密集的圖譜中(想像一下維基百科),依賴鏈的深度可能會非常深,因此你無法確定最終會發生什麼。

這是一個問題,因為擁有特定意圖的人類駕駛現在面臨著大量的不確定性,並且將過多的判斷權交給了 Agent(或許太多了)。

循環依賴也可能造成問題。

那麼,我們應該放棄這個想法,認為它行不通嗎?

絕對不是。

組合技能的基本理念仍然非常重要,如果你能有效地組合技能,你就能在任何類型的工作中解鎖額外的槓桿效應。

一種不同的技能組合方式

我相信解決方案在於以不同的方式組合技能。

以下是我對此的思考方式。

技能在不同層級運作:原子(Atoms)、分子(Molecules)和化合物(Compounds)。

高階技能為 Agent 提供更多關於如何編排的判斷力,低階技能則為模型提供非常明確的執行工作流程。

原子 (ATOMS)

這些是基礎層級的原子技能。它們是單一用途的建構模組,範圍狹窄——屬於原始組件。

範例:

  • 抓取 LinkedIn 個人檔案

  • 搜尋競爭對手的部落格文章

  • 在 Apollo 上尋找某人

  • 使用 Hunter 驗證電子郵件

  • 檢查電子郵件送達率

  • 研究某個主題

  • 審查此 PR

這些技能應該非常可靠。幾乎是確定性的(或者說盡可能接近 LLM 所能達到的確定性)。

原子技能(通常)完全不會呼叫其他技能。

分子 (MOLECULES)

分子技能解決的是更大的問題。

一個分子技能可能會使用 2 到 10 個原子技能來完成一項有範圍限制的任務。

它應該包含關於何時以及如何呼叫原子技能的明確指令。

它會比原子技能賦予 Agent 更多的判斷空間,但提供關於何時使用哪種技能的明確指令仍然非常有幫助。

你將盡可能多的組合邏輯推入技能本身,並最小化 Agent 在執行時期的決策需求。

分子技能也應該非常可靠。範例:

  1. 一個結構化的工作流程,將幾個原子技能串聯起來。

使用 atom-1 和 atom-2 尋找潛在客戶 -> 然後使用 atom-3 進行篩選,並使用 atom-4 進行資料豐富化,最後使用 atom-5 將它們加入我的試算表。

  1. 一個知道 5 個原子技能的編排器,它會運用判斷力來組合這些技能以解決 Prompt。

可能還有其他結構。

在這裡,Agent 自然會比使用原子技能時擁有更多的判斷力和自主權,但我們仍然致力於讓事情盡可能明確。

化合物 (COMPOUNDS)

化合物技能是更高層級的編排器,用於執行多個分子技能。

  • 「執行外撥銷售劇本 (outbound sales playbook)」

  • 「規劃並建構此功能,然後進行審查和 QA」

這是你真正賦予 Agent 有意義自主權的層級。

這些技能本質上可能較不具確定性,因為 Agent 可能需要在許多層級上做出判斷。

這些也是最難正確實現的,而且它們可能需要人類來驅動。

是的,人類可能需要驅動這些化合物技能(至少在今天)。

槓桿效應與大腦 RAM

每個層級的槓桿效應都高出一個數量級,所以如果你驅動的是化合物技能而不是原子技能,你可能可以多做 100 倍的工作。

原因如下。

你大腦的 RAM(在記憶體中同時處理多項任務並有效切換上下文的能力)現在實際上是限制資源。

例如,考慮這種情況。

假設你的大腦能夠在最多 5 個 Agent 之間並行切換上下文。

現在假設:

  • 1 個化合物技能編排 10 個分子技能

  • 1 個分子技能編排 10 個原子技能(當然要可靠地執行)

如果你驅動你的 Agent 去做原子級的工作,你只是用低槓桿的工作塞滿了 1 個 RAM 插槽,因為這些工作基本上是確定性的。

當你的車有全自動駕駛功能時,為什麼你還要坐在駕駛座上?

但如果你同時驅動 5 個 Agent 來執行分子或化合物層級的工作,那就是:

  • 5 個化合物任務

  • 50 個分子任務

  • 500 個原子工作單位

並行執行 5 個原子任務與並行執行 5 個化合物任務,所消耗的大腦 RAM 和時間是相似的。

在花費相同的時間和大腦 RAM 的情況下,驅動原子級工作與化合物級工作,工作產出會有巨大的差異。

這與一家擁有 1000 名員工的公司的 CTO 不會親自修復每一個 Bug 的道理是一樣的。他可以信任個人貢獻者 (IC) 可靠地完成這些工作。

瓶頸在哪裡(仍在摸索中)

當然,關鍵在於:

  • 每一個原子技能都必須穩固

  • 分子技能必須能可靠地串聯它們

  • Agent 在化合物層級需要足夠的自主權來做出真正的決策

你的判斷力是在化合物層級(或更高層級)發揮作用。

我還在摸索哪裡會出現瓶頸。

我的猜測是:跨越超過 8-10 個分子技能的化合物技能,開始觸及它們自身的可靠性上限。

在某個時刻,化合物技能將會足夠好,以至於我們需要比這更高的抽象層級。

我還沒遇到那個瓶頸。

我目前仍在驅動分子和化合物技能,即使是這樣,要做到正確也並非易事。

但目標是讓每個工作流程不斷向更高的層級邁進。

我們用這種「原子 / 分子 / 化合物」的結構建立了我們的技能庫,效果相當不錯。

我們稱它們為:

  • 能力 (capabilities)(原子)

  • 複合技能 (composites)(分子)

  • 劇本 (playbooks)(化合物)

到目前為止,運作得相當順利。

最大挑戰

在每個層級上確保技能的可靠性與一致性並非易事,且測試這些技能需要花費大量時間。

我想像自動化研究 (autoresearch) 類型的解決方案或許能解決這個問題,但我還沒針對這個問題嘗試過。希望不久的將來能實現。