我用更實用的工具取代了 Karpathy 的 LLM Wiki
我用更實用的工具取代了 Karpathy 的 LLM Wiki
在關於 LLM Wiki 最熱門的影片下方,有一則獲得最多讚的留言說:「對大多數人來說,這基本上毫無價值。」
我想知道他說得對不對。⌕ 我的目標是改善我的決策能力。我非常喜歡 Ray Dalio,也讀過他的《原則 (Principles)》一書。因此,我使用了相同的資料來源、設定相同的目標,並同時並行地建構了 Wiki 和我自己的系統。

以下是發生的情況。
Karpathy 的 Wiki 架構
@karpathy 的 Wiki 包含三個部分。你的原始資料來源是 YouTube 字幕、文章和 PDF。Wiki 本身是一個讓 Claude 讀取每個來源、撰寫摘要,並將人物與概念提取到頁面中的地方。一個 schema 檔案會告訴 Claude 這個 Wiki 是如何組織的,這樣當你提問時,它才知道要去哪裡搜尋。
有了這些索引檔案和實體頁面,你可以輕鬆地查詢 Wiki 並在圖譜上進行導航。

Wiki 的缺陷所在
我並行地將 19 個來源匯入到 Wiki 中,大約花了 20 分鐘。接著我對它提出了 10 個問題。
Claude 必須閱讀所有的字幕。索引並沒有發揮作用,Claude 為了回答一個問題,必須讀取完整的檔案。每個問題消耗 44,000 個 token,10 個問題乘以這個數字,消耗量相當驚人。
我的額度限制直接爆表,成本高到嚇人。
將其與 @NotebookLM 進行比較。我加入了 50 個來源,因為匯入是即時完成的。NotebookLM 的匯入只是 embedding(嵌入)。他們使用最先進的 embedding 模型,就像 Google 擁有的那些模型一樣。你根本不需要進行這種匯入步驟,隨時都可以直接提問。你不需要建構整個 Wiki 索引。
同樣的 10 個問題,每個回答大約只需一分鐘。這 10 個答案全部都有指向原始字幕的引用。
那又怎樣?
我們擁有了所有這些知識,然後呢?你建立了一個 Wiki,有了摘要,有了索引。接下來會發生什麼?你真的有運用這些知識嗎?

這個 Wiki 與現實世界沒有任何整合。你頂多只能對它提問,僅此而已。
我改採用的做法
我的目標是改善我的決策能力。我針對這個目標提問,提取其中的概念,然後提升我的技能。

分為三個步驟:
⚡ 從這些知識中創造技能。
↻ 將這些技能整合到你的日常慣例中。
▸ 在慣例中執行這些新技能。
一個很好的例子是晨間慣例,你可以將決策框架整合到你分配時間的方式中。
我根據 Dalio 的 5 步驟流程建立了一項決策技能:
◎ 明確你的目標。
⚠ 不要容忍問題。
⌕ 診斷根本原因。
◈ 設計計畫。
▸ 執行計畫。
我增加了一個包含反思提示的每日模板,以及一個每週回顧區塊,詢問:「這週有重複出現的問題嗎?它們和我們上週遇到的問題是同一類型的嗎?」

每當我需要做決定時,這項技能就在手邊。我是在應用這些知識,而不僅僅是儲存它們。
更多筆記本
我進行了更多測試並建立了更多筆記本。以下是我收集的一些範例。

舉個例子:我將過去兩週關於 Hermes Agent、OpenClaw 和 Claude Code 頻道的影片匯入到一個筆記本中,共 21 個來源。我問了很多問題,並得到了基於 YouTube 影片內容以及人們實際使用情況的精彩回答。
這正是它真正擅長的地方。我可以在不偏頗於單一 YouTube 影片的情況下掌握資訊。只看一部影片只會讓我得到一個人的觀點。將 21 部影片匯入筆記本能讓我快速進入狀況,並減少那種錯失恐懼感 (FOMO)。這幫助我保持冷靜。
這是我問的一個問題範例:「為什麼 @AnthropicAI 要禁止訂閱?」答案非常棒,並且基於所有影片內容。

如果我走 Wiki 那條路,Claude 每次回答問題時都必須重新讀取所有字幕。這實在太慢了,你無法等待。透過將整合工作外包給 NotebookLM,你消耗的 token 只是原本的一小部分。
而且免費 token 的時代已經結束了,我感覺到了。在一月時,Anthropic 的 token 是無限的,很難達到每週上限。現在限制正在收緊。LLM Wiki 的方法成本非常高且速度非常慢。
Wiki 真正發光發熱的地方
我相信 Wiki 在你需要進行非常、非常深入的研究時會發光發熱。例如博士等級的研究,或是需要長期維護的專案。你需要極高的準確性,並且願意花 30 分鐘來匯入一個來源。
團隊 Wiki 我認為會是一個很好的應用場景。競爭對手分析絕對更適合用這種方式。Claude 可以讀取所有這些檔案並提供更好的回應,因為它能存取所有原始資料。
對於個人知識管理,如果只是想學習某個主題,我覺得這有點殺雞用牛刀。我不可能為每個主題都花一小時來設定一個 Wiki。我每天能消耗的 token 有限。目前 token 是有補貼的,所以你感覺不到太大的成本。如果你嘗試透過 API 使用它,你絕對不會想用 LLM Wiki 的方式。這根本行不通。
使用 NotebookLM,你不需要進行維護,也不需要進行處理。來源保持原始狀態。你提出問題,就能得到答案。

試試看
打開 NotebookLM。請 Claude 幫你找出關於你主題的影片和文章。它會將它們加入到筆記本中。然後提出你的問題並獲得答案。就這麼簡單!
我建立了一個 NotebookLM 技能來為你完成這件事:notebooklm-skill-artemzhutov.netlify.app
