# 策展 · X (Twitter) 🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Contra Labs (@contralabs_ai) · 平台：X (Twitter) · 日期：2026-05-22

> 原始來源：https://x.com/contralabs_ai/status/2057499790825463947

## 中文摘要

# 在 Claude Design 中，你的開場 Prompt 決定了上限。

我們追蹤了五位專業設計師在 @AnthropicAI 的 Claude Design 中，針對同一個奢華登陸頁面（landing-page）專案所輸入的每一個 Prompt。所有工作階段的數據都指向同一個方向：第一個 Prompt 的重要性遠高於後續的十五個。

我們關於 Claude Design 的第一篇文章測試了輸出結果。該工具能快速產出初稿，但當設計師試圖進一步優化時，它就開始卡關。版面、色彩和字體是持續出現的失敗點，設計師最終只能在 @claudeai 完成 40% 的工作，剩下的部分則轉移到 @figma 處理。

這篇文章將從「輸出」轉向探討「輸入」。我們將每一個 Prompt 進行結構與意圖編碼。接下來你將看到：五種不同的開場如何產生五種不同的上限、退化現象從何時開始，以及為什麼有一位設計師寫了十六個 Prompt，最後的成果卻比剛開始時更糟。

## 第一個 Prompt

每個工作階段都會來到一個節點：設計系統已經建立、元件已經生成，而設計師必須在一個尚未存在的頁面上輸入第一個指令。此時工具已經具備了背景資訊：品牌、色盤，以及設計師剛核准的元件庫。簡報、參考圖片和靈感素材也都隨侍在側。設計師輸入的內容，就是疊加在這些基礎之上的第一個指令。以下是其中一位設計師的開場方式：

> 你是一位世界級的資深設計師與願景架構師。請為一個名為「Aetheon」的超奢華沙漠度假村建立一個完整的登陸頁面。專案概述：Aetheon 是一個充滿願景的超奢華沙漠度假村概念。將紀念碑式的極簡建築與沙漠景觀原始、未受破壞的美感相結合，Aetheon 提供了一個專屬的避風港，強調隱私、健康與客製化的探索。作為一個全新的旅宿品牌，你將協助我們定義品牌對世界的數位初次亮相。目標：你的目標是設計一個高擬真的預熱登陸頁面。主要目標是讓使用者沉浸在「Aetheon」的氛圍中，傳達寧靜、獨特性與建築的宏偉感，同時獲取潛在賓客的諮詢與候補名單註冊。頁面應平衡具感染力的視覺敘事、精緻的字體排版與頂級的使用者體驗。目標受眾：人口統計：超高淨值人士、奢華旅遊者與富裕伴侶（30-65 歲以上），追求極致隱私，高度重視建築設計與美學，優先考慮健康與修復體驗，習慣無摩擦、個人化的服務。痛點：高壓生活方式帶來的倦怠感，渴望在不犧牲極致舒適的前提下進行深度斷網。

形狀決定了故事的走向。這個開場同時做了兩件事：既是一份設定背景、受眾與美學的簡報，也是一道明確指出要建立什麼、使用什麼互動方式以及避免什麼的指令。這種混合型態是五位設計師中最具體的一個。這是設計師用來開啟工作階段的四種形態之一，而這些形態的差異正是故事的起點。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1779412636419-iaHIyoJz8a0AEotHpjpg.jpg)

## 五種開場方式

上述的 Aetheon Prompt 屬於參與者 5，是一種「簡報後接指令」的混合型，長度為 263 個字。我們以 0 到 1 的量表為每個開場的具體程度評分：即 Prompt 中固定了多少具體的設計決策，又留下了多少給工具發揮。參與者 5 的開場得分為 0.75，是五人中最高的，也是唯一一個明確指定了設計師剛核准的設計系統中視覺數值的開場。參與者 4 寫的內容也差不多，有 242 個字，組織成一份完整的設計簡報，包含了代理商文件中會有的所有類別：角色、概述、目標、受眾、區塊、視覺系統、互動、美學與限制。參與者 3 將範圍縮減了一半：161 個字，採用「背景-行動」框架，包含專案、受眾、痛點與創作指令，但沒有視覺或互動的細節。另外兩個開場則完全不像簡報。參與者 2 只寫了十二個字：一個單一的修正指令，要求工具替換螢幕上現有的 asset。參與者 1 只寫了一個詞，作為一種肯定：極簡確認，接受工具產出的內容並繼續進行。

設計師選擇包含什麼，比他們寫得有多具體更能說明問題。每個人都以某種形式包含了專案簡報或任務指令。大多數人提到了目標受眾與目標。但在這五個開場中，只有參與者 5 指定了視覺數值（明確引用了他們剛建立的設計系統）。其餘的人都假設工具會自動帶入該系統。五人中沒有人在第一個 Prompt 中提供 Hex 色碼或像素數值，也沒有人要求特定的輸出格式。最一致的缺口，即使是在最詳盡的簡報中，也與我們在第一篇文章中從另一端觀察到的相同：要求工具產出精確度，卻沒有給予任何具體的細節。

開場是設計師分歧最明顯的地方，但這種分歧並未止步於第一個 Prompt。在整個工作階段中，設計師要求工具執行的動作組合也同樣大相徑庭。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1779412636364-diaHIyoCURb0AAMMvpng.png)

這五個 Prompt 類別描述了設計師在任何給定回合中採取的行動類型：

- **Scaffolding（鷹架）**：建立新事物。（「建立一個名為 Aetheon 的完整登陸頁面……」）

- **Additive（增補）**：在現有基礎上增加內容。（「在圖庫下方增加一個見證區塊。」）

- **Refinement（優化）**：進行調整。（「將首頁區塊的垂直間距增加約三分之一。」）

- **Corrective（修正）**：修復損壞的部分。（「頁尾在上次變更後遺失了系統配色——請將其恢復。」）

- **Meta（後設）**：要求工具退後一步重新思考。（「忘掉目前的版面，根據簡報重新思考頁面結構。」）

沒有兩位設計師使用相同的組合。參與者 4 寫了第二詳盡的開場，但幾乎完全停留在「優化」階段，用了五個 Prompt 來調整工具產出的內容。參與者 5（Aetheon 設計師）則將工作階段分散在每個類別中，並有明顯的「修正」型 Prompt 叢集。參與者 1（極簡確認開場）從未寫過任何「優化」指令；他們的工作階段僅由少數幾個「修正」與「鷹架」動作組成。參與者 2 做了一次修正後就停止了。

在這些差異中，有兩個模式是共通的。整體而言，「優化」是最常見的類別，五位設計師總共用了十四個。「修正」居次，共十一個。這兩者加起來約佔了所有人輸入內容的三分之二。

相比之下，「鷹架」幾乎完全是第一個 Prompt 的行為。只有一位設計師在開場之外寫過「鷹架」類型的 Prompt。對於大多數設計師來說，第一個 Prompt 是他們唯一一次退後一步進行架構規劃的機會；在那之後，他們都在調整與修復工具回傳的結果。

## 開場做得好有幫助嗎？

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1779412636671-diaHIyn7OLaEAAScFjpg.jpg)

兩位開場最強勢的設計師（參與者 4 的「完整設計簡報」與參與者 5 的「簡報後接指令」混合型）達成了最接近完成的成果，分別是 Mockup 與生產就緒狀態。「極簡確認」的開場則停留在腦力激盪階段。「迭代式 Asset 替換」的開場雖然只有十二個字，但透過處理工具已產出的內容而非從頭重建，最終也達到了 Mockup 的水準。

這個模式具有方向性。開場的結構越完整，與產出越接近完成品呈現正相關，只有一個例外。參與者 3 以真正的「鷹架」Prompt 開場（具體程度中等，是一個紮實的「背景-行動」框架），最後卻停留在腦力激盪階段，與那位只寫了一個詞的設計師結果相同。這種對比在作品本身中顯而易見。

## 證明這一點的工作階段

參與者 3 是我們進行過最具參考價值的工作階段。其開場預示著至少能達到 Mockup 或更好的水準，但最終卻停留在腦力激盪。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1779412636833-iaHIynzwybQAAxjNqjpg.jpg)

在整個過程中，參與者 3 寫了十六個 Prompt，是其他設計師的三倍以上。他們不斷嘗試，且隨著時間推移變得越來越具體。到了工作階段中期，他們的平均 Prompt 精確度甚至高於開場。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1779412636432-iaHIyns5qboAAnnvKjpg.jpg)

紅線代表輸出品質，在每次迭代中以 -1 到 +1 的量表評分。在十六個 Prompt 中，有十二個的評分低於零。最高峰是在第四次迭代時的一次「優化」，剛好超過 +0.2。最低谷是第二個 Prompt，那是一個要求工具退後重新思考的「後設」Prompt，導致品質降至 -0.7。工具將其視為捨棄指令：開場 Prompt 中的結構因此遺失，工作階段再也沒能完全恢復。後續的每一次「修正」都是在試圖奪回前一個 Prompt 還存在的地盤。

看看底部的 Prompt 角色標籤。十六個 Prompt 中有八個是「修正」。這位設計師一半的工作時間都花在告訴工具修復它自己弄壞的東西。剩下的部分大多是「優化」。最後唯一產生正面品質分數的 Prompt 是兩個「增補」。這些是在工作階段後期，在結構之爭已經失敗後才進行的小幅累加。

這就是第一篇文章中提到的退化故事，在單一工作階段的解析度下觀察到的結果。參與者 3 持續進行了十六輪，精確度不斷攀升，但品質分數直到最後兩個 Prompt 才回到正值，而此時作品早已偏離了原始簡報。

開場 Prompt 設定了上限。後續的動作則決定了這個上限能否維持。在參與者 3 的工作階段中，它沒能維持住。

## 結論

開場 Prompt 是 Claude Design 工作階段中最關鍵的動作。兩位以結構化簡報開場的設計師達成了最接近完成的輸出；而以一個詞開場的設計師則停留在腦力激盪。這種相關性非常明顯。

但開場的結構無法單靠自身撐過迭代過程。「優化」與「修正」類型的 Prompt 佔了設計師輸入內容的三分之二，即使設計師不斷嘗試，工作階段仍透過這些動作發生退化。參與者 3 寫了十六個 Prompt，隨著時間推移變得更具體，最後的成果卻比剛開始時更糟。

有三個模式值得在未來參考：

- **在開場時指定視覺數值，即使設計系統已經建立。** 只有一位設計師這樣做，而他也是唯一達到「生產就緒」的人。你核准的系統並非工具能自動讀取的背景資訊。

- **謹慎使用「後設」Prompt。** 研究中品質下降幅度最大的一次，就來自於要求工具退後一步的 Prompt。將「重新思考」視為一種「捨棄」請求。

- **「鷹架」屬於開場。** 除了開場之外，幾乎沒有設計師寫過「鷹架」類型的 Prompt。在第一個動作之後，工作階段就變成了優化與修正的遊戲。請務必據此規劃。

目前懸而未決的問題是，我們觀察到的退化現象究竟是工具的特性，還是設計師學習如何對其下 Prompt 的方式所致。進行第二輪測試，由相同的設計師針對不同的簡報進行操作，將有助於回答這個問題。

---

## 方法論

五位設計師各進行了一次 Claude Design 工作階段，針對同一個客戶簡報：為一個名為 Aetheon 的虛構超奢華沙漠度假村設計登陸頁面。每位設計師在開始前都收到了簡報、參考圖片與候選色盤。他們依照 Claude Design 的標準流程（輸入品牌名稱、上傳靈感素材、生成設計系統，並審核 Claude Design 產出的元件）進行操作，然後才針對頁面本身寫下第一個 Prompt。工作階段使用 Contra Labs 的工作階段捕捉工具 Rollout 進行端到端錄製。Rollout 記錄了螢幕、影片、音訊、滑鼠軌跡、點擊與鍵盤輸入，包括設計師在 Claude Design 內外所做的一切。我們收集了每個工作階段的所有 Prompt，並使用 OpenAI 的 gpt-4o 模型，應用固定的評分標準，對每個 Prompt 的結構與角色進行編碼。第一個 Prompt 被分為五種結構形態：極簡確認、迭代式 Asset 替換、背景-行動框架、完整設計簡報，以及簡報後接指令混合型。工作階段中的所有 Prompt 都被歸類為五種意圖類別：鷹架（建立新事物）、增補（增加內容）、優化（調整）、修正（修復損壞）與後設（退後重新思考）。每位設計師的最終輸出由本人根據四點量表進行設計就緒度自評：重啟、腦力激盪、Mockup 與生產就緒。

## 限制

回饋意見是由產出作品的設計師本人自評，帶有常見的自我評估偏差。樣本數較小，我們將這些發現視為具有方向性的參考。僅測試了一份簡報，因此簡報特定的影響無法與工具的一般行為完全區隔開來。然而，這些模式在不同設計師與不同編輯輪次中，都呈現出相同的方向：強大的系統級開場，但在迭代過程中缺乏精確的執行力。

---

Contra Labs 發布客製化戰役與深度研究，皆由創意智慧網路提供支援。更多資訊請見 contralabs.com/research。

## 標籤

Skills, AIGC, Figma, Anthropic, Claude, Figma
