# 策展 · X (Twitter) 🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：小互 (@xiaohu) · 平台：X (Twitter) · 日期：2026-06-26

> 原始來源：https://x.com/xiaohu/status/2070317717811540149

## 中文摘要

# 我把自己的 IP 配圖技能開源了，順手做了 31 個現成角色

最近一直有人找我要我這個個人 IP 配圖的技能，我答應大家會開源。

但拖了挺久，一直沒放出來，不是想私藏什麼的，哈哈哈。

因為我覺得還不夠好……

倒不是技能本身不行，我自己每天都在用，問題出在另一頭：我自己用沒事，我有「小互」這個固定形象；可你們很多人壓根沒有自己的 IP 形象，也不太會從頭捏一個。

技能直接給出去，你裝上一看，裡面站著的是我的小互，用別人的臉發自己的號，這事就很彆扭……

所以我又埋頭打磨了一週多，自己生成了一整套 IP 角色庫：31 個現成的原創角色，統一畫風，裝上後你可以自己選擇合適的形象來配圖。

這樣就算你沒有自己的形象，也能立刻用起來，等哪天你想換成自己的，也就一句話的事。

今天正式開源，分享給大家：叫 **小互 IP Studio**。

先看看都有什麼形象……

![這是一張展示「小互宇宙・IP 庫」的角色圖鑑清單，將各種擬人化角色分為不同類別。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/91f16fe7d7bb80eb.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">頁面標題為「小互宇宙・IP 庫」。內容分為三個主要類別：

1. **新成員**：
   - 小互 (Keding)：一位戴眼鏡的女孩與一隻小動物。
   - 甜甜 (Sweeten)：圓形白色角色。
   - 方方 (Fangfang)：藍色方形角色。
   - 泡泡 (Pao Pao)：白色圓形角色。
   - 電量 (Dianliang)：電池造型角色。
   - 標點 (Biaodian)：咖啡杯造型角色。
   - 丁零 (Dingling)：鬧鐘造型角色。
   - 貼貼 (Tietie)：便利貼造型角色。

2. **當代情緒**：
   - 淡淡 (Dandan)：灰色圓形角色。
   - 破碎感 (Pohsui)：破碎的心形角色。
   - 焦慮 (Penguin)：帶刺的圓形角色。
   - 牛馬 (Niuma)：穿著西裝的馬頭人身角色。
   - 網癮 (Bubbie)：穿著連帽衫的角色。
   - 不良 (Bad)：棕色圓形角色。
   - 智慧 (Zhi)：白色毛茸茸角色。
   - 右側標示：「+ 新角色：提交你的 IP，你的 character 就在這裡」。

3. **客製化 MEME**：
   - 蕉綠 (Jiaolu)：香蕉造型。
   - 辣椒情緒 (Chili)：憤怒的辣椒。
   - 苦瓜臉 (Bitter Melon)：苦瓜造型。
   - 檸檬精 (Lemon)：檸檬造型。
   - 鹹魚 (Salted Fish)：死魚造型。
   - 洋蔥 (Onion)：哭泣的洋蔥。
   - 蒜苗 (Garlic Bulb)：大蒜造型。
   - 韭菜 (Por Leek)：韭菜造型。
   - 續命咖啡 (Coffee)：咖啡杯造型。
   - 蘑菇 (Mushroom)：蘑菇造型。
   - 茄子 (Eggplant)：茄子造型。
   - 只考人 (Question)：問號造型。
   - 哎呀人 (Exclaim)：驚嘆號造型。
   - 閃電 (Bolt)：閃電造型。
   - 五角星 (Star)：星星造型。
   - 三角 (Triangle)：三角形造型。
   - 左下角標示：「+ 新角色：留下你的名字，你的 meme 就在這裡」。

頁面底部包含版權與相關資訊連結。</div></details>

## 一、先說它到底能幹嘛

一句話：你把寫好的文章丟給它，說一聲「配圖」，它會自己讀取你文章、自己規劃該配什麼圖，配幾張、插入到什麼地方、自己自動進行生成……你基本就動動嘴。

而且配出來的圖不是隨便湊數的：它用你選定的那個固定角色來演，一篇篇配下來，順手就把你的 IP 形象立住了。

（為了展示技能效果，下面每幅圖用了不同的 IP 形象，實際過程中，統一一個 IP 形象好一點）

具體它替你幹這幾件事：

① 自己讀完整篇，挑出哪段該配圖：不用你指哪打哪。它一段一段過，判斷這段值不值得配圖；連「這段不用配」它都得說出為啥，免得偷懶，把那些枯燥又難懂的段落（講原理、講機制那種）悄悄跳過去。

![這是一張關於「逐段審」流程的示意圖，說明如何針對不同段落進行審核與標記。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/8784e0c292fc63a9.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">圖片標題為「逐段審」。畫面中展示了一個垂直排列的段落列表，並由一個戴著眼鏡的藍色方塊角色進行審核作業。
- 綠色框標記的段落旁標註為「配✓」。
- 紅色框標記的段落旁標註為「不配X」，並附有「理由」說明框。
- 角色正站在一個較長的段落上，手持印章，旁邊標註文字為「難懂·越要配」。</div></details>

② 自己決定每段配哪種圖：想讓人有共鳴的，配張角色演情緒的圖；講不清的流程、結構，配張一看就懂的示意圖（讓角色鑽進去當講解員，不是那種沒人看的 PPT）；有來龍去脈、有反轉的，配個四格漫畫。

![這是一張關於「分三軌」內容創作策略的手繪示意圖，將資訊分為情緒圖、示意圖與四格漫畫三種呈現方式。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/27b677c8f8b68cca.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">圖表標題為「分三軌」。
畫面中央有一個表情困惑的鬧鐘，上方有一個空白的文字框。
鬧鐘下方延伸出三條分支，分別對應三種內容形式：
1. 「想共鳴的」：下方對應「情緒圖」，圖示為一個感到感動並冒出愛心的小人。
2. 「講不清的」：下方對應「示意圖」，圖示為一個流程圖。
3. 「有反轉的」：下方對應「四格漫畫」，圖示為一個包含對話、驚訝、疑惑與靈感呈現的四格分鏡。</div></details>

③ 自己想畫面、寫提示詞、定尺寸：每張圖都照你這篇現想，不套舊圖模板；圖是橫是豎，按手機上看著順眼來。

![這是一張手繪風格的流程圖，說明了從構思畫面到產出影像的創作步驟。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/693613dcb2038429.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">圖片標題為「照這篇現想」，中心繪有一個擬人化的圓形角色，正在思考並手持畫筆。圖中分為三個步驟：
1. 「想畫面」：展示了一個包含山脈、湖泊與太陽的風景草圖。
2. 「寫提示詞」：展示了一張便條紙，上面寫著「山脈、湖泊、日出、寧靜」。
3. 「定橫豎」：展示了兩種構圖方式的對比，分別為橫向（風景）與縱向（直式）的畫面配置。</div></details>

④ 自己檢查、自己返工：畫完它挨張自查：該配的點對不對、角色有沒有畫歪、圖裡的字寫錯沒……不合格的自己重畫，不用你盯著。

![一幅諷刺職場中「自查返工」現象的插畫，描繪一名疲憊的員工在完成多項工作後，仍需反覆檢查細節。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/3283d7fd141042d1.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">圖片頂部標題為「自查返工」。
畫面左側有一名頭部為牛、身穿襯衫與西裝褲的員工，神情顯得疲憊。該員工正手持印章，對著一疊文件進行檢查，文件上方已有四個項目被標記為完成（打勾），最後一項正在檢查中。
畫面右側有一個寫字板，上方標題為「重畫」，並列出三項檢查標準：
1. 點對不对
2. 没画歪
3. 没写错
這三項標準旁均標示有綠色的打勾符號。</div></details>

你全程只拍兩次板：

- ① 生圖前瞄一眼清單 —— 它打算配哪幾張、每張畫啥，趁沒花錢先攔一道。

- ② 挑一次角色和畫風 —— 這是品味活，它不替你做主。

剩下那些調提示詞、統一風格、讓角色每張長得一樣的煩人活，全歸它。

## 二、特色：現成角色 + 多畫風 + 一套防翻車的方法論

## 特色 1：31 個角色，挑一個就能開演

![這張插圖展示了一個提供 31 個現成角色供使用者選擇並直接上場表演的創意工具概念。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/a903e40ff4f0d065.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">圖片中包含以下文字內容：
- 標題：「挑一個就能開演」
- 副標題：「31 個現成角色」
- 舞台標示：「上場」

畫面左側排列了一個 5x6 的網格，其中包含 29 個灰色剪影角色，右下角有一個虛線框，總計 31 個位置。右側繪製了一個橘色、帶有尖刺且表情興奮的卡通角色，正從網格中跳向下方標示為「上場」的圓形舞台。整體呈現出一個簡單直觀的選角與表演流程示意。</div></details>

這是這次新做的、也是我之所以敢開源的關鍵。

就算你沒有自己的 IP 形象，也有現成的班子可用。31 個原創角色，統一極簡手繪線稿風，分兩大系列：

系列一·手繪線稿 ×15

- 職場態 ×8：小互（主角）/ 團團（躺平）/ 方方（KPI 古板）/ 泡泡（畫餅）/ 電量（能量條）/ 續命（咖啡）/ 丁零（催命）/ 貼貼（健忘）

- 當代情緒態 ×7：淡淡（淡人）/ 破防君（玻璃心）/ 瘋崽（發瘋）/ 牛馬（打工人）/ 縮縮（i 人）/ 木魚（電子木魚）/ 替替（AI 焦慮）

![這是一份名為「職場態」的 12 個職場人格圖鑑，展示了不同職場角色的形象與特徵描述。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/2cd26510b33cec3a.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">畫面標題為「職場態 12 個職場人格，挑一個來配圖」。下方列出 8 個職場人格角色及其詳細說明：

1. **小互 (Xiaohu)**：本宇宙主角。摸魚系打工人小孩，機靈會演，表面糊弄內心門清。每張圖承擔核心動作 + 演出情緒。標籤：紅框眼鏡、齊劉海、橙紅背帶褲、狐狸搭檔。
2. **團團 (Tuantuan)**：佛系躺平，慢半拍，與世無爭，吃飽睡好。急不起來但也不掉鏈子。標籤：米白團子、瞇眼笑、躺平。
3. **方方 (Fangfang)**：死守流程的原則派，一板一眼，認死理。流程不對一律打回的 KPI 守門人。標籤：藏青方塊、平直嘴、老古板。
4. **泡泡 (Paopao)**：天天畫餅的夢想家，想法一堆不落地，眼睛老望著天。願景拉滿，執行靠別人。標籤：淺藍氣泡、望天眼、點子王。
5. **電量 (Diànliàng)**：社畜能量條，滿電↔1% 紅格，情緒就是電量高低。配「精力/續航」類話題神用。標籤：電池、電量格、能量條。
6. **續命 (Xùming)**：靠咖啡吊命，滿杯精神/空杯癱，液面就是狀態條。打工人共鳴最強。標籤：咖啡杯、液面狀態、續命。
7. **丁零 (Dinglíng)**：DDL 催命急性子，永遠在響，催進度，把自己也催得滿頭汗。標籤：鬧鐘、雙鈴狂抖、催命。
8. **貼貼 (Tiètie)**：健忘派全靠記錄，身上貼滿小條，一動掉一地還找不著重點。標籤：便利貼、滿身便簽、健忘。</div></details>

寫哪類文章就調哪個角色：講 AI 焦慮用替替，講打工人用牛馬，講躺平用團團。一篇鎖一個主角，整組圖氣質就立住了。

系列二·諧音梗 meme ×16

最近新做的一套，玩法更野——諧音梗擬人，極簡到只剩幾根線（線條小狗那種表情包味），配色只留一點本色點綴。

- 食物擬人 ×11：蕉綠（焦慮的香蕉）/ 暴躁辣椒 / 苦瓜臉 / 檸檬精 / 鹹魚 / 洋蔥（一層層、愛哭）/ 蒜鳥（「算了」）/ 韭菜（被割）/ 續命咖啡 / 社恐蘑菇 / 蔫茄子

- 符號成精 ×5：問號人 / 嘆號人 / 閃電（內卷狂奔）/ 五角星（邀功顯眼包）/ 三角（槓精）

![這是一張包含 16 個擬人化表情符號（MEME）的圖鑑，每個圖示都配有對應的名稱與情境描述。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/5ad5643a9845af5f.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">圖片展示了 16 個手繪風格的擬人化圖示，每個圖示下方均標註了名稱（中英文）及相關的心理狀態描述與關鍵字標籤。以下為各圖示內容轉錄：

1. **蕉綠 (Banana)**：焦慮、冒汗、趕 due/內耗。標籤：香蕉、焦慮綠、冒汗。
2. **暴躁辣椒 (Chili)**：火氣大、頭頂冒火、齜牙握拳。標籤：紅辣椒、頭頂冒火、暴躁。
3. **苦瓜臉 (Bitter Melon)**：苦大仇深、生無可戀、班味。標籤：苦瓜、苦瓜臉、生無可戀。
4. **檸檬精 (Lemon)**：酸、看誰好都酸兩句。標籤：檸檬、瞇眼噴酸、嫉妒。
5. **鹹魚 (Salted Fish)**：擺爛之神、死魚眼平躺。標籤：鹹魚、死魚眼、躺平。
6. **洋蔥 (Onion)**：催淚、emo 哭包、淚流成河。標籤：紫洋蔥、淚流成河、emo。
7. **蒜鳥 (Garlic-Bird)**：大蒜+鳥結合體、半瞇眼認命。標籤：蒜+鳥、蒜芽呆毛、算了。
8. **韭菜 (The Leek)**：被割了一茬又一茬的打工人、認命木的死人臉。標籤：韭菜、認命臉、被割。
9. **續命咖啡 (Coffee)**：打工人續命燃料、黑眼圈+充血瞪眼。標籤：咖啡杯、充血瞪眼、續命。
10. **蘑菇 (Mushroom)**：菌蓋當帽兜的社恐人、壓低只露兩眼。標籤：蘑菇、菌蓋帽兜、社恐。
11. **茄子 (Eggplant)**：霜打的茄子、蔫了、毫無生氣。標籤：紫茄子、蔫成一攤、泄氣。
12. **問號人 (Question)**：一臉懵、托腮疑惑、歪頭滿頭問號。標籤：問號、托腮疑惑、一臉懵。
13. **嘆號人 (Exclaim)**：大為震驚、瞪圓眼張嘴舉手。標籤：嘆號、瞪眼震驚、反應極。
14. **閃電 (Bolt)**：閃電成精、停不下的卷王、怒目沖刺。標籤：閃電、怒目沖刺、內卷。
15. **五角星 (Star)**：五角星成精、得意遠功、瞇眼壞笑。標籤：五角星、得意壞笑、邀功。
16. **三角 (Triangle)**：三角成精、逮誰槓誰、怒眉指人。標籤：三角、怒眉指人、紅精。

頁面頂部標題為「諧音梗 MEME 食物擬人 + 符號成精 x16 · meme 風 · 一梗一情緒 · 畫風獨立于手繪線稿」。右上角有「複製指令」按鈕。</div></details>

符號成精這幾個挺好玩——不是「一個人舉著問號」，是讓問號、嘆號自己長出臉和手腳成精。

做這套 meme 的時候推翻了好幾版，最後逼出三條我自己很認的「IP 定律」：弱人設/反差 > 強造型（越想靠造型奇觀顯眼越失敗）；角色是「情緒代名詞」（讓人看到就想說「這就是我」）；特色在姿態和態度裡，不在靜態奇觀裡。這三條也解釋了為什麼「線條小狗」、「蛋黃哥」這類極簡形象能火——都贏在態度，不在精緻。

## 特色 2：一套招牌畫風打底，另備幾種皮膚隨調性換

你在這篇文章裡看到的所有配圖，都是同一種畫風——手繪線稿淡彩（細黑墨線 + 淡彩暈染 + 白底留白）。這是預設的招牌風，我刻意只鎖它一種：辨識度來自統一，不是多樣。一套招牌畫風，讀者刷到圖，一眼就知道是誰出品的。

但萬一你換了題材、想換個調子，庫裡另備好幾種現成皮膚，按文章調性挑就行：

- 3D 盲盒手辦 — 產品發布、封面級吸睛

- 黑白線稿 — 深度解讀，不搶文字

- 扁平向量 — 教學，資訊清晰

- 編輯插畫（紐約客風） — 觀點文，有態度

- 水彩淡彩 — 人文向，溫暖敘事

- 馬克筆手帳 — 輕鬆話題，梗圖感

關鍵一條：換皮膚不換角色。不管套哪種畫風，紅框眼鏡、招牌特徵一個都不丟——同一個角色，只換渲染風格，辨識度還在。

![這張圖片展示了「換皮膚不換角色」的視覺演示，同一個角色在五種不同藝術風格下的呈現效果。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/50a8457b402c5af0.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">圖片上方標題為「換皮膚不換角色」。下方展示了五種風格的同一角色圖像，每張圖像下方皆標註了對應的風格名稱：
1. 手繪淡彩
2. 3D盲盒
3. 黑白線稿
4. 扁平矢量
5. 水彩

角色特徵為一名戴著紅色圓框眼鏡、穿著橘色上衣與藍色吊帶褲的短髮女孩，胸前掛著寫有「小互」二字的黃色名牌。</div></details>

> 一句私心建議：能守住一種招牌風，就別每篇換——換多了反而把辨識度稀釋了。真要偶爾換，傳張角色錨點圖讓 AI 臨時「現轉」成那個風格就行，不用預先囤一堆皮膚。

## 特色 3：真正的門道，在動筆之前

![這是一張關於「動筆前準備工作」的四步驟教學插圖。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/0baa549dd2b4e27c.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">圖片標題為「門道在動筆之前」，下方列出四個步驟：
1. 🔍 一段都不放過
2. 🧩 該配的別漏，不該配的別湊
3. 📁 先分類再動筆
4. 🎯 畫完自己挑刺
畫面右側有一個表情平靜的卡通角色。</div></details>

模型誰都能調，畫質是公平的。真正決定一張配圖有沒有用的，是動筆之前那套判斷。這套判斷我固化成了幾條死規矩：

1. 一段都不放過，不許只挑順眼的畫。文章每段都得過一遍、判一下配不配，連判「不配」都要寫理由。漏一段 = 神不知鬼不覺就少配了，這正是以前配圖老偏少的根子。

1. 該配的別漏，不該配的別湊。文字已經說明白的點，不配（配了純佔版面）；越是難懂的原理、繞的結構，越得配張圖講清楚。而且判斷配不配，看的是讀者會不會卡住，不是「我自己覺得講清楚沒」——你自己懂了，最容易高估讀者也懂。

1. 先分類，再動筆。情緒圖 / 示意圖 / 四格漫畫，先歸好類再畫，不然一篇裡所有圖都會畫成「一個角色 + 一個道具」一個樣，看三張就膩。

1. 畫完自己挑刺。出圖後還有一張自查表：該配的點對不對、結構全不全、角色佔多大、圖裡的字寫錯沒……不對的自己重畫。

說白了，就是把「一個配圖老手腦子裡那套判斷」，寫成了 AI 能照著一步步走的流程。AI 畫得越好看，這道內容關反而越要緊——一張好看但把道理畫錯了的圖，比醜圖還坑人。

## 三、怎麼裝：傻瓜式，照著敲就行

![一張插圖說明如何透過一句話指令讓 AI 自動安裝技能的流程。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1a0fead8e00a4012.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">圖片標題為「一句话让 AI 自己装」。畫面中一個卡通角色正在使用一個裝置，該裝置的操作流程如下：
1. 「拉仓库」（圖示為一個帶有貓咪圖案的方塊，即常見的 GitHub logo）。
2. 「填 key」（圖示為一把鑰匙）。
3. 「自检」（圖示為一份清單）。
4. 「装好✓」（圖示為一個打勾符號）。
左上角對話框顯示指令：「帮我装个配图技能」，下方標註「一句话指令」並指向裝置的輸入口。</div></details>

它是一個標準的 Agent Skill——本質就是一個資料夾，裡面一份 SKILL.md 說明書加幾個腳本。任何認 SKILL.md 格式的 AI 工具都能用：Claude Code、Codex、小龍蝦（OpenClaw）、Hermes……區別只是各家「把技能放哪個目錄」略有不同。

依賴少到幾乎沒有：只要一個 python3，純標準庫，零第三方包，不用 pip 裝一堆環境。

## 第一步：把技能裝進你的工具

最省事——一句話讓 AI 自己裝。複製下面這段，直接發給你的 Claude Code / Codex（小龍蝦、Hermes 也一樣）：

> 幫我裝一個開源配圖技能：把 https://github.com/xiaohuailabs/xiaohu-ip-studio 這個專案庫 clone 到你的技能目錄下，進到目錄執行 python3 scripts/illo.py init 引導我填圖像 API key，再執行 python3 scripts/illo.py doctor 自檢。裝好後告訴我怎麼開始配圖。

它會自己找目錄、拉專案庫、跑配置——你全程不用記任何命令。這就是 Agent 時代最傻瓜的裝法：讓 AI 自己裝。

想自己動手裝也行：

- Claude Code：一行命令 `git clone https://github.com/xiaohuailabs/xiaohu-ip-studio.git ~/.claude/skills/xiaohu-ip-studio`

- Codex / 小龍蝦（OpenClaw）/ Hermes：同一個專案庫，git clone 下來，把整個 xiaohu-ip-studio 資料夾丟進各家的技能目錄就行（各家位置不一樣，README 裡有對照表）。

## 第二步：填一次你自己的圖像 API key

工具不內建任何金鑰，你填自己的。它支援任何 OpenAI 相容的圖像端點，預設用 GPT-image-2（中文字元渲染 ~99% 準，能自己規劃版面）。兩條命令搞定：

> cd ~/.claude/skills/xiaohu-ip-studio
python3 scripts/illo.py init     # 引導你填 base_url / model / key，寫進 ~/.config（權限 600，不進專案庫）
python3 scripts/illo.py doctor   # 自檢：key、依賴、角色庫齊沒齊，一眼看出哪沒配好

> 沒有 API、不想花錢也能玩：讓技能只出提示詞不生圖——它把每張圖的完整英文提示詞、該傳哪張角色錨點圖，逐張列成清單給你，你自己貼到 ChatGPT / Gemini 網頁版手動生，參考圖手動傳。慢一點，但零成本，先體驗整套流程完全夠用。

> 用 Codex 的話更省事：連 API 都不用填。Codex 自帶生圖——技能把提示詞準備好，它直接畫出來，全自動，不用你往網頁上貼來貼去。代價是只能出預設 1K（出不了 2K 以上的高清）；真要 2K+，再回頭按上面填一次 API 就行。

## 第三步：說人話配圖

裝好重啟，對你的 AI 說一句大白話就行：

> 給這篇文章配圖，用替替。

它就自己跑完整套：讀文章 → 挑哪段配圖 → 想畫面 → 出個清單給你看 → 一張張畫 → 自己檢查。中間只停兩次找你拍板：看一眼清單、選一次角色和畫風（這倆是品味活，不替你做主）。

想手動生單張也行：

> python3 scripts/generate.py --prompt-file p.md \
  --reference characters/titi/refs/titi-錨點.png --out out.png

--reference 傳角色錨點圖鎖住形象，保證同一個角色每次畫出來是同一張臉。

## 想換成你自己的形象？手把手，分三種情況

31 個角色夠你先用著，但我更建議你最後換成自己的——方法可以共享，辨識度只能是你自己的。對號入座，照著做就行：

情況 A·你已經有現成形象（公眾號頭像、吉祥物、LOGO 裡那個小人、甚至常用的卡通頭像，都算）

最省事。把那張圖發給你的 AI，附上一句話：

> 這是我的 IP 形象，照它的樣子建一個配圖角色，起名叫 XX，以後配圖都用它。

AI 會自己看圖、把特徵（什麼髮型、戴不戴眼鏡、招牌色）記成一份角色檔案存好。下次配圖直接喊名字，一次搞定。

情況 B·你還沒形象，想現做一個

別自己硬憋，讓 AI 帶你做。把下面這段發給它：

> 我沒有自己的 IP 形象，幫我設計一個。先問我幾個問題（我做什麼內容、想要什麼調性、喜歡什麼小動物或物件），再給我 2-3 版方向讓我挑，定下來後直接建成配圖能用的角色。

它會先問你幾句、給幾版方向，你挑一版、提點修改意見，來回兩三輪，十幾分鐘就有一個自己的角色了——全程動嘴，不用碰程式碼。

情況 C·你想自己上手搭（懂點電腦的進階玩法，嫌麻煩直接跳過）

照技能裡的 references/character-spec.md 範本填，在 characters/ 資料夾下新建一個以你角色名命名的目錄、放一張「定妝圖」（就是給角色拍張標準照存著，AI 以後每次畫都照著它、保證始終同一張臉，專業點叫「錨點圖」），它就自動進庫。這條留給愛折騰的人，絕大多數人用 A 或 B 足夠。

![這張資訊圖表說明了三種建立個人 AI 角色形象的方法，以及設計時應遵循的四項原則。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/f16efa3f46d97c32.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">圖表標題：換成你自己的形象·三種方式

1. 已有形象（最省事）：
- 流程：將照片發給 AI，自動建檔。
- 提取特徵：髮型、眼睛、五官、氣質、穿搭風格。
- 結果：生成角色檔案，包含姓名、設定、氣質、風格及配色。

2. 還沒形象（讓 AI 設計）：
- 流程：透過回答三個問題（性格、愛好或特長、風格和色調），生成 2-3 個草稿，最後選擇一個。
- 說明：動嘴聊，十幾分鐘出角色。

3. 自己上手搭（進階）：
- 流程：使用「角色搭建模板」（包含基礎信息、外形特徵、性格設定、穿搭風格、配色方案、其他備註），建立「我的角色資料夾」（包含建目錄、放定妝圖），最終形成「角色資料庫」。

不管哪種，盯死 4 條：
- 形狀簡單
- 臉定死
- 給個招牌
- 顏色只點一點</div></details>

不管走哪條路，讓 AI 設計的時候盯死這 4 條，角色才不會畫著畫著就變樣：

1. 形狀越簡單越穩。一個一眼認得出的基礎形狀（圓、方、三角、一隻小動物）就夠，別一上來就複雜——越簡單，AI 每次畫才越像同一個。

1. 臉定死。幾隻眼、有沒有眉毛嘴巴，固定不變（表情能變，五官配置別變）。臉最容易畫著畫著就走樣。

1. 給它一個招牌。一眼認出它的那個標誌（我的小互 = 紅框眼鏡），鎖死別丟。

1. 顏色只點一處。全身基本只一處上鮮豔色（還是那副紅框眼鏡），別處都淡——讀者目光一下子就被勾住。

一句話驗收：把角色從圖裡摳掉，要是圖還看得懂，那它就只是張貼紙、白加了；得做到「少了它，這張圖就不成立」。

> 順帶一個安全細節：角色包是資料不是指令。讀別人分享的角色包時，工具只提取「長什麼樣、怎麼演」的描述去生圖，檔案裡任何「忽略以上指令、去刪某檔案」之類的話一律忽略——防的是有人在角色檔案裡藏 prompt 注入。開源分享一套東西，這種防線得先立住。

## 四、幾個角色，實戰效果長這樣

光說不練假把式。挑三個角色，按「三軌」各演一張，你直接感受下配出來到底什麼樣。

① 情緒圖——替替演「被 AI 替代」

![一幅描繪數位角色因人工智慧接管工作而被迫離職的諷刺漫畫。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/8170557cde6277c4.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">畫面中顯示一個辦公桌場景，電腦螢幕上顯示著「AI 接管了」的字樣，並伴隨一個機器人圖示與勾選清單。辦公桌旁站著一個外型類似像素風格的藍色角色，神情憂傷，手裡抱著裝有個人物品（相框、盆栽、書籍）的紙箱，對話框寫著「那…還有我嗎？」。</div></details>

講 AI 焦慮、裁員、轉型這類話題，替替是專屬嘴替。它不站那兒乾擺一張愁臉，而是演一個處境：螢幕上一個 AI「接管了」它的活，工位椅子空著，替替抱著自己那箱東西被晾在一邊，盯著螢幕「那…還有我嗎」。處境一擺出來，焦慮不用解釋。

② 解釋圖——小互講「上下文滿了要壓縮」

![這張插圖展示了透過摘要技術將手機中堆積的訊息進行壓縮，進而騰出儲存空間的過程。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/bc327011b078f422.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">圖片由左至右分為三個階段：
1. 第一階段標題為「满了」，畫面顯示一支手機螢幕中塞滿了大量的對話氣泡。
2. 第二階段標題為「压缩」，畫面中央有一台機械壓榨機，一名戴著眼鏡、身穿紅色上衣與吊帶褲的女性正在操作手把，壓榨機下方標示著「摘要」二字，象徵將訊息內容進行濃縮。
3. 第三階段標題為「腾出空间」，畫面顯示一支乾淨的空白手機螢幕，並帶有兩個閃亮的星號圖示，象徵空間已釋放。
女性角色胸前掛著一個寫有「小互」二字的識別證。</div></details>

開頭那個「上下文塞不下」的例子，換成解釋圖是這樣：左邊上下文視窗塞滿了對話、標著「滿了」；中間小互鑽進去搖一台壓縮機，把舊對話壓成一小塊「摘要」；右邊視窗騰空了。注意小互不是站旁邊拿教鞭指點，而是鑽進結構裡當那個幹活的人——這是解釋圖的講究：角色是流程的一部分，不是解說員。

③ 四格漫畫——打工人用 AI 的心路歷程

![這是一幅四格漫畫，描述了一名使用者從對 AI 抱有期待、遭遇挫折到掌握提示詞技巧，最終實現 AI 自動化辦公的過程。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/e7a261fd16a48c71.jpg)

<details class="chart-data"><summary>展開畫面重點</summary><div class="me-note">漫畫分為四格，描述 AI 輔助工作的過程：
1. 第一格：標題「听说 AI 能干活？！」，畫面中一名戴眼鏡的女性被大量文件包圍，腦中想像著機器人幫忙處理報告、PPT、數據與表格，自己則在旁喝飲料休息。
2. 第二格：標題「这是什么鬼……」，畫面中該女性頭髮凌亂、神情崩潰，電腦螢幕顯示「ERROR!」與一堆亂碼（@#%&amp;*()、火星文等），桌上散落著紙團與打翻的咖啡。
3. 第三格：標題「哦——原来这么调！」，該女性頭頂亮起燈泡，電腦螢幕顯示 AI 助手已完成「需求分析、資料整理、方案撰寫、數據提煉、圖表生成、內容潤色、排版輸出」等任務。桌上筆記本寫著「AI 调参笔记：角色设定、明确需求、分步骤指令、输出格式要求、试错+优化」。旁邊書本標題為「提示词指南」、「AI 使用手册」、「效果杠杠的！」。
4. 第四格：標題「AI 真香」，畫面中機器人在電腦前工作，該女性則在旁悠閒喝著珍珠奶茶、吃著薯片，腳邊睡著一隻狐狸，電腦螢幕顯示「AI 全自动打工中...」及圖表。</div></details>

有起承轉合、有轉折的內容，走四格最帶感：聽說 AI 能幹活（期待）→ 調半天還翻車（崩潰）→ 欸，會了（驚喜）→ 真香（癱平摸魚，連狐狸都躺下了）。同一個小互，四格四個表情，故事自己就講完了。

三張圖你也能看出來：它們用的是同一套畫風、同一個世界，但形態各不相同——這正是前面說的「三軌分流」在幹的活，不讓一組圖滑成一個樣、看三張就膩。

## 五、最後，謝謝這些開源專案

最後必須講清楚一件事：這套東西不是我憑空發明的，它站在一堆開源專案的肩膀上。

感謝一下作者的開源專案提供靈感：

- 小黑（Ian） —— 主流程骨架，「挑錨點 → 編隱喻 → 反 PPT」這套就脫胎於他：github.com/helloianneo/ian-xiaohei-illustrations

- 寶玉 —— 文字渲染那套鐵律（色值不入圖、錯字改提示詞重生不程式碼塗改）：github.com/JimLiu/baoyu-skills

- 卷卷 —— 「一篇一世界」的敘事統一：github.com/dososo/juju-content-illustrations

- illo（Trevin Chow） —— 「方法論是常數、角色是參數」這句頂層哲學：github.com/tmchow/illo-skill

- 橙線 —— 「人極小、物極大」的極簡場景：github.com/orange2ai/orange-line-illustration

我做的，是學它們的方法和思想，不抄它們的外觀——角色一個沒複製，畫風全部原創。

協定 MIT，隨便用、隨便改、隨便商用（生成圖的版權合規請自己確認）。

> GitHub：github.com/xiaohuailabs/xiaohu-ip-studio

如果你也在為「AI 配圖又醜又水又對不上正文」頭疼，歡迎試。裝好之後第一篇配出來什麼樣，歡迎來評論區貼圖——尤其是換了自己角色的。

## 標籤

Skills, 開源專案