# 策展 · X (Twitter) 🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Reve (@reve) · 平台：X (Twitter) · 日期：2026-06-04

> 原始來源：https://x.com/reve/status/2062260665121919101

## 中文摘要

Reve 2.0 透過將影像表示為可編輯的程式碼，實現了全球首款支援精準佈局控制的 4K 影像生成模型。

Reve 團隊於 2026 年 6 月 3 日正式推出 Reve 2.0，這是一款強調「影像即程式碼」概念的生成式 AI 模型。該模型透過將影像拆解為具備層級結構的佈局（Layout），讓使用者能對影像中的每個區域與元素進行精確的定址、編輯與操控，而非僅依賴模糊的文字提示詞（Prompt）。

**核心技術架構**
Reve 2.0 的設計理念在於將「規劃」與「渲染」分離，其關鍵技術特點包括：
- **程式碼化表示**：影像被視為一種結構化的程式碼，類似 HTML 或 SVG 對於網頁的定義，使影像成為可被 Agent 理解、推理與直接操作的物件。
- **原生 4K 解析度**：模型直接以 4K x 4K（1600 萬畫素）解析度進行渲染，避免了傳統模型在放大過程中產生的細節丟失或偽影問題。
- **迭代穩定性**：透過「程式碼鎖定」機制，Reve 2.0 在進行多次迭代編輯時，能有效抑制擴散模型常見的品質退化與雜訊累積。
- **佈局模型（Large Layout Model）**：團隊開發了專屬的佈局模型，透過對數十億張影像進行密集標註訓練，並結合空間推理能力，實現比傳統文字生成模型更精準的構圖控制。

<video src="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1780597705628-84rwndva.mp4" poster="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1780597708041-g9uZB2vN0oVfVYFJ5jpg.jpg" controls preload="metadata" style="max-width:100%;height:auto;display:block;margin:1rem 0"></video>
> 這段影片展示了多種不同風格的影像，包括靜物罐頭堆疊、機場候機大廳以及坐在老式卡車中的男子。

**創作與應用優勢**
Reve 2.0 不僅是生成工具，更是一個整合了虛擬相機與影像編輯器的創作平台：
- **精準排版**：在平面設計與環境排版（如招牌、標籤、菜單）上，模型能精確控制文字位置與元素間的關係，解決了過往 AI 生成文字常出現的合成感。
- **Agent 友善**：由於影像具備結構化定義，Agent 可以直接「閱讀」並理解影像內容，進而執行複雜的視覺任務。
- **設計整合**：模型與產品介面從設計初期即同步開發，確保使用者能透過 [Reve 官網](http://reve.com) 直接進行高精度的視覺操作。

<video src="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1780597682021-vfag51lj.mp4" poster="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1780597682916-gwwnN2yl4BhmQZSp4jpg.jpg" controls preload="metadata" style="max-width:100%;height:auto;display:block;margin:1rem 0"></video>
> 這張俯拍照片展示了一桌豐盛的義式料理，包含布拉塔起司沙拉、義大利麵、佛卡夏麵包及各式配菜。

**研發觀點與背景**
Reve 團隊在 [官方部落格](https://blog.reve.com/posts/the-layout-bet/) 中指出，他們選擇了一條與主流不同的路徑：放棄僅依賴文字提示詞的生成方式，轉而投入「佈局（Layout）」的研究。團隊認為，文字雖然具備表達力，但本質上充滿歧義，而結構化的佈局才是實現精準控制的關鍵。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1780597660755-maoAANhdqjpgnameorig.jpg)
> 這張圖表顯示了截至 2026 年 6 月 3 日的 Text-to-Image Arena 文字轉圖像 AI 模型綜合排名，由 OpenAI 的 gpt-image-2 (medium) 位居榜首。

透過這項技術轉向，Reve 2.0 在「Arena Text-to-Image」排行榜中已躍升至前二名，超越了 Nano Banana 2 與 GPT-Image-1.5。團隊強調，這項成果證明了在較少 GPU 資源的訓練條件下，透過更聰明的中間表示層（Intermediate Representation），依然能達成超越傳統大規模模型的視覺表現。

<video src="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1780597658694-kshzd4ca.mp4" poster="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1780597660600-mgi0p8Vph7ddMmjlDjpg.jpg" controls preload="metadata" style="max-width:100%;height:auto;display:block;margin:1rem 0"></video>
> 這支影片展示了 Reve 2.0 AI 影像生成模型強大的視覺創作能力，透過多種風格的場景切換，呈現出細膩且具備觸感的影像質感。影片隨後以「après ski」雞尾酒吧的品牌識別設計為例，演示了該模型在商業設計與細節處理上的應用。最後，影片強調了其 4K 高解析度的輸出品質，並以簡潔的品牌標語作結。

## 標籤

AIGC, 新產品, Reve
