# 策展 · X (Twitter) 🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Reka (@RekaAILabs) · 平台：X (Twitter) · 日期：2026-06-26

> 原始來源：https://x.com/RekaAILabs/status/2070245465937822007

## 中文摘要

Reka AI 發布 CS2-10k 數據集提供具身智慧訓練。

<video src="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/1782451226703-53zz0goy.mp4" poster="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/8eb076e49fce90a8.jpg" controls playsinline preload="metadata" style="max-width:100%;height:auto;display:block;margin:1rem 0"></video>
> Reka Labs 展示其名為「CS2-10k」的數據集，用於訓練人工智慧模型進行遊戲場景預測與決策。

Reka AI 團隊指出，訓練互動式世界模型（World Models）極度依賴高品質的自我中心（egocentric）影片與精確同步的動作訊號，但這類資料在現實世界中極難取得。他們選擇利用《Counter-Strike 2》（CS2）的確定性重播機制，將職業比賽的 `.dem` 檔案轉化為包含視覺畫面與對應控制輸入的訓練資料，解決了標記成本高昂與數據多樣性不足的問題。

**CS2-10k 數據集規格**
這項釋出的數據集規模龐大，旨在支援多種 AI 研究場景：
- 包含超過 60 萬個玩家回合影片，總計超過 1 萬小時的視角畫面。
- 每一幀皆配對了詳細的註釋資料，包含鍵盤輸入狀態（W/A/S/D、跳躍、蹲下等）、滑鼠位移（delta）、3D 空間座標以及攝影機的俯仰角（pitch）與偏航角（yaw）。
- 數據集採用 `.parquet` 格式儲存，確保與影片時間軸精確對齊，且移除了武器模型與 UI 介面，避免視覺干擾。
- 應用範疇涵蓋動作條件影片生成、自我中心導航、長程規劃（Long-Horizon Planning）以及多 Agent 世界建模。

**開源渲染管線 `cs2-dem-renderer`**
為了讓研究人員能根據需求擴充數據規模，Reka AI 同步開源了其建構數據集的渲染管線 `cs2-dem-renderer`。該工具支援將 `.dem` 檔案轉換為 `.mp4` 影片與 `.parquet` 註釋檔，其運作流程如下：
1. **解析（Parse）**：透過兩階段解析提取玩家的重生與死亡時間區間，以及每一幀的按鍵輸入。
2. **渲染（Render）**：產生 JSON 格式的動作序列，並透過 Steam 啟動 CS2 載入重播檔，由伺服器 plugin 執行動作序列。
3. **編碼（Encode）**：將 CS2 輸出的原始幀串流至 `ffmpeg`（支援 VAAPI HEVC 硬體加速），即時生成影片檔案。

若要自行建置環境，請參考以下步驟：
1. 編譯伺服器 plugin：
   ```bash
   cmake ./cs2-server-plugin/ -B plugin-build -DCMAKE_BUILD_TYPE=Release
   cmake --build plugin-build
   ./install-plugin.sh plugin-build/libserver.so
   ```
2. 編譯渲染器：
   ```bash
   cd dem-render && go build -o dem-render .
   ```
3. 執行單一檔案渲染：
   ```bash
   dem-render <path-to-demo.dem>
   ```
4. 執行批次處理模式：
   ```bash
   dem-render worker --input /path/to/demos --output /path/to/output
   ```

研究人員可透過 [Hugging Face Dataset](https://huggingface.co/datasets/RekaAI/CS2-10k) 下載資料，或使用 [CS2-10k-viewer](https://huggingface.co/spaces/RekaAI/CS2-10k-viewer) 在瀏覽器中預覽數據內容。更多技術細節與原始碼請參閱 [GitHub 儲存庫](https://github.com/reka-ai/cs2-dem-renderer/tree/main)。

## 媒體內容

**Reka Labs 展示其名為「CS2-10k」的數據集，用於訓練人工智慧模型進行遊戲場景預測與決策。**

**影片中的 Prompt 與操作**

操作步驟：

1. （00:20）點擊「Browse Dataset」按鈕

## 標籤

新產品, 開源專案, Robot, Reka AI
