# 策展 · X (Twitter) 🔥🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Google Research (@GoogleResearch) · 平台：X (Twitter) · 日期：2026-07-02

> 原始來源：https://x.com/GoogleResearch/status/2072057987762708932

## 中文摘要

Google Research 發布 TabFM 讓使用者分類未知表格。

**核心概念**
TabFM 將表格預測問題轉化為 ICL（In-context learning）任務，藉此擺脫傳統機器學習中繁瑣的資料前處理與模型訓練流程。該模型由 Weihao Kong 與 Abhimanyu Das 等研究人員開發，用來解決傳統演算法（如 XGBoost、AdaBoost）在部署時需耗費大量時間進行超參數最佳化與特徵工程的瓶頸。

![](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/fbe62aaaf0cb5bd3.jpg)
> 此圖展示了將表格數據輸入至 TabFM 模型後，進而產生預測結果的運作流程。

**技術架構**
為了處理表格資料二維且無序的特性，TabFM 採用了結合 TabPFN 與 TabICL 優勢的混合架構，主要包含三個關鍵機制：
- **交替列與欄注意力（Alternating row and column attention）**：透過多層注意力模組，在欄位（特徵）與列（樣本）之間交替運作，直接捕捉複雜的特徵互動與依賴關係。
- **列壓縮（Row compression）**：將每一列的交叉注意力資訊壓縮為單一的稠密向量表示。
- **ICL（In-context learning）**：利用 Transformer 對壓縮後的向量序列進行注意力運算，大幅降低運算成本，確保在處理大型資料集時仍具備高效能。

**訓練與應用**
由於工業級表格資料常涉及敏感資訊且難以取得，TabFM 完全使用數億個由結構化因果模型（SCM）動態生成的合成資料集進行預訓練。在效能評估方面，該模型於「TabArena」基準測試中表現優異，能持續超越經過高度調校的傳統監督式演算法。

- **使用方式**：TabFM 現已於 [Hugging Face](https://huggingface.co/) 與 [GitHub](https://github.com/) 開放使用。
- **未來整合**：Google 計畫將 TabFM 整合至 Google BigQuery，未來使用者僅需透過簡單的 `AI.PREDICT` SQL 指令，即可在無須機器學習專業背景的情況下執行進階預測任務。

## 標籤

研究論文, AI-native, 其他, Google, Google Research