# 策展 · X (Twitter) 🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Ramp Labs (@RampLabs) · 平台：X (Twitter) · 日期：2026-07-02

> 原始來源：https://x.com/RampLabs/status/2072381992285647280

## 中文摘要

# PorTAL: Portable Task Adapters for LLMs

研究員：Ben Geist

---

## 摘要

參數高效微調（例如 LoRA）能將凍結的「大型語言模型」適應至特定任務，但產生的 adapter 會被綁定在單一基礎模型上。每當有新模型發布時，適應過程就必須從頭開始。我們研究了「可攜式任務適應」（portable task adaptation）：即以一種與基礎模型無關（base-agnostic）的形式學習一次任務適應，並透過僅重新調整每個模型的一小部分組件，將其遷移到新的凍結模型上。具體來說，我們學習了一個與基礎模型無關的任務潛在變數 $z_t$ 以及一個超網路解碼器（hypernetwork decoder）$D_b$，該解碼器能為凍結的基礎模型生成逐層的 LoRA adapter。解碼器由一個與基礎模型無關的共享核心（shared core）和一個輕量的逐基礎模型轉換器（per base converter）組成。若要遷移到新的基礎模型，我們只需凍結 $z_t$ 和共享核心，並僅在少量資料上重新調整轉換器即可。

這種我們命名為 PorTAL 的架構，不僅在同一模型系列內，甚至在跨模型系列間，都能恢復與逐任務 LoRA 相當的準確度提升。我們透過以下方式進行驗證：凍結在 Qwen3-1.7B 和 4B 上學習到的任務潛在變數與共享核心解碼器，僅重新調整輕量的逐基礎模型轉換器，結果在未見過的 Qwen3-8B 上恢復了約 98% 的 LoRA 準確度增益，在 Gemma-3-4B 上則恢復了約 94%。這遠優於目前的「可攜式任務適應」方法：Cross-LoRA 基線在未見過的 Qwen3-8B 上僅恢復了約 14% 的增益，而我們達到了 98%。此外，重新調整過程具有資料效率：PorTAL 在大約一半的校準資料量下就能達到從頭訓練 LoRA 的準確度高原，且在相同準確度下，其校準表現（held-out log-loss 更低）在各種資料規模下都始終優於從頭訓練的 LoRA。這大幅降低了微調後續基礎模型所需的 FLOPs。

---

## 1. 簡介與動機

新「大型語言模型」的推出速度正在加快：每年發布的知名基礎模型數量從 2020 年的 2 個增加到 2021 年的 9 個、2022 年的 32 個，以及 2023 年的 149 個 [1]。到了 2024-2025 年，SOTA（State-of-the-Art）模型的發布節奏已壓縮到極致，SOTA 模型在公開排行榜上平均僅能維持約 35 天的領先地位，遠低於 GPT-4 時期的近一年 [2]。

然而，將模型適應至特定任務的成本是「每個模型」都要付出的，且無法在這些發布週期中攤銷。微調（無論是全參數還是 LoRA）都被鎖定在單一基礎模型的權重空間中；當下一個模型發布時，適應過程必須在新的基礎模型上重做。參數高效方法降低了單位成本（在 7B 模型上進行 LoRA 的成本約為 $1-3k，而全參數微調約為 $12k [3]），但並未改變其結構：你仍然需要為每個（任務, 模型）組合支付資料整理 + 訓練執行 + 評估的費用，且全參數微調的成本仍會隨著模型規模的不斷擴大而增加 [4]。

結果就是，在當前最前線的模型上維護一套微調功能組合的成本，與模型發布間隔時間大致成反比。針對每個模型進行重新調整，已成為維持系統專業化，同時獲取更新、更聰明的基礎模型原始智慧時，最主要且不斷增長的成本。

我們的解決方案是：支付一次任務適應成本，並將其攤銷到未來每一個基礎模型上。受「柏拉圖表徵假說」（Platonic Representation Hypothesis）[5] 的啟發，我們以與基礎模型無關的形式學習適應，並透過僅在少量範例上重新調整輕量的逐基礎模型映射，將其遷移到每個新模型。

---

## 2. 相關工作

我們的貢獻結合了三個研究領域的想法，在此進行回顧。

透過超網路進行單一基礎模型的 LoRA 生成
Text-to-LoRA [6]、上下文內學習的 SHINE [7] 以及 Profile-to-PEFT [8] 將每個任務或每個使用者的適應攤銷為單次前向傳遞，但目標是固定的基礎模型，且是在任務或使用者之間進行泛化，而非在模型之間（Text-to-LoRA 明確將跨模型遷移留作未來研究）。

跨架構 LoRA 生成
LoRAGen [9] 使用結構嵌入（潛在變數 + 模組/層嵌入）為不同的基礎模型發射 LoRA，但它是透過重建現有的 LoRA 來訓練的；我們共享其解碼器形狀，但直接在任務損失上進行端到端訓練，且關鍵在於，我們凍結了共享的任務潛在變數和共享核心，僅重新調整輕量的逐基礎模型轉換器以適應未見過的基礎模型。

跨模型 LoRA 遷移
Cross-LoRA [10]、LoRA-X [11] 和 CAST [12] 的目標與我們相同，但它們是透過子空間或啟用流形對齊（activation manifold alignment）來轉換已經訓練好的 adapter。我們則是學習一個與基礎模型無關的潛在變數，並針對每個基礎模型重新校準轉換器。我們發現這個小的校準步驟非常重要。Cross-LoRA 在不重新調整的情況下遷移現有 adapter，在未見過的 8B 模型上僅恢復了約 14% 的 LoRA 增益，而我們達到了約 98%（§6.2）。

簡而言之，單一基礎模型 LoRA 生成、跨架構生成和跨模型遷移都有前人研究。我們的貢獻將它們結合成一個方案：學習共享的任務潛在變數和核心，將其凍結，並僅重新調整輕量的逐基礎模型轉換器以適應新模型。我們將此視為應對加速模型發布節奏的維護成本解決方案，並在實證上證明它優於跨模型遷移路線。

---

## 3. 背景：LoRA 與 LoRA 超網路

LoRA [13]。對於凍結的權重矩陣，LoRA 學習一個由兩個秩為 $r$ 的小矩陣 $A$ 和 $B$ 組成的低秩更新；僅訓練這兩個矩陣：

LoRA 超網路。與其直接訓練 $A$ 和 $B$，超網路會根據條件輸入來生成它們。Text-to-LoRA [6] 訓練一個超網路，從任務描述嵌入中為單一基礎模型發射完整的 LoRA，並透過凍結的基礎模型進行端到端訓練。這訓練的是一個超網路，而不是為每個任務訓練單獨的 LoRA，但它仍維持單一基礎模型，是在任務間進行泛化，而非在模型間。我們的設計借用了超網路 LoRA 生成的想法，但目標不同：跨基礎模型的共享、已學習任務表徵的遷移。

---

## 4. 方法

設計。我們的目標是實現一種只需學習一次，且能以低成本移植到新的凍結模型上的任務適應。我們將 adapter 生成器分為兩部分：一個大型的、與基礎模型無關的核心解碼器，在所有模型間共享，以固定的核心寬度 $d_c$ 發射低秩因子；以及一個輕量的逐基礎模型轉換器，用於調節共享核心的輸入並將其輸出投影到特定模型的維度。我們在一個或多個凍結的基礎模型上進行訓練，然後透過僅重新調整這個小的逐基礎模型轉換器，移植到未見過的模型上。

這將已學習的適應攤銷為共享表徵，並使每個新的基礎模型都能以低成本支援。根據設計，共享的潛在變數和核心保留了大部分參數，並吸收了任務表徵及其轉換為 adapter 空間的大部分映射；只有一小部分轉換器是特定於模型的。我們定義組件如下。

設定。設凍結的基礎模型 $b$ 具有 Transformer 層 $\ell = 1, \dots, L_b$，在適應模組 $m \in \{q\_proj, v\_proj\}$ 處具有逐層權重矩陣 $W_{\ell, m}$（我們將 $m$ 擴展到全模組變體中的所有注意力與 MLP 投影）。設 $\theta_b$ 表示凍結的基礎模型參數。

任務潛在變數。每個任務 $t$ 被映射到一個已學習的任務潛在變數 $z_t$，這是一個維度為 $d_z = 256$ 的與基礎模型無關的向量。

解碼器。我們的超網路 $D_b$ 由一個與基礎模型無關的核心解碼器和一個輕量的逐基礎模型轉換器組成；它將任務潛在變數 $z_t$ 和逐層嵌入 $e_\ell$ 映射到每個模組的 LoRA 因子：

在內部，我們使用 FiLM 來調節單一共享主幹。主幹以逐層嵌入 $e_\ell$ 作為輸入，而任務潛在變數 $z_t$ 則對其隱藏特徵進行縮放與位移。這會產生一個逐層的隱藏狀態：

接著，逐模組的頭（heads）將此隱藏狀態映射為核心寬度的因子：

最後，對齊器（aligner）透過逐模組的線性映射將它們投影到基礎模型的維度：

生成的 adapter 作為標準的 LoRA delta 注入：

訓練。我們訓練 $\{z_t\}$ 和 $D_b$，同時保持基礎模型參數 $\theta_b$ 凍結。我們最小化黃金續寫（gold-continuation）的 NLL（僅在答案 token 上計算損失）：

多任務訓練使用平衡的逐任務步驟，並結合 EMA 損失正規化，以防止困難任務的表現崩潰至隨機水準。

<video src="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/abb34ddfc0251891.mp4" poster="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/4555b8cd1a7b40ad.jpg" autoplay loop muted playsinline preload="metadata" style="max-width:100%;height:auto;display:block;margin:1rem 0"></video>

多基礎模型訓練。當我們同時在多個基礎模型上訓練時，小型基礎模型可能會主導共享潛在變數的梯度。我們對 $z_t$ 應用梯度範數平衡（gradient-norm balancing），在優化器步驟前將每個基礎模型累積的梯度重新縮放到相等的範數，確保每個基礎模型對共享表徵的貢獻相等。

移植。給定一個未見過的基礎模型 $b'$，我們凍結核心解碼器和 $\{z_t\}$，並僅在一個小的校準集上重新調整逐基礎模型轉換器 $\{e_\ell, P_{in}, P_{out}\}$：

<video src="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/2d8878d8b56b6739.mp4" poster="https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/9c2c00531147a4cb.jpg" autoplay loop muted playsinline preload="metadata" style="max-width:100%;height:auto;display:block;margin:1rem 0"></video>

---

## 5. 實驗設定

任務（14 個標準選擇題任務）。TruthfulQA、RTE、CB、COPA、WiC、WSC（SuperGLUE + TruthfulQA；具有更高的 headroom），以及 BoolQ、ARC-Easy、ARC-Challenge、HellaSwag、OpenBookQA、WinoGrande、CommonsenseQA、SciQ（更廣泛/更大的評估）。

指標。選項上的長度正規化對數概似（acc_norm）；我們也報告 held-out log-loss（黃金續寫的 token 平均 NLL）。§6.1–6.3 使用最佳 epoch 的 held-out 選擇（逐 epoch 評估），而 §6.4 使用最終 epoch 評估。所有結果均為 3 個隨機種子的平均值 ± 標準差。

資料。每個任務最多 2,000 個範例 — 這是一個應用於來源訓練和逐基礎模型轉換器重新調整的硬性上限。§6.1–6.3 在完整的 2,000 個/任務上進行擬合；資料效率研究（§6.4）顯示遠少於此數量的資料即足夠。評估集範圍從 56 (CB) 到 1,000 (BoolQ/WinoGrande/CSQA/SciQ)；14 個任務套件總共約 7,200 個評估範例。

模型。已見過的基礎模型：Qwen3-1.7B、Qwen3-4B。未見過的基礎模型：Qwen3-8B 和 Gemma-3-4B。逐任務 LoRA 基線：q/k/v/o + MLP 上的 rank 16。LoRA Hypernet/PorTAL (§6.1–6.3)：q/v 上的 rank 8。

報告的實驗。(i) LoRA Hypernet 與逐任務 LoRA 的比較；(ii) 在模型系列內及跨系列移植到未見過的基礎模型；(iii) 轉換器重新調整的資料效率。

---

## 6. 結果

6.1 來源基礎模型

| 方法 | 平均 acc_norm (14 個任務) |
| --- | --- |
| Base | 0.627 |
| 逐任務 LoRA | 0.765 ± 0.003 |
| **LoRA Hypernet** $(\text{聯合訓練 } z_{4B},\, D_{4B})$ | **0.757 ± 0.003** |

我們首先確認，在來源基礎模型上聯合訓練的已學習任務潛在變數 $z$ 和解碼器，可以媲美在同一基礎模型上獨立訓練的逐任務 LoRA。生成的 LoRA Hypernet 平均恢復了逐任務 LoRA 增益的約 94%，並在 6/14 個任務（RTE、CB、COPA、WiC、ARC-Easy、CommonsenseQA）上達到或超過了其表現。

6.2 系列內移植

| 方法 (在未見過的 8B 上) | 平均 acc_norm | 恢復的增益 |
| --- | --- | --- |
| Base-8B | 0.667 | — |
| 逐任務 8B LoRA | 0.795 ± 0.004 | 100% |
| Cross-LoRA 遷移 | 0.685 ± 0.001 | ~14% |
| $\text{LoRA Hypernet (聯合訓練 } z_{8B},\, D_{8B})$ | 0.785 ± 0.002 | ~92% |
| **PorTAL** $(\text{凍結 } z_{(1.7B+4B)},\ \text{重新調整 } D_{8B})$ | **0.792 ± 0.004** | **~98%** |

接著我們直接測試移植性。我們凍結在 Qwen3-1.7B 和 4B 上聯合學習到的潛在變數和核心解碼器，並僅在未見過的基礎模型上重新調整輕量轉換器。在未見過的 Qwen3-8B 上，這恢復了逐任務 LoRA 增益的約 98%，遠高於同類跨模型遷移方法 Cross-LoRA 所恢復的約 14%。有趣的是，在 Qwen3-8B 上聯合訓練潛在變數和解碼器達到了 0.785（約 92%），在統計上與移植的潛在變數相當，但略低。我們將 PorTAL 稍高的表現歸因於在多個已見過的基礎模型間進行了輕微的正規化。

6.3 跨系列移植

| 未見過的目標 | Base | 逐任務 LoRA | **PorTAL** | **恢復的增益** |
| --- | --- | --- | --- | --- |
| Gemma-3-4B | 0.595 | 0.778 ± 0.004 | 0.767 ± 0.004 | ~94% |

接著我們測試跨系列遷移。我們凍結在 Qwen3-1.7B 和 4B 上訓練的潛在變數和核心解碼器，並在 Gemma-3-4B 上重新調整轉換器。這恢復了從頭訓練 LoRA 增益的約 94%。跨系列遷移幾乎是無損的。

6.4 資料效率

PorTAL 攤銷了任務適應成本：在已見過的基礎模型上學習一次潛在變數和核心，應能使後續每個模型都易於適應，因此移植到新基礎模型所需的資料遠少於從頭訓練 LoRA。我們在未見過的 Qwen3-8B 上展示了這一點，對 PorTAL q/v r8、PorTAL full r8 以及逐任務 r16-full LoRA 的逐任務資料集大小進行了掃描。對於 PorTAL，此集合是其重新調整轉換器所用的校準集；對於從頭訓練的 LoRA，則是訓練集。

14 個任務的原始平均值，base-8B acc 0.667 / log-loss 3.819：

![PoRTAL 方法（q/v r8 與 full r8）能以更少的數據量（分別為 500 與 750）達到與 r16-full LoRA 相當的最高準確度（約 0.77），且 PoRTAL full r8 在數據量增加後展現出最佳的最終準確度。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/36c66e8371404946.jpg)

<details class="chart-data"><summary>展開數據表</summary><table><thead><tr><th></th><th>起始(x=125)</th><th>最佳(x=1500)</th><th>結束(x=2000)</th><th>達標點(x=500)</th></tr></thead><tbody><tr><td>PoRTAL q/v r8</td><td class="rank-bar num bar-w-100"><span class="bar-val">0.750</span></td><td class="rank-bar num bar-w-100"><span class="bar-val">0.769</span></td><td class="rank-bar num bar-w-100"><span class="bar-val">0.767</span></td><td>0.766</td></tr><tr><td>PoRTAL full r8</td><td class="rank-bar num bar-w-100"><span class="bar-val">0.753</span></td><td class="rank-bar num bar-w-100"><span class="bar-val">0.771</span></td><td class="rank-bar num bar-w-100"><span class="bar-val">0.770</span></td><td></td></tr><tr><td>r16-full LoRA</td><td class="rank-bar num bar-w-100"><span class="bar-val">0.743</span></td><td class="rank-bar num bar-w-0"><span class="bar-val"></span></td><td class="rank-bar num bar-w-100"><span class="bar-val">0.764</span></td><td></td></tr></tbody></table></details>

![在不同資料量下，PoRTAL q/v r8 的 held-out log-loss 表現皆顯著優於 PoRTAL full r8 與 r16-full LoRA，其中 PoRTAL q/v r8 在資料量為 500 時達到最低的 log-loss（約 2.10）。](https://pub-75d4fe1e4e80421b9ecb1245a7ae0d1a.r2.dev/curated/09a32ab4dafc40d1.png)

<details class="chart-data"><summary>展開數據表</summary><table><thead><tr><th></th><th>起始(125)</th><th>最佳(500)</th><th>結束(2000)</th></tr></thead><tbody><tr><td>PoRTAL q/v r8</td><td class="rank-bar num bar-w-80"><span class="bar-val">2.16</span></td><td>2.10</td><td class="rank-bar num bar-w-90"><span class="bar-val">2.35</span></td></tr><tr><td>PoRTAL full r8</td><td class="rank-bar num bar-w-100"><span class="bar-val">2.48</span></td><td></td><td class="rank-bar num bar-w-100"><span class="bar-val">2.45</span></td></tr><tr><td>r16-full LoRA</td><td class="rank-bar num bar-w-100"><span class="bar-val">2.58</span></td><td></td><td class="rank-bar num bar-w-100"><span class="bar-val">2.50</span></td></tr></tbody></table></details>

在兩張圖中，曲線均為 3 個數據點視窗內的滾動平均值，星號標記了每種方法首次達到逐任務 LoRA 峰值的位置。

PorTAL 的資料效率顯著更高。它使用大約一半的資料就能達到逐任務 LoRA 的最佳準確度，並且在資料量較大的範圍內始終優於它。由於凍結的基礎模型佔據了每步成本的大部分，以一半的資料達到高原期，大約將適應所需的 FLOPs 減半。PorTAL 的校準也更好，在所有資料規模下，其 held-out log-loss 都低於從頭訓練的 LoRA。

注意：我們全程與 r16-full LoRA 進行比較，因為我們發現它是我們掃描中最強的逐任務 LoRA 配置。

---

## 7. 未來工作

困難任務上的「梯度競爭」。在最佳 epoch 選擇下，大多數任務都能達到 LoRA 的增益，但少數較困難的常識和知識任務表現不足，最差的是 OpenBookQA（增益的約 42%）、WinoGrande（約 57%）和 HellaSwag（約 61%）。這些是最獨特的任務，且由於 rank-8 解碼器在整個套件中共享，它們的梯度被其他任務掩蓋，導致表現不足。我們推測根本原因是優化問題，而非 adapter 表達能力有限，因為更大的 rank-16 adapter 或更大的任務潛在變數都沒有幫助。在未來的工作中，我們希望追求更好的多任務優化，例如逐任務容量或課程學習，或者在共享解碼器之上增加一個小的逐任務殘差。

攤銷後的文字描述變體。一個自然的擴展是用任務描述上的編碼器取代自由的逐任務潛在變數，即 $z_t = E(emb(desc_t))$，這樣一個全新的任務就可以僅憑其描述進行零樣本（zero-shot）適應（類似 Text-to-LoRA），而無需進行逐任務訓練。我們將完整的研究留待未來工作。

其他方向。超越選擇題的更大規模與指令/生成任務；以及關於何時凍結潛在變數即足夠，與何時需要特定基礎模型適應的理論研究。

---

想跟上我們下一個 AI 實驗嗎？請在此訂閱並在 @RampLabs 追蹤我們。我們也在 Ramp 招募各類職位。

---

## 參考文獻

1. Stanford HAI — AI Index Report 2024 (foundation-model release counts). https://www.deeplearning.ai/the-batch/stanford-ai-index-report-shows-the-state-of-ai-in-2024

1. Chiang et al. — Chatbot Arena: An Open Platform for Evaluating LLMs by Human Preference (ICML 2024). https://arxiv.org/abs/2403.04132. Turnover statistic (~35 days at #1) from the Arena Leaderboard Dataset, Arena (2025). https://arena.ai/blog/arena-leaderboard-dataset/

1. Stanford HAI — AI Index Report 2025. https://hai.stanford.edu/ai-index/2025-ai-index-report

1. Alloc Labs — The Hidden Cost of LLM Fine-Tuning. https://www.alloclabs.com/blog/hidden-cost-llm-finetuning

1. Huh et al. — The Platonic Representation Hypothesis (2024). https://arxiv.org/abs/2405.07987

1. Charakorn et al. — Text-to-LoRA: Instant Transformer Adaptation (ICML 2025). https://openreview.net/forum?id=zWskCdu3QA

1. Liu et al. — SHINE: A Scalable In-Context Hypernetwork for Mapping Context to LoRA (2026). https://arxiv.org/abs/2602.06358

1. Tan et al. — Instant Personalized LLM Adaptation via Hypernetwork (Profile-to-PEFT) (2025). https://arxiv.org/abs/2510.16282

1. Huang et al. — LoRAGen: Structure-Aware LoRA Weight Generation. https://openreview.net/pdf?id=mrafO7aTYj

1. Xia et al. — Cross-LoRA: A Data-Free LoRA Transfer Framework across Heterogeneous LLMs (2025). https://arxiv.org/abs/2508.05232

1. Farhadzadeh et al. — LoRA-X: Bridging Foundation Models with Training-Free Cross-Model Adaptation (2025). https://arxiv.org/abs/2501.16559

1. Al Kari — CAST: Activation Manifold Projection (Cartridge Activation Space Transfer) (2025). https://arxiv.org/abs/2510.17902

1. Hu et al. — LoRA: Low-Rank Adaptation of Large Language Models (2021). https://arxiv.org/abs/2106.09685

---

## 附錄

A. 訓練與超參數

| 設定 | 數值 |
| --- | --- |
| 優化器 | AdamW |
| LR (解碼器 / 潛在變數) | 1e-3 / 2e-3 |
| Epochs / batch size | 5 / 4 |
| 多任務平衡 | 逐任務步驟平衡 + EMA 損失正規化 (0.9 / 0.1)，設有 1e-3 下限以確保穩定性 |
| 逐任務 LoRA 基線 | peft, rank 16, alpha 32, lr 1e-4, 5 epochs (最佳 epoch 選擇), 模組 q/k/v/o + MLP |
| 初始化 | B-heads 和 FiLM γ, β 初始化為零，因此生成的 adapter 在開始時為恆等映射 (ΔW = 0) |
| 硬體 | 單台 NVIDIA B200 (每次執行) |

B. 指標

我們報告的是「恢復的增益」（recovered lift），而先前的跨模型遷移論文（Cross-LoRA, CAST）則報告「保留率」（retention）。對於方法 $m$、未適應的基礎模型 $b$ 以及從頭訓練的逐任務 LoRA $L$：

當 headroom 很小時，保留率接近 100%，這正是那些論文運作的機制（它們訓練的 LoRA 在基礎模型之上僅增加約 1%），因此不具備區分度。我們在更高的 headroom 設定下進行評估，因此使用「恢復的增益」。為了可比性，Cross-LoRA 重新實作的保留率得分約為 86%（在 CAST 報告的 85-95% 區間內），但僅恢復了約 14% 的增益，而我們的移植得分約為 99% 保留率 / 約 98% 恢復的增益。

---

## 引用此工作

APA

Geist, B. (2026). PorTAL: Portable Task Adapters for LLMs. Ramp Labs. https://labs.ramp.com/research

BibTeX

```
@techreport{portal2026ramplabs,
  author = {Geist, Ben},
  title = {PorTAL: Portable Task Adapters for LLMs},
  year = {2026},
  month = {June},
  institution = {Ramp Labs},
  url = {https://labs.ramp.com/research}
}
```

## 標籤

LLM, 研究論文, 開源專案, LoRA, Ramp Labs