# 策展 · X (Twitter) 🔥🔥🔥

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 作者：Tencent AI (@TencentAI_News) · 平台：X (Twitter) · 日期：2026-05-22

> 原始來源：https://x.com/TencentAI_News/status/2057400913061650805

## 中文摘要

騰訊發布 Hy-MT2 模型強化多語言翻譯。

騰訊混元團隊正式開源「Hy-MT2」多語言翻譯模型系列，包含 1.8B、7B 及 30B-A3B（MoE 架構）三種規模。該系列模型專為複雜的現實場景設計，不僅在通用與特定領域的翻譯任務中表現優異，更具備強大的指令遵循能力，旨在解決當前翻譯模型在處理複雜指令時的痛點。

**核心效能與技術突破**
Hy-MT2 系列在多維度評測中展現了領先的翻譯品質：
- 7B 與 30B-A3B 模型在「快速思考」模式下，表現超越了「DeepSeek-V4-Pro」與「Kimi K2.6」等開源模型。
- 輕量級的 1.8B 模型在整體效能上，甚至超越了微軟（Microsoft）與豆包等主流商業 API。
- 透過「AngelSlim」1.25-bit 極致量化技術，1.8B 模型的儲存需求僅需 440 MB，且推論速度提升了 1.5 倍，極大降低了行動裝置端的部署門檻。

**評測基準與生態整合**
為了推動翻譯技術的標準化，騰訊同步開源了「IFMTBench」，這是一套專門用於評估翻譯指令遵循能力的基準測試集。此外，騰訊也推出了「Hy-MT2-Translator Skill」，方便使用者將模型整合至翻譯工作流程中，並與 WMT26 國際機器翻譯大賽合作，邀請開發者參與「影片字幕翻譯」與「通用機器翻譯」任務。

**部署與執行指引**
Hy-MT2 支援多種主流框架，以下為各環境的部署與執行步驟：

1. **使用 `transformers` 進行推論**：
   需確保 `transformers` 版本大於等於 5.6.0。
   ```python
   from transformers import AutoModelForCausalLM, AutoTokenizer
   import torch

   model_path = "tencent/Hy-MT2-30B-A3B"
   tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
   model = AutoModelForCausalLM.from_pretrained(
       model_path,
       dtype=torch.bfloat16,
       device_map="auto",
       trust_remote_code=True,
   )
   model.eval()
   ```

2. **使用 `vllm` 部署服務**：
   ```bash
   uv venv --python 3.12 --seed --managed-python
   source .venv/bin/activate
   git clone https://github.com/vllm-project/vllm.git
   cd vllm
   uv pip install --editable . --torch-backend=auto
   vllm serve tencent/Hy-MT2-30B-A3B --tensor-parallel-size 1
   ```

3. **使用 `sglang` 部署服務**：
   ```bash
   git clone https://github.com/sgl-project/sglang
   cd sglang
   pip3 install pip --upgrade
   pip3 install "transformers>=5.6.0"
   pip3 install -e "python"
   python3 -m sglang.launch_server --model tencent/Hy-MT2-30B-A3B --tp 1
   ```

4. **使用 `llama.cpp` 執行**：
   注意：GGUF 版本依賴於 `llama.cpp` 的 PR #22836 STQ 核心。
   ```bash
   git clone https://github.com/ggml-org/llama.cpp.git
   cd llama.cpp
   cmake -B build
   cmake --build build --config Release
   ./build/bin/llama-completion --model model.gguf -p "Translate the following segment into Chinese, without additional explanation：Hello" --jinja -ngl 0 -n 64 -st
   ```

**開發與資源連結**
- 官方網站：[Tencent Hunyuan LLM](https://aistudio.tencent.com/llm/en?tabIndex=0)
- 程式碼庫：[GitHub（Hy-MT2）](https://github.com/Tencent-Hunyuan/Hy-MT2)
- 壓縮工具：[AngelSlim（`https://github.com/tencent/AngelSlim`）](https://github.com/tencent/AngelSlim)
- 技能下載：[ClawHub](https://clawhub.ai/tencent-adm/hy-mt2-translator-skill) 與 [SkillHub](https://skillhub.cn/skills/hy-mt2-translator)
- 詳細技術報告：`HY_MT2_0_Report.pdf`

## 標籤

開源專案, 新產品, AIGC, Tencent, Hy-MT2
