# OpenAI隱私過濾器被逆轉為PII提取工具

> 📖 本站完整內容索引（documentation index）：[llms.txt](/llms.txt)

> 原作者：chiefofautism (@chiefofautism) · 策展與摘要：EasyVibeCoding · 平台：X (Twitter) · 熱度：🔥 · 日期：2026-04-24

> 原始來源：https://x.com/chiefofautism/status/2047582480140562542

## 證據與延伸閱讀

- [OpenAI隱私過濾器被逆轉為PII提取工具](https://github.com/chiefautism/privacy-parser)

## 中文摘要

OpenAI隱私過濾器被逆轉為PII提取工具。

OpenAI推出「Privacy Filter」，一個用於隱藏文字中PII（個人識別資訊）的1.5B參數模型，讓防禦方避免資料外洩；但開發者chiefofautism將其「翻轉內外」，基於相同權重與標籤分類，改為「Privacy Parser」，專門從日誌、資料傾印、遺棄S3儲存桶或竊取收件匣中提取結構化PII片段，包括姓名、電子郵件、電話、銀行帳號、地址與秘密等，精確到字元偏移位置。此工具中立不分攻守，防禦可用於審計自家資料，攻擊則用於解析他人外洩內容。

**工具定位與雙面性**  
「Privacy Filter」原為防禦設計，透過遮罩`<REDACTED>`隱藏PII，避免資料洩漏；「Privacy Parser」則提取相同PII，但輸出結構化片段：類型、內容、位置。開發者強調「每個防禦都有第二面」，攻擊者同樣需要從雜亂文字堆中找出個人資訊，此工具不認陣營，只專注解析效能。GitHub專案https://github.com/chiefofautism/privacy-parser提供完整程式碼，Apache-2.0授權。

**安裝與基本使用**  
安裝需使用uv工具，建立虛擬環境並以可編輯模式安裝「privacy-filter」與「pii_parser」套件，首次執行下載約3GB的opf 1.5B檢查點至`~/.opf/privacy_filter/`。  
Python範例：  
```python
from pii_parser.hybrid import HybridPIIParser
parser = HybridPIIParser(device="cpu")
result = parser.parse("Hi Quindle Testwick (quindle.testwick@openai.com / +1-415-555-0102), account 40702810500001234567, 14 Beautiful Ct, Anytown USA, password Priv4cy-Filt3r-2026.")
for s in result.spans:
    print(f"{s.label:18}  {s.text}")
```  
輸出：  
```
private_person      Quindle Testwick  
private_email       quindle.testwick@openai.com  
private_phone       +1-415-555-0102  
account_number      40702810500001234567  
private_address     14 Beautiful Ct, Anytown USA  
secret              Priv4cy-Filt3r-2026  
```  
CLI介面簡易：`python -m pii_parser.cli_model "Alice paid 40702810500001234567 on 2026-05-17."`。

**三種後端比較**  
工具提供三種後端，平衡速度與準確度，Hybrid版本最推薦出貨：  

| 後端              | 權重     | 速度          | F1分數 |
|-------------------|----------|---------------|--------|
| `PIIParser`       | 無       | µs            | 1.000  |
| `ModelPIIParser`  | 1.5B     | 500 ms CPU    | 0.733  |
| `HybridPIIParser` | 1.5B     | 600 ms CPU    | 0.929  |  

Hybrid結合模型預測、片段合併與regex備援，提升F1至0.929，彌補模型弱點。

**標籤分類**  
採用opf v2分類，共8類，涵蓋常見PII：  
- `private_person`（私人姓名）  
- `private_email`（私人電子郵件）  
- `private_phone`（私人電話）  
- `private_address`（私人地址）  
- `private_url`（私人網址）  
- `private_date`（私人日期）  
- `account_number`（帳號號碼）  
- `secret`（秘密，如密碼）  

**技術架構**  
流程從文字輸入開始：  
```
text  
↓  
opf 1.5B → BIOES logits → Viterbi (tuned) → char spans  
↓  
span-merge (glues Quindle + Testwick)  
↓  
regex backstop (URL, secret, account — where the model misses)  
↓  
spans[]  
```  
核心使用opf 1.5B模型產生BIOES logits，經調優Viterbi解碼轉為字元片段；span-merge黏合分裂姓名（如Quindle + Testwick）；regex備援捕捉模型遺漏的URL、秘密與帳號。基準測試`python pii_parser/tests/test_hybrid.py`顯示：Fixture F1 0.929、8/8情境通過、CPU延遲約600 ms。

此工具凸顯AI模型的中立性與雙刃劍本質：OpenAI的隱私防護被輕易逆用，提醒資料外洩後的提取風險極高，防禦方須預先審計，攻擊方則獲高效PII獵手。

## 標籤

資安, 開源專案, 其他, OpenAI