Bibim 是一款跨語言 CJK 輸入法原型,透過共享漢字層實現多語混合輸入
AI 語音朗讀 · Edge TTS
Bibim 是一款跨語言 CJK 輸入法原型,透過共享漢字層實現多語混合輸入。
Bibim 是一個針對中日韓(CJK)語言設計的輸入法原型,旨在打破傳統輸入法單一語言的限制,讓使用者能透過不同語言的發音,輸入共享的漢字詞彙。該專案目前已釋出網頁版原型,並強調其並非翻譯工具,而是提供一種跨語言的輸入路徑。
核心理念與動機
Bibim 的設計核心在於利用 CJK 語言共享的「漢字層」作為橋樑。傳統輸入法通常假設使用者一次只使用一種語言,但 Bibim 允許使用者透過任何一種熟悉的語言發音來輸入詞彙,系統再根據設定輸出對應的文字。
- 解決痛點:當使用者在輸入日文時若忘記「博物館」的日文讀音,可以直接輸入韓文讀音(bangmulgwan)或中文讀音(bówùguǎn),系統仍能正確識別並輸出目標漢字。
- 支援混用體:專案的次要目標是支援「國漢文混用體」,即在韓文句子中自然夾雜漢字。與傳統輸入法逐字轉換漢字不同,Bibim 支援以詞彙為單位的轉換,並結合頻率資料進行候選排序。
系統架構的三層設計
Bibim 的介面架構由三個獨立的配置軸組成,這些層級共同構成了一個統一的處理管線:
- 輸入腳本 (Input script):使用者實際鍵入的書寫系統,如韓文、拉丁字母、假名、注音等。此層不處理實體鍵盤映射,僅處理語音或音節腳本。
- 詞彙語言 (Vocabulary language):決定系統查詢字典的語言範圍。可同時設定多種語言,例如同時設定韓文與日文,系統即可透過兩種不同的發音路徑解析出同一個漢字。
- 輸出語言 (Output language):決定最終輸出的目標呈現策略與字體規範(如新字體、簡體、繁體)。系統會將整個候選詞彙統一轉換為目標變體,而非針對單一詞彙進行個別設定。
運作機制與實際應用
Bibim 的運作邏輯是將輸入字串透過字典與轉寫規則進行分段與匹配。以輸入「博物館に行きましょう」(去博物館吧)為例:
- 跨語言輸入:使用者若忘記「博物館」的日文讀音,可直接輸入韓文讀音「박물관」(bak-mul-gwan),系統會將其識別為「博物館」。
- 混合處理:剩餘的輸入部分(如「니」)會被轉寫為對應的假名「に」。
- 候選匹配:系統會根據字典與轉寫規則,將輸入的韓文近似音(如「이키마쇼우」)轉換為正確的日文假名組合「いきましょう」,並過濾掉無意義的組合。
專案現狀與限制
- 目前 Bibim 僅提供網頁版原型供測試,尚未支援行動裝置端。
- 作者 Hong Minhee 在 Codeberg 上公開了專案的具體藍圖與程式碼,供開發者參考與研究。
요즘 국한문·CJK 통합 입력기 비슷한 걸 만들어 보고 있습니다. 일단은 웹 앱으로 프로토타이핑을 얼추 했는데요. 영상으로 보이는 것처럼 “daxueshengeun hakubutsukane ganda”와 같이 중국어와 일본어와 한국어를 섞어서 「大學生은 博物館에 간다」 같은 문장을 완성할 수 있습니다. pic.twitter.com/aUhfkrIQNI
— 洪 民憙 (Hong Minhee; @[email protected]) (@hongminhee) April 8, 2026
프로젝트 이름은 언어를 섞어서 입력한다는 뜻과 입력기(input method)를 뜻하는 “-im” 접미사에서 착안해 “Bibim”이라고 지었습니다. 아래 저장소의 README에서 프로젝트의 구체적인 청사진을 읽어보실 수 있습니다.https://t.co/ot1KGbfC1F
— 洪 民憙 (Hong Minhee; @[email protected]) (@hongminhee) April 8, 2026
아, 프로토타입 데모는 아래 페이지에서 써 보실 수 있습니다. 모바일은 지원 안 합니다.https://t.co/g5pUWhP7cn
— 洪 民憙 (Hong Minhee; @[email protected]) (@hongminhee) April 8, 2026
