← 返回首頁

Bibim 是一款跨語言 CJK 輸入法原型,透過共享漢字層實現多語混合輸入

洪 民憙 (Hong Minhee; @hongminhee@hollo.social)
洪 民憙 (Hong Minhee; @[email protected])
@hongminhee
383🔁 149
𝕏 (Twitter)🔥🔥🔥🔥

AI 語音朗讀 · Edge TTS

AI 中文摘要Claude 生成

Bibim 是一款跨語言 CJK 輸入法原型,透過共享漢字層實現多語混合輸入。

Bibim 是一個針對中日韓(CJK)語言設計的輸入法原型,旨在打破傳統輸入法單一語言的限制,讓使用者能透過不同語言的發音,輸入共享的漢字詞彙。該專案目前已釋出網頁版原型,並強調其並非翻譯工具,而是提供一種跨語言的輸入路徑。

核心理念與動機
Bibim 的設計核心在於利用 CJK 語言共享的「漢字層」作為橋樑。傳統輸入法通常假設使用者一次只使用一種語言,但 Bibim 允許使用者透過任何一種熟悉的語言發音來輸入詞彙,系統再根據設定輸出對應的文字。

  • 解決痛點:當使用者在輸入日文時若忘記「博物館」的日文讀音,可以直接輸入韓文讀音(bangmulgwan)或中文讀音(bówùguǎn),系統仍能正確識別並輸出目標漢字。
  • 支援混用體:專案的次要目標是支援「國漢文混用體」,即在韓文句子中自然夾雜漢字。與傳統輸入法逐字轉換漢字不同,Bibim 支援以詞彙為單位的轉換,並結合頻率資料進行候選排序。

系統架構的三層設計
Bibim 的介面架構由三個獨立的配置軸組成,這些層級共同構成了一個統一的處理管線:

  • 輸入腳本 (Input script):使用者實際鍵入的書寫系統,如韓文、拉丁字母、假名、注音等。此層不處理實體鍵盤映射,僅處理語音或音節腳本。
  • 詞彙語言 (Vocabulary language):決定系統查詢字典的語言範圍。可同時設定多種語言,例如同時設定韓文與日文,系統即可透過兩種不同的發音路徑解析出同一個漢字。
  • 輸出語言 (Output language):決定最終輸出的目標呈現策略與字體規範(如新字體、簡體、繁體)。系統會將整個候選詞彙統一轉換為目標變體,而非針對單一詞彙進行個別設定。

運作機制與實際應用
Bibim 的運作邏輯是將輸入字串透過字典與轉寫規則進行分段與匹配。以輸入「博物館に行きましょう」(去博物館吧)為例:

  • 跨語言輸入:使用者若忘記「博物館」的日文讀音,可直接輸入韓文讀音「박물관」(bak-mul-gwan),系統會將其識別為「博物館」。
  • 混合處理:剩餘的輸入部分(如「니」)會被轉寫為對應的假名「に」。
  • 候選匹配:系統會根據字典與轉寫規則,將輸入的韓文近似音(如「이키마쇼우」)轉換為正確的日文假名組合「いきましょう」,並過濾掉無意義的組合。

專案現狀與限制

  • 目前 Bibim 僅提供網頁版原型供測試,尚未支援行動裝置端。
  • 作者 Hong Minhee 在 Codeberg 上公開了專案的具體藍圖與程式碼,供開發者參考與研究。