Posted by 每特17劃 on 2005-07-06

libTaBE

這次 TOSSUG 心得分享的主題是 libTaBE , 是一個xcin所使用的詞庫函式庫. 這個函式庫目前用 Berkelay DB 作為資料庫, 以Big5的編碼為主. 經過居士仔細的介紹之後, 大概可以知道這個函式庫的定位跟使用範圍.

這個程式在 Berkelay DB 的更動改版中有一些不相容的 bug, 而在 UTF-8 的風行之下, 接觸這個函式庫的機會似乎越來越小了. 然而這支程式所用的斷詞演算法跟基本字詞的資料結構框架, 看起來是有經過一番設計跟改良的. 如果能有人幫忙作 UTF-8 跟資料庫建製的移轉的話, 把這支程式的精華再次回收利用. 相信對輪入法的環境一定是一大貢獻.