Sat, 30 Aug 2008
Windows版Wekaの入力ファイルに日本語を含めるときにはUTF8にしないといけなかったので,ファイルの文字コードをUTF8に変換するTUC: TinyUtf8Converterを作りました.
Comments...
TTMをプチバージョンアップしました.修正点は以下の通りです.
- 出力ファイルに含める品詞を選べるようにインターフェイスを変更
- 閾値のバグを修正(1つずれてた)
- 「語の出現頻度の最小値」を「語の出現頻度/出現件数の最小値」に修正
- その他インターフェイスを少し変更
Comments...