[Julius Web page]
[Subject Prev][Subject Next][Thread Prev][Thread Next][Subject Index][Thread Index]

[julius-u:00107] 辞書について


はじめまして。
たつぼうと申します。mOm

最近ライブラリを使って色々試行錯誤させて頂いております。^^
#Windows 版を使わせて頂いております。
#ゲームや自作アプリに何か使えるんじゃないかと思いまして。^^;
#ちなみに音声認識そのものはやったことないのでズブの素人です。^^;;


この辞書について伺いたいのですが新たな単語を追加する為には
 ・語彙データ・・・20k.htkdic.gz
 ・辞書データ・・・75.20k.1-1.10p.wit.bingram.gz
の両方をいじる必要があるのでしょうか?

辞書データの方は中がどうなっているのかまったくわからないため、
今は語彙データを弄って見ています。

見かけ上「同じ発音の単語」であれば手動で追加して重み係数と
思しき数値を手直ししてやるだけでそれらしく動いているのですが、
そうであるならば辞書データの役割というのはどういったものに
なりますでしょうか。

ドキュメントや過去のMLの内容から察するに単語の前後関係情報等を
保持してそこからどの単語が適切かを推定するために使用している
様に思われるのですが、配布して頂いたものは既にバイナリになって
いるためわかりません。

もし差し支えなければ
 ・どういったデータなのか
 ・学習方法
 ・学習用のアプリの有無
 ・自作の可否
等教えて頂けませんでしょうか。

お忙しいところ素人丸出しの質問で恐縮ですが、よろしくお願いいたします。

この情報があなたの探していたものかどうか選択してください。
yes/まさにこれだ!   no/違うなぁ   part/一部見つかった   try/これで試してみる

あなたが探していた情報はどのようなことか、ご自由に記入下さい。特に「まさにこれだ!」と言う場合は記入をお願いします。
例:「複数のマシンからCATV経由でipmasqueradeを利用してWebを参照したい場合の設定について」