[Julius Web page]
[Subject Prev][Subject Next][Thread Prev][Thread Next][Subject Index][Thread Index]

[julius-u:00151] Re: TRELLIS_ATOM構造体の*last_treについて


こんにちは,奈良先端大の 李 です.

#かなり専門的な話になってしまいますが…

> この構造体はトレリス上の単語情報を格納しており、
> *last_treは、その単語より時間的に1つ前のTRELLIS_ATOMを格納している、と解釈
> しているのですが、
> その場合の*last_treは、いくつかある候補のうちのどのTRELLIS_ATOMを格納してい
> るのでしょうか?
> 
> 例えば、
> sil
> 今日
> 京都
> 途中
> の
> 12時
> 中
> に
> です
> か
> sil
> 
> という単語トレリスがあったとすると、”12時”という単語の1つ前に来る単語の
> 候補としては”途中”、”の”など複数考えられると思うのですが、
> そのうちのどれが、”12時”という単語が格納されているTRELLIS_ATOMの
> *last_treに格納されているのでしょうか?
> (1stパス時に最も尤度が高かった候補?)

はい,*last_treには第1パスで,そのコンテキストでもっとも尤度が高い候補が
格納されています.

詳しく説明しますと,Julius の第1パスでは,フレームごとに,計算範囲(ビー
ム)内に終端が残った単語のリストを,その始終端フレームの情報とともに 
TRELLIS_ATOM として順次保存しています.そして,その終端から次に単語始
端へパスを繋いで遷移させ始めるときに,その保存された TRELLIS_ATOM への
ポインタ情報をパスに持たせて伝搬させていきます.(ソースでは 
julius/beam.h の TOKEN2 内の last_tre が,この伝搬情報にあたります)こ
の伝搬情報は,その後の単語内の Viterbi 演算の過程で尤度の高いノードの
もののみが選択されていきます.そして単語の最終ノードにパスが到達したと
きに,その到達したパスの保持していたTRELLIS_ATOMの情報が,そこで新たに
保存される TRELLIS_ATOM の *last_tre として格納されます.

なお余談ですが,このように最終的に最尤の候補のみを残す方法では,単語の
履歴に沿った値(単語境界時間等)の計算に誤差が生じることが知られていま
す.たとえば,「途中」のあとに続く「12時」と「の」のあとに続く「12時」
とはマッチする長さが違ったりするわけです.このため,よくある音声認識エ
ンジンでは「単語対近似」といって,直前単語ごとに候補を別々に扱うことが
行われています.例えば,この「12時」という単語仮説を,
(1)「途中」のあとに続く「12時」
(2)「の」のあとに続く「12時」
というように全く別々に扱うことで精度を高めることが行われます.
ただこれはかなり煩雑な認識処理を要するので,Juliusでは高速性を重視して
この単語対近似を行わずに最尤のもののみを残し,誤差は第2パスで再計算す
ることで補償する,という戦略を採っています.


> また、調べてみたところ、*last_treのendtimeが、”必ず”元のTRELLIS_ATOMの
> begintimeに繋がっているようになっている
> (つまり、 atom->begintime = (atom->last_tre)->endtime + 1 になっている)
> と思われるのですが、いったい何故このような現象が起こるのでしょうか?

あるフレームにおいて単語間遷移が行われるわけですから,当然
直前単語の終端 ((atom->last_tre)->endtime) と 次単語の始端
(atom->begintime) は隣接します.
実際にはその前後のフレームにも同じ単語仮説が存在しますが,
その中で,その仮説のコンテキストで最尤だった単語仮説境界時間が残ること
になります.

-- 
 李 晃伸 (ri@xxxxxxxxxxxxxxxxxx) 
 奈良先端科学技術大学院大学(奈良先端大)
 情報科学研究科 音情報処理学講座 助手

この情報があなたの探していたものかどうか選択してください。
yes/まさにこれだ!   no/違うなぁ   part/一部見つかった   try/これで試してみる

あなたが探していた情報はどのようなことか、ご自由に記入下さい。特に「まさにこれだ!」と言う場合は記入をお願いします。
例:「複数のマシンからCATV経由でipmasqueradeを利用してWebを参照したい場合の設定について」
References: