基本的な使い方
- ファイルを追加する。
※長時間のファイルの認識には時間がかかります。最初は短時間のもので動作を確認してください。
- 音声認識の完了を待つ。
- 次のいずれかの方法で再生を開始する。
- ファイルを選択し、[PLAY]ボタンをクリックする。
- ファイルを選択し、文章の見出しまたは単語をクリックする。
- キーワードで検索し、検索結果の文をクリックする。
音声認識のモデル
期待する認識結果を得られないならば、モデルを変更することで改善されることがあります。
ディクテーションキット
2種類のモデル、
- GMM版 … 高速、低精度
- DNN版 … 低速、高精度
が提供されているため、目的に応じて使い分けられます。
- Release dictation-kit 4.5 - Julius - OSDNから、[dictation-kit-v4.5.zip]をダウンロードする。
- 展開したファイルのmodel以下のフォルダを、このアプリケーションのmodel\dictation-kitへ移動する。
- このアプリケーションのメニューの【Settings → Configuration file】で、GMM版を利用するならば[dictation-kit_gmm-v4.5.jconf]、DNN版ならば[dictation-kit_dnn-v4.5.jconf]を選択する。
話し言葉モデルキット
- Release dictation-kit 4.5 - Julius - OSDNから、[ssr-kit-v4.5.zip]をダウンロードする。
- 展開したファイルのmodels以下のファイルを、このアプリケーションのmodel\ssr-kitへ移動する。
- このアプリケーションのメニューの【Settings → Configuration file】で、[ssr-kit-v4.5.jconf]を選択する。
講演音声モデルキット
- Release dictation-kit 4.5 - Julius - OSDNから、[lsr-kit-v4.5.zip]をダウンロードする。
- 展開したファイルのmodels以下のファイルを、このアプリケーションのmodel\lsr-kitへ移動する。
- このアプリケーションのメニューの【Settings → Configuration file】で、[lsr-kit-v4.5.jconf]を選択する。
管理ファイル
複数のファイルを管理下に追加した場合は、最初のものから順に音声認識されます。
追加したファイルは、次回以降の起動時にも維持されます。それを管理から除外するには、そのファイルを一覧で選択した状態でDelを押すか、右クリックのメニューから[Remove]を選択してください。
認識結果の文章
音声の状態によって、文字の大きさと色が変化します。
- 文字の大きさ … 音圧が大きな単語ほど、大きい
- 文字の色 … 周波数が高い単語ほど赤く、低い単語ほど青く
- 文字の濃さ … 認識結果が不確かな単語は、薄い色
キーワードによる検索
キーワードを入力すると、管理下のすべてのファイルから検索されます。そしてその検索結果をクリックすることで、そのキーワードが発音されている位置から再生できます。
現状では、単語もしくは単語に含まれる文字単位でしか検索できません。