基本的な使い方

ファイルを追加する。
※長時間のファイルの認識には時間がかかります。最初は短時間のもので動作を確認してください。
音声認識の完了を待つ。
次のいずれかの方法で再生を開始する。
1. ファイルを選択し、[PLAY]ボタンをクリックする。
2. ファイルを選択し、文章の見出しまたは単語をクリックする。
3. キーワードで検索し、検索結果の文をクリックする。

音声認識のモデル

期待する認識結果を得られないならば、モデルを変更することで改善されることがあります。

Ver.0.12以降では、モデルの変更に対応していません。

ディクテーションキット

2種類のモデル、

GMM版 … 高速、低精度
DNN版 … 低速、高精度

が提供されているため、目的に応じて使い分けられます。

Release dictation-kit 4.5 - Julius - OSDNから、[dictation-kit-v4.5.zip]をダウンロードする。
展開したファイルのmodel以下のフォルダを、このアプリケーションのmodel\dictation-kitへ移動する。
このアプリケーションのメニューの【Settings → Configuration file】で、GMM版を利用するならばmodelフォルダに同梱されている[dictation-kit_gmm-v4.5.jconf]を、DNN版ならば[dictation-kit_dnn-v4.5.jconf]を選択する。

話し言葉モデルキット

Release dictation-kit 4.5 - Julius - OSDNから、[ssr-kit-v4.5.zip]をダウンロードする。
展開したファイルのmodels以下のファイルを、このアプリケーションのmodel\ssr-kitへ移動する。
このアプリケーションのメニューの【Settings → Configuration file】で、modelフォルダの[ssr-kit-v4.5.jconf]を選択する。

講演音声モデルキット

Release dictation-kit 4.5 - Julius - OSDNから、[lsr-kit-v4.5.zip]をダウンロードする。
展開したファイルのmodels以下のファイルを、このアプリケーションのmodel\lsr-kitへ移動する。
このアプリケーションのメニューの【Settings → Configuration file】で、modelフォルダの[lsr-kit-v4.5.jconf]を選択する。

管理ファイル

複数のファイルを管理下に追加した場合は、最初のものから順に音声認識されます。

追加したファイルは、次回以降の起動時にも維持されます。それを管理から除外するには、そのファイルを一覧で選択した状態でDelを押すか、右クリックのメニューから[Remove]を選択してください。

認識結果の文章

音声の状態によって、文字の大きさと色が変化します。

文字の大きさ … 音圧が大きな単語ほど、大きい
文字の色 … 周波数が高い単語ほど赤く、低い単語ほど青く
文字の濃さ … 認識結果が不確かな単語は、薄い色

キーワードによる検索

キーワードを入力すると、管理下のすべてのファイルから検索されます。そしてその検索結果をクリックすることで、そのキーワードが発音されている位置から再生できます。

現状では、単語もしくは単語に含まれる文字単位でしか検索できません。

ダウンロード