基本的な使い方

  1. ファイルを追加する。
    ※長時間のファイルの認識には時間がかかります。最初は短時間のもので動作を確認してください。
  2. 音声認識の完了を待つ。
  3. 次のいずれかの方法で再生を開始する。
    1. ファイルを選択し、[PLAY]ボタンをクリックする。
    2. ファイルを選択し、文章の見出しまたは単語をクリックする。
    3. キーワードで検索し、検索結果の文をクリックする。

音声認識のモデル

期待する認識結果を得られないならば、モデルを変更することで改善されることがあります。

ディクテーションキット

2種類のモデル、

  • GMM版 … 高速、低精度
  • DNN版 … 低速、高精度

が提供されているため、目的に応じて使い分けられます。

  1. Release dictation-kit 4.5 - Julius - OSDNから、[dictation-kit-v4.5.zip]をダウンロードする。
  2. 展開したファイルのmodel以下のフォルダを、このアプリケーションのmodel\dictation-kitへ移動する。
  3. このアプリケーションのメニューの【Settings → Configuration file】で、GMM版を利用するならば[dictation-kit_gmm-v4.5.jconf]、DNN版ならば[dictation-kit_dnn-v4.5.jconf]を選択する。

話し言葉モデルキット

  1. Release dictation-kit 4.5 - Julius - OSDNから、[ssr-kit-v4.5.zip]をダウンロードする。
  2. 展開したファイルのmodels以下のファイルを、このアプリケーションのmodel\ssr-kitへ移動する。
  3. このアプリケーションのメニューの【Settings → Configuration file】で、[ssr-kit-v4.5.jconf]を選択する。

講演音声モデルキット

  1. Release dictation-kit 4.5 - Julius - OSDNから、[lsr-kit-v4.5.zip]をダウンロードする。
  2. 展開したファイルのmodels以下のファイルを、このアプリケーションのmodel\lsr-kitへ移動する。
  3. このアプリケーションのメニューの【Settings → Configuration file】で、[lsr-kit-v4.5.jconf]を選択する。

管理ファイル

複数のファイルを管理下に追加した場合は、最初のものから順に音声認識されます。

追加したファイルは、次回以降の起動時にも維持されます。それを管理から除外するには、そのファイルを一覧で選択した状態でDelを押すか、右クリックのメニューから[Remove]を選択してください。

認識結果の文章

音声の状態によって、文字の大きさと色が変化します。

  • 文字の大きさ … 音圧が大きな単語ほど、大きい
  • 文字の色 … 周波数が高い単語ほど赤く、低い単語ほど青く
  • 文字の濃さ … 認識結果が不確かな単語は、薄い色

キーワードによる検索

キーワードを入力すると、管理下のすべてのファイルから検索されます。そしてその検索結果をクリックすることで、そのキーワードが発音されている位置から再生できます。

現状では、単語もしくは単語に含まれる文字単位でしか検索できません。