Speech SDKのインストールと音声認識の設定

SAPIの開発を行うためには、まずSpeech SDKをインストールする必要があります。これには音声認識のライブラリやサンプルコードが含まれています。

Windows Vista以降では、Speech SDKをインストールする必要はありません。Windows VistaにはSAPI 5.3が、Windows 7にはSAPI 5.4が、Windows Speech Recognitionとして組み込まれています。

ダウンロード

Download Speech Software Development Kit 5.1
対応OS:Windows NT4.0/98/Me/2000/XP

SpeechSDK51.exeがSDKの本体で、日本語で音声認識を行わせるには他にSpeechSDK51LangPack.exeが必要となります。

インストール

Speech SDK

SpeechSDK51.exeは自己展開形式となっていますので、まずは実行して展開します。

展開されたファイルからsetup.exeを実行します。

ライセンスの確認やユーザー名の入力を求められるので、それに従いインストールを進めます。

Visual Studio 2005でSpeech API 5.1を使用するには、ライブラリのヘッダファイル (sphelper.h) を修正する必要があります。

Speech SDK Language Pack (日本語の音声認識エンジン)

SpeechSDK51LangPack.exeも自己展開形式となっていますので、これも展開します。

setup.exeを実行します。

ライセンス確認とユーザー名の入力の後、セットアップの種類の選択を求められます。中国語での音声認識が不要ならば[Custom]を選択し、カスタムセットアップで[Simplified Chinese engines]を除外します。

音声認識の設定と調整

コントロールパネルの[音声認識]から各種設定を行えます。

言語の選択

音声認識に何語を使用するのかを選択します。既定では英語だけですが、Language Packをインストールすることで日本語中国語も選択できるようになります。

マイクの調整

音声認識のプロパティにある[マイクの構成]から、マイクの接続確認と音量調整を行えます。

認識精度の向上 (プロファイルのトレーニング)

特定の人物の話し方に合うように音声認識エンジンを調整することで、認識精度を向上させることができます。

音声認識のプロパティにある[プロファイルのトレーニング]から行います。

音声認識のテスト (Simple Dictation)

Speech SDKに付属しているSimple Dictationで、音声認識のテストを簡単に行えます。これはスタートメニューの【Microsoft Speech SDK 5.1 → C++ Samples → Simple Dictation】から起動できます。

マイクに向かって話しかけると、認識された言葉が文字として表示されます。

正しく認識されない場合は設定を見直し、マイクの調整やプロファイルのトレーニングを行います。