SAPIの開発を行うためには、まずSpeech SDKをインストールする必要があります。これには音声認識のライブラリやサンプルコードが含まれています。
Windows Vista以降では、Speech SDKをインストールする必要はありません。Windows VistaにはSAPI 5.3が、Windows 7にはSAPI 5.4が、Windows Speech Recognitionとして組み込まれています。
Download Speech Software Development Kit 5.1
対応OS:Windows NT4.0/98/Me/2000/XP
SpeechSDK51.exeがSDKの本体で、日本語で音声認識を行わせるには他にSpeechSDK51LangPack.exeが必要となります。
SpeechSDK51.exeは自己展開形式となっていますので、まずは実行して展開します。
展開されたファイルからsetup.exeを実行します。
ライセンスの確認やユーザー名の入力を求められるので、それに従いインストールを進めます。
Visual Studio 2005でSpeech API 5.1を使用するには、ライブラリのヘッダファイル (sphelper.h) を修正する必要があります。
SpeechSDK51LangPack.exeも自己展開形式となっていますので、これも展開します。
setup.exeを実行します。
ライセンス確認とユーザー名の入力の後、セットアップの種類の選択を求められます。中国語での音声認識が不要ならば[Custom]を選択し、カスタムセットアップで[Simplified Chinese engines]を除外します。
コントロールパネルの[音声認識]から各種設定を行えます。
音声認識に何語を使用するのかを選択します。既定では英語だけですが、Language Packをインストールすることで日本語と中国語も選択できるようになります。
音声認識のプロパティにある[マイクの構成]から、マイクの接続確認と音量調整を行えます。
特定の人物の話し方に合うように音声認識エンジンを調整することで、認識精度を向上させることができます。
音声認識のプロパティにある[プロファイルのトレーニング]から行います。
Speech SDKに付属しているSimple Dictationで、音声認識のテストを簡単に行えます。これはスタートメニューの【Microsoft Speech SDK 5.1 → C++ Samples → Simple Dictation】から起動できます。
マイクに向かって話しかけると、認識された言葉が文字として表示されます。
正しく認識されない場合は設定を見直し、マイクの調整やプロファイルのトレーニングを行います。