Top  > SpchWの部屋  > SAPI 4.x/5.x

  Microsoft SAPI 4.x/5.xについて
 
  以下の話は2002年12月時点のものである。

 SAPI自体はいわゆる「環境」でありSAPIコアなどと呼ばれる。その「環境」の中に音声合成(TTS:Text-to-speech)エンジンがインストールされ、アプリケーションからSAPI経由で利用される。
  「環境」の種類には次のようなものがある。
  • SAPI 4.0
  • SAPI 5.0
  • SAPI 5.1
  まず、SAPI 4.0。Microsoft Agentと一緒に利用することを条件にフリーで配布されていて、L&Hの「Kenji」「Naoko」というフリーの日本語用音声合成エンジンもあった。(現在も旧バージョンとしてダウンロード可能なようである)
  次にSAPI 5.0。これはWindowXPのリリース時に付けられたもので、音声合成エンジンとしては「Microsoft Sam」という英語用のものが付属している。
  そしてSAPI 5.1。Microsoft Speech SDK 5.1としてフリーで配布されていて、音声合成エンジンとしては「Microsoft Sam」「Microsoft Mike」「Microsoft Mary」という3つの英語用のものと、音声合成エンジンの開発者用に限られた語彙しか持たない一つの簡単なサンプルVoiceが付いている。

  ただしWindowsXPであっても確認できたマシンのc:\Program Files\Common Files\Microsoft Shared\Speechフォルダにあるsapi.dllのバージョンは5.1.4111.0だったので、厳密にはWindowXPだから5.0とは言えないかもしれない。またSPによって変わる可能性もある。

  互換性については次の通り。
  • SAPI 4.xとSAPI 5.xは一つのシステムに共存可能
  • ただしSAPI 4.xとSAPI 5.xには互換性がない
  • SAPI 5.1はSAPI 5.0に対して下位互換がある
  よって、SAPI 4.0用日本語用エンジンの入っているシステムにSAPI 5.xをインストールしても問題はなく、それぞれ独立して使えるがSAPI 5.1からはSAPI 4.0用日本語用エンジンは見えない。そのため、どちらのエンジンも使えるようにするためには、アプリケーションが4.x用と5.x用の二つのインターフェースを持たなければならなず、ユーザーにその違いを意識させないためには、内部的に辞書の橋渡しも行う必要があるであろう。また、SAPI 5.1には5.0との下位互換があると言っても、SpchWのような5.1用のアプリケーションを5.0の環境しか持たない素のWindowsXpで動かした時に、5.1にはあるが5.0にはないような機能を叩けば、正しく動かないことが予想される。

  ということで、それではMicrosoft Speech SDK 5.1を入れてみようか、と言うことになるのだが、4.0の時に比べてダウンロードサイズがかなり大きい。そこで無駄にならないように少し説明してみる。まずMicrosoftの.NET Speechのページの「ダウンロード」から「Speech SDK 5.1 for Windows」に行くと、次の5つのファイルがある。
  • Speech SDK 5.1 (68M)
  • 5.1 Language Pack (81.5M)
  • Redist: All (131.58M)
  • Redist: Mike and Mary (3.58M)
  • Documentation (2.28M)
  Language Packの説明には「Japanese」という文字があって期待させるが、これは音声認識エンジンであって、音声合成エンジンではない。そのため、SpchWで使う目的であれば5.1 Language Packは必要ない。
  Redist: AllはあたかもSpeech SDK 5.1+5.1 Language Packのような感じを受けるが、これは開発者が再配布するための.msmのかたまりであって、これ一つをダウンロードしてきてもSAPI 5.1の環境は構築できないので注意。Redist: Mike and Maryについても同じ。これをWindowsXPに入れるとMikeとMaryが追加されそうな感じがするが、内容は単に.msmが一つあるだけ。
  すでに5.1の環境や音声合成エンジンが揃っていて、TTS XMLなどの詳細を知りたい場合は、Documentationをダウンロードすればsapi.chmというヘルプファイル形式のドキュメントを入手できる。

  つまり、5.1の環境とSam/Mike/Maryを揃えたい場合は、上記のうちSpeech SDK 5.1だけをダウンロードしてインストールすればよい(sapi.chmも含まれる。) ただこれでも68Mもある上、SDKだからしかたがないが、エンドユーザーには必要のないサンプル・ソース・コードなどがインストールされるので、あまりうれしくない。本当はRedist: Allの中の1033フォルダの中にある
  • Sp5.msm
  • Sp5intl.msm
  • Sp5ttint.msm
  • Spcommon.msm
を組み合わせたmsiファイルをMicrosoftが配布してくれれば8M程度で5.1の環境と英語の音声合成エンジンだけをインストールできると思われるのだが。SpchWでは (1) msiを作る環境がない (2) ホームページの容量がない という二つの理由から再配布は行っていない。
 
 
( 2002/12/15 )
 
 

  Back