パソコンに読んでもらう

xdoc2txtの更新をしようと思って、hishidaさんのサイトを見に行ったら、EBWinの3.00 beta 3 版でポータブルモードがサポートされるようになったらしい。みんなUSBかSDカードに入れてOSから辞書からいろんなものを持ち歩けるようになるんだなぁ。と思って、いろいろ見ていると、


WindowsXp以外(98x/2000/NT)でText-To-Speechを使用する場合、 Microsoft Speech SDK 5.1 が必要です。



との記述が。

もちろん私は普段Windows2000を使っているので興味があります

Microsoft Speech SDK 5.1ってなんだというので今回の旅が始まったのでした。

こっち方面には疎かったのですが、なにかマイクロソフトから無料で音声合成と音声認識ソフトが出ていたらしい。

私は株式会社 電子辞典という会社のソフトを持っているのですが、それにも読み上げ機能がついてました。そして、hishidaさんのEBWinも編集タブのところにtext-to-speechという項目があるのに気がつきました。電子辞典のDDviewerも、EBWinもMicrosoft Speech SDK 5.1を使用して読み上げるソフトだということがわかりました。で、早速マイクロソフトでMicrosoft Speech SDK 5.1をダウンロードしようとしたのですが、これが判りにくい。

http://www.microsoft.com/speech/

結局、ダウンロードのページで検索をかけてダウンロードしました。それが2009年の1月24日です。

いまこのMicrosoft Speech SDK 5.1のダウンロードページのURLをここにリンクしようとして再度見てみたら、なんとページがみんななくなってました。昨日の今日で、ひょっとするとメンテナンスなのかなとも思いますが、どうなんでしょうか。

一応、株式会社 電子辞典のソフトにはこのMicrosoft Speech SDK 5.1が付属で入っているのが、インストールした後でヘルプをみて判ったので、もし必要な人がいれば電子辞典の辞書DVDを購入されればと。



(20090315 追記 20111214 更新)
ダウンロードサイト復活。よかったよかった。あたらしいURLは

http://www.microsoft.com/download/en/details.aspx?DisplayLang=en&id=10121



で、このMicrosoft Speech SDK 5.1は英語のテキストの読み上げは出来るのですが、日本語のテキストの読み上げが出来ない。

日本語を読み上げようとすればOffice2003のWordをインストールする必要があるらしいのが判ってきました。

一応ノートパソコンはXPでプリインストールでExcelとWordは入っていましたが、なんせHDDの容量が少ないので、ウィキペディアやら広辞苑やらいろいろ入れたくない。どうしてもWindows2000のPCに入れたいじゃないですか。で、いろいろベクターで読み上げソフトを見ていると、どうやらMicrosoft Speech SDK 5.1の前にSAPI 4 というのがあるらしい。これがごたぶんにもれず、いまはマイクロソフトのサイトからダウンロードできないのだそうだ。

しかし、そのベクターにMS Agentのファイルを同梱したフリーソフトがいくつかありました。



biheart(バイハート)

http://www.vector.co.jp/soft/cmt/win95/edu/se249930.html

Windows2000、その他用。クリップボード読み上げ機能あり。



英語アップ(EigoUp)

http://www.vector.co.jp/soft/win95/edu/se407636.html

WindowsXPその他用だが、ダウンロードしたファイルを解凍するとSAPIの必要ファイルが出てくる。Windowsインストーラ3.1v2再頒布可能ファイルとMicrosoft Visual C++ 2008 SP1 再頒布可能パッケージ (x86)をインストールして、EigoUp.msiを直接ダブルクリックしたら、Windows2000でも起動した。



読み上げくん

http://www.vector.co.jp/soft/win95/edu/se326037.html

これもダウンロードしたファイルを解凍するとSAPI4用のソフトが出てくる。このソフトは一応Windows2000も使えるようだが、私のPCはなにがいけないのか「読み上げくん」はエラーがでてインストールできなかった。


  "Microsoft Agent technology"を再配布するために必要な登録済です。
1. EigoUp uses "Microsoft Agent technology".
2. EigoUp uses character Peedy.
Peedy : (c) 1996-1998 Microsoft Corporation. All rights reserved.



上記3点のソフトはマイクロソフトに登録して再配布しているらしい。損害の補償が700円とか書いてあった。なのでここには残念だが転載できない。Vectorからダウンロードしてほしい。

SAPI4対応ソフトはというと

reporter

http://www.vector.co.jp/soft/win95/art/se191209.html

インストールはしていないので使えるかどうか未確認です。



TextSpeech発表会タイマー

http://www.vector.co.jp/soft/winnt/personal/se408982.html

インストールしないですぐ使える



EasySpeech

http://www.vector.co.jp/soft/winnt/art/se367527.html

インストールしないですぐ使える



簡読★Text

http://www.vector.co.jp/soft/win95/art/se357400.html

インストールしないですぐ使える。お薦め(Backup



楽SpeechS

http://www.vector.co.jp/soft/win95/art/se306183.html



パソコンに喋ってもらうために・・・ 読み上げTool

http://www.vector.co.jp/soft/win95/amuse/se152596.html

まだインストールしていないので動作未確認



そして、ついでにMicrosoft Speech SDK 5.1用のも探してみました



MOSpeech

http://www.vectorco.jp/soft/winnt/util/se440820.html

使いやすい。お薦め(Backup)





SpchW

http://hp.vector.co.jp/authors/VA017154/SpchW/index.htm

記事が参考になりました



ドキュメントトーカPlus TTS

http://www.vector.co.jp/soft/winnt/art/se453407.html

XP,Vista用でしたが、Windowsインストーラ3.1v2再頒布可能ファイルとMicrosoft Visual C++ 2008 SP1 再頒布可能パッケージ (x86)を入れたらWindows2000で使えるようになりました。独自の辞書をもっているのか、かなり違和感なく読み上げられるのですが、フリー版は頻繁に広告が入るのでちょっと新聞を読み上げさせるのは無理かな、本当のお試し版のようです。AquesTalkを内部で使っているようです。



で、このAquesTalkというフリーのエンジンを使っているソフトもベクターにありました。

SofTalk

http://www.vector.co.jp/soft/winnt/art/se412443.html

インストールしないですぐ使える。お薦め(Backup1.56



Text To Wav ★

http://www.vector.co.jp/soft/win95/art/se432694.html

SAPI4,SAPI 5.1,AquesTalkが同時に使える。お薦め(残念、再配布禁止ソフトだそうです)



で、このText To Wav ★でAquesTalkを使うには、

AquesTalkのサイト

http://www.a-quest.com/

から

http://www.vector.co.jp/soft/dl/win95/prog/se400858.html

にある最新版の本体をダウンロードしてきます。(営利、非営利にかかわらず無償)

aqtk20061012.zip

AqTk_mv_20070130.zip

AqTk_mv_20070319.zip

20090124の時点では上記3点をダウンロードしました。



現在、ライセンスが変更になったようです(20111214現在)

旧ライセンスについては、従来どおり再配布できるみたいですが
新しいライセンスでは再頒布に許可がいるそうですので
下記サイトを見てください
個人利用であれば、無償で利用できるようです

個人利用の場合ライセンス
http://www.a-quest.com/licence_free.html

ダウンロード
http://www.a-quest.com/download/index.html




また、

http://www.namazu.org/win32/

から

kakasi-2.3.4.zip

をダウンロードします。

aqtk20061012.zipを解凍してbinフォルダーの中のDLLを4つともText To Wav ★のPluginsフォルダーに入れます。

また、kakasi-2.3.4.zipをCフォルダー直下に解凍します。

フォルダーの名前は解凍したままにします。

そして、libフォルダーのなかのkakasi.dllもText To Wav ★のPluginsフォルダーに入れます。

これで使えるようになります。



しかし、ここまでやっても、電子辞典のソフトとEBWinに日本語をしゃべらせることは出来ません。

でもGoogleで検索すると、どうやら、Julius for SAPIというソフトがMicrosoft Speech SDK 5.1で動くようです。

音声版ダイアログナビのインストール(参考サイト。このサービスは終わっています)

http://www.ar.media.kyoto-u.ac.jp/msnavi/speech/install.html


 0. はじめに

 音声版ダイアログナビを利用するためには、以下のプログラムがコンピュータにインストールされている必要があります。お使いのコンピュータにこれらのプログラムがインストールされていない場合には、以下の手順にしたがってインストールしてください。
  • Julius for SAPI version 2.3以上
  • Internet Explorer Speech Add-in 1.0 (音声合成が必要な場合)
  • SAPI 5.1 に対応した音声合成エンジン (音声合成が必要な場合)

 1. Julius for SAPI のインストール方法

 音声版ダイアログナビの利用するためには、音声認識エンジン Julius for SAPI がコンピュータにインストールされている必要があります。以下のページから、最新版の Julius for SAPI を ダウンロードして、インストールしてください。 (注意:インストール中にエラーダイアログが出る場合、「続行」ボタンを押してそのまま続けてください。正常にインストールされます。)

 2. 音声版ダイアログナビのインストール

 SpeechDNAVI.msiを実行し、インストーラの指示にしたがってインストールしてください。 [スタート]-[すべてのプログラム]の中に音声版ダイアログナビが追加されます。

以下の3〜4の作業は音声合成、システムの生成する聞き返しに音声による解答を可能にするモジュールが必要な場合に必要な作業です。
これらが不要な場合には「5. 設定の確認」にお進みください。

 3. Internet Explorer Speech Add-in 1.0のインストール方法

3.1. プログラムのダウンロード

 Microsoft Internet Explorer Speech Add-in 1.0 をインストールするためには、 Microsoft Speech Application SDK version1.0 を Microsoft Speech のダウンロードページ (http://www.microsoft.com/speech/downloads/[英語サイト])からダウンロードする必要があります。
 このページから、SASDK_V1_Full.exe (約300MB)とSASDK_Extract.exeをダウンロードしてください。(画面最下部からダウンロードできます。)

3.2. ダウンロードしたプログラムの展開方法

 ダウンロードした SASDK_V1_Full.exe を実行し、展開先のフォルダを指定します。 (以下展開先のディレクトリは C:\SpeechSDK であるものとします。) Unzipボタンをクリックするとファイルの展開が始まります。SASDK_Extract.exe も同じ手順でSDK本体と同じディレクトリに展開してください。

   

 次に、コマンドプロンプトを起動して以下のコマンドを実行してください。

  1. cd C:\SpeechSDK
  2. SASDK_ExtractAll.cmd C:\SpeechSDK\Setup
プログラムが実行されSDKのインストーラが作成されます。

3.3. インストール手順

 Microsoft Speech Application SDK version1.0 の中の 必要なモジュールだけをインストールします。
 C:\SpeechSDK\Setup\Redistributable Installers\Speech Add-in for Microsoft Internet Explorer\Speech Add-in 1.0 for Microsoft Internet Explorer.msi をダブルクリックします。

 インストーラが起動しますので、指示に従ってインストールを実行してください。 途中で以下のシステムがスペックを満たしていないというエラーメッセージが出力されることがありますが、 [OK] をクリックしてそのまま続行してください。 正常にインストールされます。

 また、Microsoft Speech Recognition software のインストール・アップデートを薦められる場合がありますが、インストールを行う必要はありません。

 以上で Microsoft Internet Explorer Speech Add-in 1.0 のインストール作業は完了です。

 4. 音声合成エンジンのインストール

4.1. 音声合成について

 音声版ダイアログナビでは、音声合成エンジンがインストールされている場合に、システムが音声により応答します。
 音声合成エンジンがインストールされていない場合、付属の音声合成エンジンのインストールを推奨します。

4.2. 音声合成エンジンのインストール手順

 音声合成エンジンを利用するためには、 ChaSen ライブラリをインストールする必要があります。libchasen.msi をダウンロードし、インストーラの指示にしたがってインストールしてください。
(注意: インストール先は必ず C:\Program Files\chasen にするようにしてください)

 次に音声合成エンジン本体をインストールします。SynTTS.msiを実行し、インストールしてください。

 5. 設定の確認

 コントロールパネルの "Speech"(あるいは「スピーチ」、「音声認識」など) を開くと、「音声認識のプロパティ」ダイアログボックスが表示されます。

 「音声認識」タブの「言語」コンボボックスの認識エンジン "Julius SAPI Engine" が、「音声合成」タブの「音声の選択」コンボボックスでは "Syn TTS Japanese Male" もしくは、 "Syn TTS Japanese Female" が選択されていることを確認してください。



Julius_SAPI_2_3.msi音声認識エンジン

SpeechDNAVI.msi これはマイクロソフトの検索用ソフトなのでインストールする必要がありません。マイクロソフトのサービスは終わっているようです。

libchasen.msi音声合成を利用するためのライブラリ

SynTTS.msi音声合成エンジン

Internet Explorer Speech Add-in 1.0もインターネットエクスプローラを使わず、読み上げソフトを使用するときには必要ないです。

WindowsXPでSAPI5.1の技術を使って日本語の音声合成でパソコンにしゃべらせるには

Julius_SAPI_2_3.msi、libchasen.msi、SynTTS.msi

Windows2000で必要なのは、上記に加えてMicrosoft Speech SDK 5.1、ということです。



入れてみました。

出ましたよ。声が。

電子辞典のDDviewerとEBWinで日本語が出ました。

ただ、メモリーがいっぱいになるとソフトが落ちるようです。

読み上げ専用ソフトと違って、一気にメモリーにクリップボードの内容を読み込もうとするようなので、小分けにこまめにクリップボードにコピーしたほうがいいし、読み上げるピッチも下げたほうが負担が少ないようです。まあイライラするので、大量に読み上げなきゃならないときには、辞書ソフトの内容をクリップボードにコピーして、他の読み上げソフトを使ったほうがいいかもしれません。

また、このJuliusは英語は全く駄目で、ドキュメントトーカPlus TTSエンジンが英文和文交じりでも颯爽と読んでいったり、SAPI4がまあまあ読みこなしたり、AquesTalkの入っているソフトやkakasiがローマ字をアルファベットに分解して何とか読んでいくところJuliusは無音になります。

Text To Wav ★やMOSpeechなどは、英文和文が混じっていると、どっちかでしか読み上げられないですが、一行ずつ、英文なら英文で一行、和文なら和文で一行で、ちゃんと改行してあったりすると、日本語と英語のエンジンを切り替えて読み上げてくれます。

(20090125)



Microsoft Speech SDK 5.1、まだ直リンクは生きてました。

http://download.microsoft.com/download/speechSDK/SDK/5.1/WXP/EN-US/speechsdk51.exe

http://download.microsoft.com/download/speechSDK/SDK/5.1/WXP/EN-US/SpeechSDK51LangPack.exe

興味ある方はお早めに。多分Windows2000しか使えない技術なんで消えていってるんじゃないかと・・・。

このソフト、かってに再配布ができないんですよね・・・。



(20090315 追記)
ダウンロードサイト復活。よかったよかった。あたらしいURLは

http://www.microsoft.com/downloads/details.aspx?FamilyID=5e86ec97-40a7-453f-b0ee-6583171b4530&DisplayLang=en

(20111214 追記)
また新しくなってた。なにか音声合成の分野は入れ替わりが激しいなぁ・・・

http://www.microsoft.com/download/en/details.aspx?DisplayLang=en&id=10121







まとめ

SAPI4でパソコンにしゃべらせるには

biheart(バイハート)、英語アップ(EigoUp)、読み上げくんの3点のソフトのうちどれかをVectorからダウンロードしてMSAgentのソフトを取り出しインストールする。

SAPI4用の読み上げソフトを使用する。


SAPI5.1でパソコンにしゃべらせるには

Windows2000の場合はマイクロソフトのサイトからMicrosoft Speech SDK 5.1をダウンロードするか、株式会社電子辞典(http://www.densijiten.co.jp/)のソフトでWindows2000対応になっているものを書店で購入する。Microsoft Speech SDK 5.1をインストールする。

または株式会社電子辞典の「HD辞典シリーズ体験版」が公開されていれば、ダウンロードして、7ZIPで解凍するとMicrosoft(R)Speech APIVer.5.1 のセットアップが出てくるので、それをインストールする。

この時点で英語を読み上げさせることができる。

以下はWindowsXP,Windows2000で共通

1、Microsoft Office2003を購入インストールすると、日本語でしゃべってくれる。

2、フリーのJulius_SAPI_2_3.msi、libchasen.msi、SynTTS.msiをインストールすると日本語でしゃべってくれる。

3、SpeechSDK51LangPack.exeをマイクロソフト社からダウンロードすると、中国語をしゃべってくれるようになる。

4、ドキュメントトーカ 日本語音声合成エンジン for WindowsをVectorで購入する(未導入のため未確認)
http://shop.vector.co.jp/service/servlet/Catalogue.Detail.Top?ITEM_NO=SR101340

5、その他SAPI5.1用の有料ソフトの購入

AquesTalkでしゃべらせるには

AquesTalk対応読み上げソフトを使用する。たいてい同梱されている。





SAPI4用のマイクロソフトの日本語エンジンはなかなかの変換でパソコンのニュース記事を読み上げさせるくらいなら実用に十分耐えられると思うので、なぜマイクロソフト社からダウンロードできなくなったのかまったく残念だと思う。

(20090126)

SAPI5ダウンロード復活。やったねマイクロソフト(20090303)



関係ありそうなサイトのリンク

・形態素解析システム茶筌

http://chasen.naist.jp/hiki/ChaSen/

(20111214 追記)
http://chasen-legacy.sourceforge.jp/



・NAIST Japanese Dictionary

http://sourceforge.jp/projects/naist-jdic/



・MeCab (和布蕪)

http://mecab.sourceforge.net/



・近代文語UniDic

http://www.kokken.go.jp/lrc/index.php?UniDic%2F%B6%E1%C2%E5%CA%B8%B8%ECUniDic

(20111214 追記)
http://www2.ninjal.ac.jp/lrc/index.php?UniDic%2F%B6%E1%C2%E5%CA%B8%B8%ECUniDic



・徳田・李研究室

http://www.sp.nitech.ac.jp/index.php?%A5%DB%A1%BC%A5%E0%2F%A5%BD%A5%D5%A5%C8%A5%A6%A5%A7%A5%A2



・自然言語処理のためのリソース

http://nlp.kuee.kyoto-u.ac.jp/nl-resource/top.html

(20111214 追記)
http://nlp.ist.i.kyoto-u.ac.jp/index.php?NLP%E3%83%AA%E3%82%BD%E3%83%BC%E3%82%B9



Julius_SAPI_2_3.msi、libchasen.msi、SynTTS.msiのグループは辞書のlibchasen.msiが別ソフトになっているので、辞書の茶筌を入れ替えればいいじゃないか、ラッキーっと思ったのですが、そうは問屋が卸さなかった・・・。
このChasenはバージョンが2.2.9らしいのですが、どうしてもコンパイルできないし、辞書もipadic-2.7.0をipadic-2.4.1付属のバッチファイルでコンパイルしても使えないんですよね・・・。なぜなんだろう。それらしいものは吐き出されてくるのになぁ・・・。辞書さえ更新できればまだまだ使いやすくなるのになぁ。

新しいChasenはこんどはSynTTSが受け付けないし・・・。

うーん。だれかJulius_SAPI用のTTSをMeCabとNAIST Japanese Dictionaryのコンビで作ってくれませんかね。

ちょっとお手上げ・・・。

(20090128)


女の子お絵かき掲示板ナスカiPhone修理