Festival install/音声合成ソフトウェアインストール手順

[ INDEX | FESTIVALのインストール | ウインドウズ用サウンド | FESTIVALオフィシャルサイト ]

Festival install/音声合成ソフトウェアインストール手順

１．まずはじめに

1.1 Festivalとは何か？

・英エディンバラ大学の「Centre for Speech Technology Research」で開発された、UNIXプラットホームのテキスト読み上げシステムである。
・著作権表示から見ると1996年から開発（？公開）しているようだ。
・オフィシャルホームページはこちら
http://www.cstr.ed.ac.uk/projects/festival.html

1.2 特徴

・多言語に対応している（恐らく英語のみが標準対応で、その他の言語は自分で言語データの入力の必要があると思う）。
・オープンソース（GNUライセンスを適用[?festival_warrantyという表現もあり、違ってるかも]）であり、商用利用も可能[?のはず]。

２．対応しているプラットフォーム

※C++コンパイラが必要です（GCCであれば、問題なく動作すると思う）。
※商用コンパイラも使用可能なプラットフォームもあります。

・Solaris(またはSunOS)
・Aix(RS/6000)
・Linux(最新のもであれば、どのLinuxディストリビューションでも簡単にインストールできると思う)
・FreeBSD
・MS-WindowsNT
・MS-Windows95(98, 98SE不可かも？)

３．必要なソフトウェア

※以下のソフトウェアおよび、音声データが必要です。

・SIODスキーマソフトウェア
・Speechソフトウェア
・Speech音声データ
・Festivalソフトウェア（これが本体！）
・Festivalドキュメントファイル

ここからダウンロードが可能です（圧縮ファイル形式のものは一通り必要）。
http://www.cstr.ed.ac.uk/projects/festival/download.html

SIODはここからダウンロードしてください。
ftp://ftp.std.com/pub/gjc/

４．インストール

※Linuxの場合についてのインストール手順の記述です。ある程度Linuxに親しんでいる人を対象に記述してあります（僕は初めてLinuxをインストールした日に一緒にインストールできたから、そんなに詳しく知らなくても多分大丈夫）。
※バージョンは「 1.4.1 (December 1999)」の時点の場合です。
※僕のインストールしたノートＰＣでは音源に対応していなかったので、実際の音源での出力テストはやってません。ひょっとすると確かなもんじゃないかも。
※これを書いている途中で、インストール手順を紹介しているサイトが見つかった。こちらも参照してください。
http://www.jaist.ac.jp/~fuji/Software/software.htm

4.1 まずダウンロードと解凍作業

・これくらいは説明なしで、できるよね。

4.2 SIOD

(1)解凍するとそのディレクトリに解凍ファイルが展開してしまうようなので、ディレクトリを作ってから解凍。

mk siod
cd siod

そして圧縮ファイルをここに解凍

(2)SIOD の make

siod/ に移動して

make linux
make

で、コンパイル。問題なければ、

make install

でインストール。これだけ。

4.3 SpeechソフトウェアおよびSpeech音声データ

(1)解凍すると speech_tools/ というディレクトリができる。

(2)設定ファイルの変更

speech_tools/config/ ディレクトリで、

cd speech_tools/
cd config/
cp config-dist config

で設定ファイルをコピーし、コピーしたファイルを変更する。

vi config
下の設定をviで変更する。
INCLUDE_MODULES += SIOD

で SIOD の設定を追加したら書き込む。

(3)Speech の make

speech_tools/ に戻ってコンパイル環境の設定を行う。完了したらコンパイル

cd ..
make info
make

これでコンパイルが問題なく終われば完了。

(4)インストール

make install

また、 speech_tools/bin にパスを通す。これでインストールは完了

set path=($path ~owner/src/speech_tools/bin)

4.4 Festivalソフトウェアと、Festivalドキュメントファイル

(1)解凍すると festival/ というディレクトリと festdoc-1.4.0.1/ というディレクトリができる。
前者はソース類。後者はドキュメント類のディレクトリである。

(2)設定ファイルの変更

festival/config/ ディレクトリで

cd festival
cd config
cp config-dist config

で設定ファイルをコピーする。変更は特に必要ないようだ。

(3)festival の make

festival/ に戻ってコンパイル環境の設定を行う。完了したらコンパイル。

cd ..
make info
make

ちょっと時間がかかる。これでコンパイルが問題なく終われば完了。

(4)インストール

make install

それから、 festival/bin/ と festival/examples にパスを通す。これでインストールは完了。

set path=($path ~owner/src/festival/bin)
set path=($path ~owner/src/festival/examples)

５．動作テスト

[username@hostname]# festival
Festival Speech Synthesis System 1.4.1:release November 1999
Copyright (C) University of Edinburgh, 1996-1999. All rights reserved.
For details type '(festival_warranty)'
festival>

と出てくれば無事動作できました。おめでとうございます。

festival> (SayText "Hello")

と入力して動作するかどうか試してみてください（実は僕がインストールしたノートＰＣの音源は最新のものらしく、Linuxにドライバ自体がインストールされていない。今のところノートＰＣ上の音源直で使用する必要性が全く無いので調査もしていない。そのためこのコマンドでいいかは不明。レポートを望む）。

６．その他

6.1 テキストを読み上げさせたものをWAVEファイルに落とす。

echo "speech text" | text2wave -o speechtext.wav

とすれば、テキストを読み上げたものが、"speechtext.wav" ファイルに出来上がります。いったんWAVEファイルにしてしまえば、Windows環境でも読み上げたものを利用することができます。

6.2 音声が小さい場合。

普通くらいのボリュームでは、聞き取れないくらい音声が小さい。そのため以下のテキストを、
festival/lib/ に "siteinit.scm" というファイル名で新規書込みすれば聞き取りやすいボリュームになる。
このスクリプトを認識させるために、特別なコマンドを用いる必要はない。

      (set! default_after_synth_hooks
        (list
          (lambda (utt)
            (utt.wave.rescale utt 1.0 t))))

これについての原始情報はこちらです。
http://www.cstr.ed.ac.uk/cgi-bin/faq.cgi?bgcolor=white&boxcolor=&pagecolor=&background=/images/cstr_background.jpg

6.3 その他使用方法などのドキュメントは festdoc-1.4.0.1/ の下にHTML形式で存在するので、参考にしてください。

[ INDEX | FESTIVALのインストール | ウインドウズ用サウンド | FESTIVALオフィシャルサイト ]