Raspberry Pi 3で日本語音声を合成して喋らせる方法（AquesTalk編） (ラズパイ３で音声合成アプリ AquesTalk Piを使用してお手軽に日本語文章を喋らせる方法)

■ HOME

■ Security

■ Software

■ Hardware

■ FPGA

■ CPU

■ Android

■ Raspberry Pi

■ nLite

■ Xcode

■ etc.

■ ALL

■ LINK

■ BACK

・2016/04/10

Raspberry Pi 3で日本語音声を合成して喋らせる方法（AquesTalk編）

(ラズパイ３で音声合成アプリ AquesTalk Piを使用してお手軽に日本語文章を喋らせる方法)

Tags: [Raspberry Pi], [電子工作]

● Raspberry Pi 3 Model Bを遂に購入

　Raspberry Pi3 Model B RPI2 RPI3

　大人気の CPUボードの Raspberry Piに WiFiと Bluetoothが搭載されたモデルが新発売となりました。
　以前から Raspberry Pi 2を買おうかどうか迷っていましたが、Raspberry Pi 3 Model Bの発売を機に購入を決意してラズベリアンになる事にしました。

　※ ラズパイの OS Raspbianはバージョンが上がる毎に過去の版と OSの内部の作りが変わり、過去に書かれた製作記事（例えば Raspbian Wheezyの時代の記事）がそのままではエラーが出たりして動かない事が有ります。
　※ 当方のホームページのラズパイ記事は全て Raspberry Pi 3 Model Bと Raspbian Jessieの組み合わせで動作確認をしております。
（ただし、将来的に新しい Raspbian OSが出た場合に、当方の Raspbian Jessieを基にした内容がそのままでは動かない可能性が有ります。）
　※ 2017/08/16から Raspbian OSは Raspbian Jessieから Raspbian Stretchに変わりました。
　※ 2019/06/20から Raspbian OSは Raspbian Stretchから Raspbian Busterに変わりました。

Download Raspbian for Raspberry Pi

ちなみに、歴代のバージョンと名称は

Debian	コードネーム	年月	備考	（参考）Ubuntuでの該当名称
Debian 11	Bullseye	2021/08/14～	2021/11からラズパイにリリース	Focal Fossa 20.04 LTS ？
Debian 10	Buster	2019/06/20～	2019/06からラズパイ４対応	Bionic 18.04 LTS
Debian 9	Stretch	2017/08/16～	2018/03からラズパイ３Ｂ＋対応	Xenial 16.04 LTS
Debian 8	Jessie	2015～	2016/02からラズパイ３対応	Trusty 14.04 LTS
Debian 7	Wheezy	2013～2016
Debian 6.0	Squeeze	2011～2014
Debian GNU/Linux 5.0	Lenny	2009～2012

● Raspberry Pi 3 Model Bで日本語音声を合成して出力する

　まずは、音声出力のスピーカの動作の確認から。

　音声出力の音量の設定
$ alsamixer

　音声出力自動
$ amixer cset numid=3 0

　音声出力ヘッドホンジャック
$ amixer cset numid=3 1

　音声出力 HDMI
$ amixer cset numid=3 2
　※ HDMIから音声が出ない場合は config.txtの # hdmi_driver=2の行の #を取る。
　※行の先頭の #を取る。
# hdmi_driver=2
　を
hdmi_driver=2
　にする。

　スピーカーのテスト
$ speaker-test -t sine -f 800

　サウンドの再生確認
$ aplay /usr/share/sounds/alsa/Front_Center.wav
$ aplay /usr/share/sounds/alsa/Noise.wav

● Raspberry Pi 3 Model Bで AquesTalk Piを使用して日本語音声を合成して出力する

　日本語のTTS、Japanese Text to Speech

AquesTalk Pi 音声合成

　使用ライセンス：個人の非営利は無償で使用できます。

　wgetでアーカイブを取得して、解凍して AquesTalkPiを呼び出すだけで喋ります。

$ wget http://www.a-quest.com/download/package/aquestalkpi-20130827.tgz
$ tar xzvf aquestalkpi-20130827.tgz
$ cd aquestalkpi
$ ./AquesTalkPi "あいうえお漢字です。" | aplay
Playing WAVE 'stdin' : Signed 16 bit Little Endian, Rate 8000 Hz, Mono

$ ./AquesTalkPi
NAME
AquesTalkPi - Raspberry Pi用テキスト音声合成コマンド Ver.1.00

SYNOPSIS
AquesTalkPi [-h] [-s speed] [-g volume] [-b] [-v f1|f2]
[-k] [-t] [-o out.wav] [-f file | string]

DESCRIPTION
日本語のテキスト音声合成を行います。
標準出力にWAV形式の音声データを出力します。

OPTIONS
string
発声する文字列を指定します(UTF-8)。漢字も読めます。
音声記号列での指定も可能です(-k オプション)
音声記号列の詳細は、AquesTalk音声記号列仕様を参照。
スペース等を含む場合は ""で囲んで指定してください。
-f file
発声する文字列をファイルで指定するときに指定します。
先頭行だけしか処理しません。
stringを指定せず、且つ fileに - を指定したときは、
標準入力からの入力になります(pipe使用可能)。
-o file
WAVファイルとして出力するときにファイル名を指定します。
指定しないときは標準出力に出力されます。
-t
WAV形式音声データの代わりに音声記号列を出力します。
言語処理の結果を返します。
-k
発声する文字列が音声記号列の場合に指定します。
-v f1 | f2
声種を指定します。 f1:女声１(default) f2:女声２
-b
棒読み(アクセントが平板）になります。
-g volume
音量を指定します。 (0-100) default:100
-s speed
発話速度を指定します。 (50-300) default:100
-h
このメッセージを表示します。

EXAMPLE
$ ./AquesTalkPi 漢字も読めます。 | aplay
$ echo ゆっくりしていってね？ | ./AquesTalkPi -b -f - | aplay
$ ./AquesTalkPi -s 150 -v f2 -k -o out.wav "ファイルニ、シュツ'リョクシマ_ス。"

*実行時にはAquesTalkPiと同じディレクトリに付属の/aq_dic以下が必要です。

LICENCE, etc.
商用利用、再配布には別途ライセンス契約(有償)が必要です。
ライセンス、その他につきましては、下記サイトを参照ください。
http://www.a-quest.com/products/aquestalkpi.html

---- COPYRIGHT 2013 AQUEST Corp. ----

●英語の音声合成

RPi Text to Speech (Speech Synthesis)
　を参考にしました。

● Festival Text to Speech

$ sudo apt-get -y install festival
$ echo "Please note that these documents are a work in progress." | festival --tts

● Espeak Text to Speech

$ sudo apt-get -y install espeak
$ espeak -ven+f3 -k5 -s150 "Please note that these documents are a work in progress."

● Pico Text to Speech

$ sudo apt-get -y install libttspico-utils
$ pico2wave -w sample.wav "Please note that these documents are a work in progress." && aplay sample.wav

●中国語の音声合成

　Ekho(余音) - 中文语音合成软件(支持粤语、普通话)
Ekho - Chinese text-to-speech software

GitHub hgneng/ekho

How to Install Ekho (for Linux and Raspberry Pi)

$ sudo apt-get -y install libsndfile1-dev libpulse-dev libncurses5-dev libestools2.1-dev festival-dev libmp3lame-dev
$ wget http://jaist.dl.sourceforge.net/project/e-guidedog/Ekho/6.5/ekho-6.5.tar.xz
$ tar xJvf ekho-6.5.tar.xz
$ cd ekho-6.5
$ ./configure --enable-festival
$ make CXXFLAGS=-DNO_SSE
$ sudo make install
$ ekho "hello 123 树莓派中文语音合成"
$ ekho -h

Ekho text-to-speech engine.
Version: 6.5

Syntax: ekho [option] [text]
-v, --voice=VOICE
        Specified language or voice. ('Cantonese', 'Mandarin', 'Hakka', 'Tibetan', 'Ngangien' and 'Hangul' are available now. Mandarin is the default language.)
-l, --symbol
        List phonetic symbol of text. Characters' symbols are splited by space.
-f, --file=FILE
        Speak text file. ('-' for stdin)
-o, --output=FILE
        Output to file.
-t, --type=OUTPUT_TYPE
        Output type: wav(default), ogg or mp3
-p, --pitch=PITCH_DELTA
        Set delta pitch. Value range from -100 to 100 (percent)
-a, --volume=VOLUME_DELTA
        Set delta volume. Value range from -100 to 100 (percent)
-r, --rate=RATE
        Set delta rate (this scales pitch and speed at the same time). Value range from -50 to 100 (percent)
-s, --speed=SPEED
        Set delta speed. Value range from -50 to 300 (percent)
--server
        Start Ekho TTS server.
--request=TEXT
        Send request to Ekho TTS server.
--port
        Set server port. Default is 2046.
--version
        Show version number.
-h, --help
        Display this help message.

Please report bugs to Cameron Wong (hgneng at gmail.com)

● pa_simple_new() failed: Connection refusedエラーが出る場合

　実行時に pa_simple_new() failed: Connection refusedエラーが出る場合は、

$ ./ekho "hello 123"
pa_simple_new() failed: Connection refused
pa_sample_spec(format=3,rate=16000,channels=ch=1)
Fail to init audio stream.
Fail to init sound.

　pulseaudioを再インストールする。
$ sudo apt-get -y install pulseaudio

● googleの音声認識

　wave形式で録音して flac形式に変換して Google音声認識 APIに渡す。
　下記の www.google.com/speech-api/v1/recognizeは既に廃止となっているので使えない。

$ arecord -D "plughw:1,0" -d 5 file.wav
$ ffmpeg -i file.wav -ar 16000 -acodec flac file.flac
$ pacpl --overwrite -t flac file.wav
$ wget -q -U "Mozilla/5.0" -post-file file.flac -header "Content-Type: audio/x-flac; rate=16000" -O - "http://www.google.com/speech-api/v1/recognize?lang=zh-cn&client=chromium"

GitHub pranavrc/audio-transcribe
$ sudo apt-get -y install pacpl
$ wget https://github.com/pranavrc/audio-transcribe/raw/master/speech.py
$ wget https://github.com/pranavrc/audio-transcribe/raw/master/softkitty.wav
$ python ./speech.py softkitty.wav

softkitty.flac
Unable to connect

Reverse Engineering Google's Speech To Text API (v2)

Tags: [Raspberry Pi], [電子工作]

●関連するコンテンツ(この記事を読んだ人は、次の記事も読んでいます)

Raspberry Pi 3に USB Micを接続して日本語の音声認識をする方法（Julius編）
ラズパイ３で汎用大語彙連続音声認識エンジン Juliusをコンパイルして使用する方法

Raspberry Pi 3に PyAudioを入れて USBマイクを接続して音声入力を行なう方法
ラズパイに USB Micを接続して音声入力をする方法（PyAudio編）

Raspberry Pi 3に PortAudioを入れて USBマイクを接続して音声入力を行なう方法
ラズパイに USB Micを接続して音声入力をする方法（PortAudio編）

Raspberry Pi 3に日本語 OCR Tesseractをインストールして OCR文字認識をする方法
ラズパイ３でオープンソースの OCRエンジン Tesseractをインストールして使用する方法まとめ

Raspberry Pi 3に日本語 OCR NHocrをビルドして OCR文字認識をする方法
ラズパイ３でオープンソースの OCRエンジン NHocrをコンパイルして使用する方法まとめ

Raspberry Pi 3で日本語音声を合成して喋らせる方法（OpenJTalk編）
ラズパイ３で音声合成システム Open JTalkをコンパイルして、お手軽に日本語の文章を喋らせる方法

Raspberry Pi 3で音声合成して喋らせる方法（英語、中国語編）
ラズパイ３で音声合成アプリを使用してお手軽に英語と中国語の文章を喋らせる方法

Raspberry Pi 3に形態素解析エンジン MeCabをインストールして形態素解析をする方法
ラズパイ３でオープンソースの形態素解析エンジン MeCabをコンパイルして使用する方法まとめ

Raspberry Pi 3に Google Cloud Speech APIを入れて各国の言語で音声認識をする方法
ラズパイに Google Cloud Speech APIを設定する方法（Python言語編）

Raspberry Pi 3に Google Cloud Speech APIを入れて各国の言語で音声認識をする方法
ラズパイに Google Cloud Speech APIを設定する方法（Java言語編）

Raspberry Pi 3に Google Cloud Speech APIを入れて各国の言語で音声認識をする方法
ラズパイに Google Cloud Speech APIを設定する方法（Node.js言語編）

Raspberry Pi 3に AVSを入れて Amazon Echoを作る方法（Alexa Voice Service）
ラズパイを Amazon Echoにする方法、Alexa Voice Service AVSをインストール

Raspberry Piで docomo Developer APIに挑戦雑談対話 API編
ラズパイ + Javaでドコモの docomo Developer supportの雑談対話 APIを動かす

Raspberry Piで docomo Developer APIに挑戦音声合成 API編
ラズパイ + Javaでドコモの docomo Developer supportの音声合成 APIを動かす

Visual Studio 2013の C# .NETで日本語対応の OCR文字認識アプリを自作する方法
オフライン環境で動作可能な世界各国語対応の OCR文字認識アプリを C# .NETで作成、MS製 OCRライブラリを使用

Visual Studio 2013の C#で日本語対応の手書き文字認識アプリを自作する方法
オフライン環境で動作する世界各国語対応の手書き文字認識アプリを作成、MS製手書き認識ライブラリを使用

Windows 10の音声合成エンジンを使用して入力した文字列を喋る＆ Waveファイル書き出し
SpeechApp Windows 10用 Speech 音声合成 Text-to-Speech TTSのアプリ

Windows 10対応 Microsoft Speech使用の音声認識アプリ
SpeechRecognizeApp 音声認識エンジンを使用してマイク入力の音声を認識します

Windows 10対応の日本語対応の音声合成エンジン TTSアプリを C# .NETで自作する
Visual Studio 2013の C# .NETで入力した文字列を喋る音声合成 TTSアプリを作成する世界各国語に対応

[HOME] | [BACK]

リンクフリー(連絡不要、ただしトップページ以外は Web構成の変更で移動する場合があります)
Copyright (c) 2016 FREE WING,Y.Sakamoto
Powered by 猫屋敷工房 & HTML Generator

http://www.neko.ne.jp/~freewing/raspberry_pi/raspberry_pi_3_aquestalk_pi/