Raspberry Pi 3に USB Micを接続して日本語の音声認識をする方法（Julius編） (ラズパイ３で汎用大語彙連続音声認識エンジン Juliusをコンパイルして使用する方法)

■ HOME

■ Security

■ Software

■ Hardware

■ FPGA

■ CPU

■ Android

■ Raspberry Pi

■ nLite

■ Xcode

■ etc.

■ ALL

■ LINK

■ BACK

・2016/04/10

Raspberry Pi 3に USB Micを接続して日本語の音声認識をする方法（Julius編）

(ラズパイ３で汎用大語彙連続音声認識エンジン Juliusをコンパイルして使用する方法)

Tags: [Raspberry Pi], [電子工作]

● Raspberry Pi 3 Model Bを遂に購入

　Raspberry Pi3 Model B RPI2 RPI3

　大人気の CPUボードの Raspberry Piに WiFiと Bluetoothが搭載されたモデルが新発売となりました。
　以前から Raspberry Pi 2を買おうかどうか迷っていましたが、Raspberry Pi 3 Model Bの発売を機に購入を決意してラズベリアンになる事にしました。

　※ ラズパイの OS Raspbianはバージョンが上がる毎に過去の版と OSの内部の作りが変わり、過去に書かれた製作記事（例えば Raspbian Wheezyの時代の記事）がそのままではエラーが出たりして動かない事が有ります。
　※ 当方のホームページのラズパイ記事は全て Raspberry Pi 3 Model Bと Raspbian Jessieの組み合わせで動作確認をしております。
（ただし、将来的に新しい Raspbian OSが出た場合に、当方の Raspbian Jessieを基にした内容がそのままでは動かない可能性が有ります。）
　※ 2017/08/16から Raspbian OSは Raspbian Jessieから Raspbian Stretchに変わりました。
　※ 2019/06/20から Raspbian OSは Raspbian Stretchから Raspbian Busterに変わりました。

Download Raspbian for Raspberry Pi

ちなみに、歴代のバージョンと名称は

Debian	コードネーム	年月	備考	（参考）Ubuntuでの該当名称
Debian 11	Bullseye	2021/08/14～	2021/11からラズパイにリリース	Focal Fossa 20.04 LTS ？
Debian 10	Buster	2019/06/20～	2019/06からラズパイ４対応	Bionic 18.04 LTS
Debian 9	Stretch	2017/08/16～	2018/03からラズパイ３Ｂ＋対応	Xenial 16.04 LTS
Debian 8	Jessie	2015～	2016/02からラズパイ３対応	Trusty 14.04 LTS
Debian 7	Wheezy	2013～2016
Debian 6.0	Squeeze	2011～2014
Debian GNU/Linux 5.0	Lenny	2009～2012

● Raspberry Pi 3 Model Bで日本語音声を認識させる

　Juliusをラズパイでコンパイルして使用する方法の記事は既に他のサイトやブログで有りますが、新しい Raspbianではそのままでコンパイルできなかったり使用できなかったりしたので、ラズパイ３の最新の Raspbian Jessieでも確実に Juliusをコンパイルして動作させる方法をまとめました。
　※ Raspbian 8 Jessie 2016-03-18版で確認
　※以前のバージョンの Raspbian 7 Wheezyや Raspbian Squeezeでは手順が異なる所が有る。

　まずは、音声入力のマイクの動作の確認から。
　なお、マイク入力は USB接続の物を使用しました。

　下記の C-Mediaが USB接続のマイクデバイス
$ lsusb
Bus 001 Device 004: ID 0d8c:013c C-Media Electronics, Inc. CM108 Audio Controller
Bus 001 Device 003: ID 0424:ec00 Standard Microsystems Corp. SMSC9512/9514 Fast Ethernet Adapter
Bus 001 Device 002: ID 0424:9514 Standard Microsystems Corp.
Bus 001 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub

　デバイスのカード番号とデバイス番号を確認（card 1 device 0）
$ arecord -l
**** List of CAPTURE Hardware Devices ****
card 1: Device [USB PnP Sound Device], device 0: USB Audio [USB Audio]
Subdevices: 1/1
Subdevice #0: subdevice #0

　マイクの音量を確認する（card 1なので -c 1を指定する）
$ amixer sget Mic -c 1
Simple mixer control 'Mic',0
Capabilities: cvolume cvolume-joined cswitch cswitch-joined
Capture channels: Mono
Limits: Capture 0 - 16
Mono: Capture 0 [0%] [0.00dB] [on]

　マイクの音量を設定する
$ amixer sset Mic 16 -c 1
Simple mixer control 'Mic',0
Capabilities: cvolume cvolume-joined cswitch cswitch-joined
Capture channels: Mono
Limits: Capture 0 - 16
Mono: Capture 16 [100%] [23.81dB] [on]

　必要に応じてマイクデバイスを設定する（card 1 device 0なので 1,0を指定する）
$ export ALSADEV="plughw:1,0"
$ echo $ALSADEV

　マイクの入力を WAVE形式で WAVファイルに 48kHzステレオサンプリングで 5秒間保存する（-d5で 5秒、-fdatで DAT品質 48kHz ステレオ）
$ arecord -M -d5 -twav -fdat test.wav -D plughw:1
　※なぜか -fcdで CD音質（44.1kHzサンプリングにすると -d5の指定が無視される）

　マイクの入力をスピーカに出力する（ 1秒程度の遅延が有る）
$ arecord -f S16_LE -r 44100 -D hw:1 | aplay
　Ctrl+Cで終了

・USB接続のマイク

・USB接続のマイク

B07BF7BNN5,サンワサプライ USBマイクロホン無(全)指向性フラット型 MM-MCU06BK

今回購入

B073QPLKRN,携帯便利超小型USBマイク PC Mac用ミニUSBマイク

B097PDXG2K,エレコム PCマイク USB 直挿しフレキシブルアームミュートボタン付き LED搭載ブラック HS-MC08UBK

B01HGGX5RK,エレコムマイク USBマイク切り替えスイッチ付きブラック HS-MC05UBK

　汎用大語彙連続音声認識エンジン Julius

　音声認識エンジン Juliusのラズパイ３対応のコンパイルと動作確認の手順

汎用大語彙連続音声認識エンジン Julius - OSDN

　音声認識エンジン
　julius-master.zip 2016/03/07版
$ cd
$ wget https://github.com/julius-speech/julius/archive/master.zip
$ mv master.zip julius-master.zip
$ unzip julius-master.zip
$ cd julius-master
$ ./configure --with-mictype=alsa
$ make

configure: error: no ALSA header!
configure: error: ./configure failed for libsent
　のエラーの場合は下記のコマンドでライブラリをインストールする。
$ sudo aptitude install libasound2-dev

****************************************************************
Julius/Julian libsent library rev.4.3.1:

- Audio I/O
    primary mic device API   : alsa (Advanced Linux Sound Architecture)
    available mic device API : alsa
    supported audio format   : RAW and WAV only
    NetAudio support         : no
- Language Modeling
    class N-gram support     : yes
- Libraries
    file decompression by    : zlib library
- Process management
    fork on adinnet input    : no

  Note: compilation time flags are now stored in "libsent-config".
        If you link this library, please add output of
        "libsent-config --cflags" to CFLAGS and
        "libsent-config --libs" to LIBS.
****************************************************************

　./configure --with-mictype=alsaでコンパイルすれば下記のエラーが出ません。
### read waveform input
Stat: adin_oss: device name = /dev/dsp (application default)
Error: adin_oss: failed to open /dev/dsp
failed to begin input stream

　また、
export AUDIODEV=/dev/dsp1
　の設定も不要です。

　ただし、
### read waveform input
ALSA lib confmisc.c:768:(parse_card) cannot find card '0'
　のエラーが出た場合は
export ALSADEV="plughw:1,0"
　等の設定は必要です。

　ディクテーションデータ（音声認識辞書）
　dictation-kit-master.zip 2015/11/04版 252.95M
$ cd
$ wget https://github.com/julius-speech/dictation-kit/archive/master.zip
$ mv master.zip dictation-kit-master.zip
$ unzip dictation-kit-master.zip
$ cd ./dictation-kit-master
$ ~/julius-master/julius/julius -C main.jconf -C am-gmm.jconf -nostrip

　「こんにちは」とマイクに喋ると（PuTTY等のターミナルの文字設定を UTF-8にしておく）

pass1_best:  こんにちは 。
pass1_best_wordseq: <s> こんにちは+感動詞 </s>
pass1_best_phonemeseq: silB | k o N n i ch i w a | silE
pass1_best_score: -3433.026123
### Recognition: 2nd pass (RL heuristic best-first)
STAT: 00 _default: 11107 generated, 1102 pushed, 208 nodes popped in 143
sentence1:  こんにちは 。
wseq1: <s> こんにちは+感動詞 </s>
phseq1: silB | k o N n i ch i w a | silE
cmscore1: 0.729 0.596 1.000
score1: -3443.561768

<<< please speak >>>

Tags: [Raspberry Pi], [電子工作]

●関連するコンテンツ(この記事を読んだ人は、次の記事も読んでいます)

Raspberry Pi 3に PyAudioを入れて USBマイクを接続して音声入力を行なう方法
ラズパイに USB Micを接続して音声入力をする方法（PyAudio編）

Raspberry Pi 3に PortAudioを入れて USBマイクを接続して音声入力を行なう方法
ラズパイに USB Micを接続して音声入力をする方法（PortAudio編）

Raspberry Pi 3に日本語 OCR Tesseractをインストールして OCR文字認識をする方法
ラズパイ３でオープンソースの OCRエンジン Tesseractをインストールして使用する方法まとめ

Raspberry Pi 3に日本語 OCR NHocrをビルドして OCR文字認識をする方法
ラズパイ３でオープンソースの OCRエンジン NHocrをコンパイルして使用する方法まとめ

Raspberry Pi 3で日本語音声を合成して喋らせる方法（AquesTalk編）
ラズパイ３で音声合成アプリ AquesTalk Piを使用してお手軽に日本語文章を喋らせる方法

Raspberry Pi 3で日本語音声を合成して喋らせる方法（OpenJTalk編）
ラズパイ３で音声合成システム Open JTalkをコンパイルして、お手軽に日本語の文章を喋らせる方法

Raspberry Pi 3で音声合成して喋らせる方法（英語、中国語編）
ラズパイ３で音声合成アプリを使用してお手軽に英語と中国語の文章を喋らせる方法

Raspberry Pi 3に形態素解析エンジン MeCabをインストールして形態素解析をする方法
ラズパイ３でオープンソースの形態素解析エンジン MeCabをコンパイルして使用する方法まとめ

Raspberry Pi 3に Google Cloud Speech APIを入れて各国の言語で音声認識をする方法
ラズパイに Google Cloud Speech APIを設定する方法（Python言語編）

Raspberry Pi 3に Google Cloud Speech APIを入れて各国の言語で音声認識をする方法
ラズパイに Google Cloud Speech APIを設定する方法（Java言語編）

Raspberry Pi 3に Google Cloud Speech APIを入れて各国の言語で音声認識をする方法
ラズパイに Google Cloud Speech APIを設定する方法（Node.js言語編）

Raspberry Pi 3に AVSを入れて Amazon Echoを作る方法（Alexa Voice Service）
ラズパイを Amazon Echoにする方法、Alexa Voice Service AVSをインストール

Raspberry Piで docomo Developer APIに挑戦雑談対話 API編
ラズパイ + Javaでドコモの docomo Developer supportの雑談対話 APIを動かす

Raspberry Piで docomo Developer APIに挑戦音声合成 API編
ラズパイ + Javaでドコモの docomo Developer supportの音声合成 APIを動かす

Visual Studio 2013の C# .NETで日本語対応の OCR文字認識アプリを自作する方法
オフライン環境で動作可能な世界各国語対応の OCR文字認識アプリを C# .NETで作成、MS製 OCRライブラリを使用

Visual Studio 2013の C#で日本語対応の手書き文字認識アプリを自作する方法
オフライン環境で動作する世界各国語対応の手書き文字認識アプリを作成、MS製手書き認識ライブラリを使用

Windows 10の音声合成エンジンを使用して入力した文字列を喋る＆ Waveファイル書き出し
SpeechApp Windows 10用 Speech 音声合成 Text-to-Speech TTSのアプリ

Windows 10対応 Microsoft Speech使用の音声認識アプリ
SpeechRecognizeApp 音声認識エンジンを使用してマイク入力の音声を認識します

Windows 10対応の日本語対応の音声合成エンジン TTSアプリを C# .NETで自作する
Visual Studio 2013の C# .NETで入力した文字列を喋る音声合成 TTSアプリを作成する世界各国語に対応

[HOME] | [BACK]

リンクフリー(連絡不要、ただしトップページ以外は Web構成の変更で移動する場合があります)
Copyright (c) 2016 FREE WING,Y.Sakamoto
Powered by 猫屋敷工房 & HTML Generator

http://www.neko.ne.jp/~freewing/raspberry_pi/raspberry_pi_3_julius/