HOME
  Security
   Software
    Hardware
  
FPGA
  CPU
   Android
    Raspberry Pi
  
nLite
  Xcode
   etc.
    ALL
  
English Translate 中文翻訳
LINK
BACK
 

[NEW] 2016/04/10

Raspberry Pi 3に USB Micを接続して日本語の音声認識をする方法(Julius編) Raspberry Pi 3に USB Micを接続して日本語の音声認識をする方法(Julius編)

(ラズパイ3で汎用大語彙連続音声認識エンジン Juliusをコンパイルして使用する方法)

Tags: [Raspberry Pi 3], [電子工作]






● Raspberry Pi 3 Model B

 Raspberry Pi3 Model B RPI2 RPI3

 大人気の CPUボードの Raspberry Piに WiFiと Bluetoothが搭載されたモデルが新発売となりました。
 以前から Raspberry Pi 2を買おうかどうか迷っていましたが、Raspberry Pi 3 Model Bの発売を機に購入を決意してラズベリアンになる事にしました。

 ※ ラズパイの OS Raspbianはバージョンが上がる毎に過去の版と OSの内部の作りが変わり、過去に書かれた製作記事(例えば Raspbian Wheezyの時代の記事)がそのままではエラーが出たりして動かない事が有ります。
 ※ 当方のホームページのラズパイ記事は全て Raspberry Pi 3 Model Bと Raspbian Jessieの組み合わせで動作確認をしております。


● Raspberry Pi 3 Model Bで日本語音声を認識させる

 Juliusをラズパイでコンパイルして使用する方法の記事は既に他のサイトやブログで有りますが、新しい Raspbianではそのままでコンパイル出来なかったり使用出来なかったりしたので、ラズパイ3の最新の Raspbian Jessieでも確実に Juliusをコンパイルして動作させる方法をまとめました。
 ※ Raspbian 8 Jessie 2016-03-18版で確認
 ※以前のバージョンの Raspbian 7 Wheezyや Raspbian Squeezeでは手順が異なる所が有る。

 まずは、音声入力のマイクの動作の確認から。
 なお、マイク入力は USB接続の物を使用しました。

 下記の C-Mediaが USB接続のマイクデバイス
$ lsusb
Bus 001 Device 004: ID 0d8c:013c C-Media Electronics, Inc. CM108 Audio Controller
Bus 001 Device 003: ID 0424:ec00 Standard Microsystems Corp. SMSC9512/9514 Fast Ethernet Adapter
Bus 001 Device 002: ID 0424:9514 Standard Microsystems Corp.
Bus 001 Device 001: ID 1d6b:0002 Linux Foundation 2.0 root hub

 デバイスのカード番号とデバイス番号を確認(card 1 device 0)
$ arecord -l
**** List of CAPTURE Hardware Devices ****
card 1: Device [USB PnP Sound Device], device 0: USB Audio [USB Audio]
Subdevices: 1/1
Subdevice #0: subdevice #0

 マイクの音量を確認する(card 1なので -c 1を指定する)
$ amixer sget Mic -c 1
Simple mixer control 'Mic',0
Capabilities: cvolume cvolume-joined cswitch cswitch-joined
Capture channels: Mono
Limits: Capture 0 - 16
Mono: Capture 0 [0%] [0.00dB] [on]

 マイクの音量を設定する
$ amixer sset Mic 16 -c 1
Simple mixer control 'Mic',0
Capabilities: cvolume cvolume-joined cswitch cswitch-joined
Capture channels: Mono
Limits: Capture 0 - 16
Mono: Capture 16 [100%] [23.81dB] [on]

 必要に応じてマイクデバイスを設定する(card 1 device 0なので 1,0を指定する)
$ export ALSADEV="plughw:1,0"
$ echo $ALSADEV

 マイクの入力を WAVE形式で WAVファイルに 48kHzステレオサンプリングで 5秒間保存する(-d5で 5秒、-fdatで DAT品質 48kHz ステレオ)
$ arecord -M -d5 -twav -fdat test.wav -D plughw:1
 ※なぜか -fcdで CD音質(44.1kHzサンプリングにすると -d5の指定が無視される)

 マイクの入力をスピーカに出力する( 1秒程度の遅延が有る)
$ arecord -f S16_LE -r 44100 -D hw:1 | aplay
 Ctrl+Cで終了



 汎用大語彙連続音声認識エンジン Julius

 音声認識エンジン Juliusのラズパイ3対応のコンパイルと動作確認の手順

汎用大語彙連続音声認識エンジン Julius - OSDN

 音声認識エンジン
 julius-master.zip 2016/03/07版
$ cd
$ wget https://github.com/julius-speech/julius/archive/master.zip
$ mv master.zip julius-master.zip
$ unzip julius-master.zip
$ cd julius-master
$ ./configure --with-mictype=alsa
$ make

configure: error: no ALSA header!
configure: error: ./configure failed for libsent
 のエラーの場合は下記のコマンドでライブラリをインストールする。
$ sudo aptitude install libasound2-dev

****************************************************************
Julius/Julian libsent library rev.4.3.1:

- Audio I/O
    primary mic device API   : alsa (Advanced Linux Sound Architecture)
    available mic device API : alsa
    supported audio format   : RAW and WAV only
    NetAudio support         : no
- Language Modeling
    class N-gram support     : yes
- Libraries
    file decompression by    : zlib library
- Process management
    fork on adinnet input    : no

  Note: compilation time flags are now stored in "libsent-config".
        If you link this library, please add output of
        "libsent-config --cflags" to CFLAGS and
        "libsent-config --libs" to LIBS.
****************************************************************

 ./configure --with-mictype=alsaでコンパイルすれば下記のエラーが出ません。
### read waveform input
Stat: adin_oss: device name = /dev/dsp (application default)
Error: adin_oss: failed to open /dev/dsp
failed to begin input stream

 また、
export AUDIODEV=/dev/dsp1
 の設定も不要です。

 ただし、
### read waveform input
ALSA lib confmisc.c:768:(parse_card) cannot find card '0'
 のエラーが出た場合は
export ALSADEV="plughw:1,0"
 等の設定は必要です。

 ディクテーションデータ(音声認識辞書)
 dictation-kit-master.zip 2015/11/04版 252.95M
$ cd
$ wget https://github.com/julius-speech/dictation-kit/archive/master.zip
$ mv master.zip dictation-kit-master.zip
$ unzip dictation-kit-master.zip
$ cd ./dictation-kit-master
$ ~/julius-master/julius/julius -C main.jconf -C am-gmm.jconf -nostrip

 「こんにちは」とマイクに喋ると(PuTTY等のターミナルの文字設定を UTF-8にしておく)

pass1_best:  こんにちは 。
pass1_best_wordseq: <s> こんにちは+感動詞 </s>
pass1_best_phonemeseq: silB | k o N n i ch i w a | silE
pass1_best_score: -3433.026123
### Recognition: 2nd pass (RL heuristic best-first)
STAT: 00 _default: 11107 generated, 1102 pushed, 208 nodes popped in 143
sentence1:  こんにちは 。
wseq1: <s> こんにちは+感動詞 </s>
phseq1: silB | k o N n i ch i w a | silE
cmscore1: 0.729 0.596 1.000
score1: -3443.561768

<<< please speak >>>



Tags: [Raspberry Pi 3], [電子工作]

●関連するコンテンツ(この記事を読んだ人は、次の記事も読んでいます)

大人気の CPUボード、Raspberry Pi 3 Model Bで作ってみよう
大人気の CPUボード、Raspberry Pi 3 Model Bで作ってみよう

  Raspberry Piの開発環境の構築やタッチパネル付き液晶ディスプレイや各種センサーの使い方まとめ

Raspberry Pi Zero Wを海外通販の Pimoroni等での購入方法、購入出来る通販ショップ一覧まとめ
Raspberry Pi Zero Wを海外通販の Pimoroni等での購入方法、購入出来る通販ショップ一覧まとめ

  ラズパイゼロW Pi Zero Wirelessモデルを海外通販で先行して購入し、サクッと入手する方法

Raspberry Pi3で安定して使える相性の無い microSDカードのまとめ
Raspberry Pi3で安定して使える相性の無い microSDカードのまとめ

  ラズパイ3で安定して使える microSDカードを購入する Teamと SanDiskは絶対に買わない

Raspberry Pi 3の Linuxコンソール上で使用する各種コマンドまとめ
Raspberry Pi 3の Linuxコンソール上で使用する各種コマンドまとめ

  ラズパイの Raspbian OSのコマンドラインで使用する便利コマンド、負荷試験や CPUシリアル番号の確認方法等も

Raspberry Pi 3公式フォーラムの FAQの内容の日本語訳
Raspberry Pi 3公式フォーラムの FAQの内容の日本語訳

  ラズパイ公式フォーラムの「The Raspberry Pi 3 Model B Q&A thread」の日本語訳

Raspberry Pi 3で GPIO端子の I2C機能を有効化する方法
Raspberry Pi 3で GPIO端子の I2C機能を有効化する方法

  ラズパイ3の GPIO端子の I2C機能を有効にして各種センサーを繋げる方法まとめ


Raspberry Pi 3、シングルボードコンピュータ ラズパイ3 Raspberry Pi関連はこちらへまとめました
 下記以外にも多数のラズパイ関係の記事が有ります。
 (I2C制御、GPIO制御、1-Wire制御、シリアル通信、日本語音声合成、日本語音声認識、中国語音声合成、MeCab 形態素解析エンジン、赤外線リモコン制御、秋月 I2C液晶モジュール、KeDei 3.5インチ液晶、HDMI 5インチ液晶、NFCカードリーダ、コマンドライン操作方法等)
Raspberry Pi 3に HDMI接続の 800x480 5インチ TFT液晶を接続して使用する方法
Raspberry Pi 3 Jessieで LIRC機能を使って学習リモコン、赤外線リモコンを送受信する方法
Raspberry Pi 3の WiFiを無線LANアクセスポイント化 hostapd + dnsmasq編
Raspberry Pi 3の Bluetoothで ブルテザで通信する方法(Bluetooth編)
Raspberry Pi 3で日本語音声を合成して喋らせる方法(Open JTalk編)
Raspberry Pi 3に USB Micを接続して日本語の音声認識をする方法(Julius編)
Raspberry Pi 3の GPIOに LEDとスイッチを接続して Lチカする方法
Raspberry Pi 3の GPIOに LEDとスイッチを接続してシャットダウンボタンを実装する方法
Raspberry Pi 3で GPIO端子の I2C機能を有効化する方法
Raspberry Pi 3の GPIOに I2C通信方式の気圧計 BMP280を接続する方法
Raspberry Pi 3に I2C通信方式の NFCリーダライタ PN532を接続して NFC FeliCaカードを読む方法
Raspberry Pi 3でネットワーク ライブカメラを構築する方法 Motion編
Raspberry Pi 3でネットワーク ライブカメラを構築する方法 MJPG-streamer編
Raspberry Pi 3 Model Bで動画処理アプリ FFmpegをコンパイルする方法
Raspberry Pi3の X-Window Systemに Windowsのリモートデスクトップから接続する方法
Raspberry Pi3に WebRTCの STUN/TRUNサーバと PeerJSサーバをインストールする方法


Espressif ESP8266 Arduino互換でスケッチが使える ESP-12Eモジュール基板
Espressif ESP8266 Arduino互換でスケッチが使える ESP-12Eモジュール基板

  Espressif ESP8266 ESP-12-E NodeMCU V1 ESP12 CP2102

BangGood通販はドローン以外にも面白い商品がまだまだ有った(電子工作編)
BangGood通販はドローン以外にも面白い商品がまだまだ有った(電子工作編)

  レーザー彫刻機、カラー液晶の DIYオシロ、Arduinoや Raspberry Pi用の小型カラー液晶



[HOME] | [BACK]
リンクフリー(連絡不要、ただしトップページ以外はweb構成の変更で移動する場合があります)
Copyright (c) 2016 FREE WING, Y.Sakamoto
Powered by 猫屋敷工房 & HTML Generator

http://www.neko.ne.jp/~freewing/raspberry_pi/raspberry_pi_3_julius/