HOME
  Security
   Software
    Hardware
  
FPGA
  CPU
   Android
    Raspberry Pi
  
nLite
  Xcode
   etc.
    ALL
  
English Translate 中文翻訳
LINK
BACK
 

2016/06/02

Raspberry Pi 3に日本語 OCR NHocrをビルドして OCR文字認識をする方法 Raspberry Pi 3に日本語 OCR NHocrをビルドして OCR文字認識をする方法

(ラズパイ3で オープンソースの OCRエンジン NHocrをコンパイルして使用する方法まとめ)

Tags: [Raspberry Pi], [電子工作]






● Raspberry Pi 3 Model Bを遂に購入

 Raspberry Pi3 Model B RPI2 RPI3

 大人気の CPUボードの Raspberry Piに WiFiと Bluetoothが搭載されたモデルが新発売となりました。
 以前から Raspberry Pi 2を買おうかどうか迷っていましたが、Raspberry Pi 3 Model Bの発売を機に購入を決意してラズベリアンになる事にしました。

 ※ ラズパイの OS Raspbianはバージョンが上がる毎に過去の版と OSの内部の作りが変わり、過去に書かれた製作記事(例えば Raspbian Wheezyの時代の記事)がそのままではエラーが出たりして動かない事が有ります。
 ※ 当方のホームページのラズパイ記事は全て Raspberry Pi 3 Model Bと Raspbian Jessieの組み合わせで動作確認をしております。
(ただし、将来的に新しい Raspbian OSが出た場合に、当方の Raspbian Jessieを基にした内容がそのままでは動かない可能性が有ります。)
 ※ 2017/08/16から Raspbian OSは Raspbian Jessieから Raspbian Stretchに変わりました。

Download Raspbian for Raspberry Pi

ちなみに、歴代のバージョンと名称は
Debianコードネーム年月備考
Debian 9Stretch2017/08/16~
Debian 8Jessie2015~2016/02からラズパイ3対応
Debian 7Wheezy2013~2016
Debian 6.0Squeeze2011~2014
Debian GNU/Linux 5.0Lenny2009~2012


● NHocrのコンパイル方法

NHocr: 日本語文字認識プログラム

cd
wget http://iij.dl.osdn.jp/nhocr/61902/nhocr-0.22.tar.gz
tar xvfz nhocr-0.22.tar.gz
cd ./nhocr-0.22/
./configure --prefix=/usr/local
make
sudo make install

cd test/
./run-test

fs.pgm: ファイルシステム
hello.pgm: ニんにちは、

tohoku.pgm: 東北

tohoku3.pgm:
# Character candidates table
#   produced by: NHocr - Japanese OCR  v0.22
IMG     0
R       1       東      0       0       2.4283356e+00
R       2       束      0       0       2.5794504e+00
R       3       京      0       0       2.7960027e+00
R       4       恵      0       0       2.8455623e+00
R       5       車      0       0       2.8773998e+00

IMG     1
R       1       北      0       0       1.9178933e+00
R       2       牝      0       0       3.1787773e+00
R       3       ft      0       0       3.3584956e+00
R       4       虻      0       0       3.4200158e+00
R       5       化      0       0       3.5008508e+00

IMG     2
R       1       \       0       0       0.0000000e+00
R       2       ∴       0       0       2.9960626e+00
R       3       ‥       0       0       3.4399795e+00
R       4       i       0       0       3.5661385e+00
R       5       …       0       0       3.6350114e+00

wget http://jaist.dl.osdn.jp/nhocr/61903/nhocr-0.18-dic-zh_CN-091226.tar.gz


----------------------------------------------------------------
  Simplified Chinese character dictionary pack for NHocr 0.18
    Rev. 091226
----------------------------------------------------------------

1. Introduction

This dictionary pack contains 3,754 frequently-used Simplified
Chinese characters plus some symbols.

2. Installation and configuration

1) After the installation of NHocr 0.18, copy the following
   files into the dictionary directory of NHocr, which is
   by default located at /opt/nhocr/dic .

     cctable-zh_CN
     PLM-zh_CN.dic

2) To use NHocr as a Chinese OCR, set the dictionary codes as
   follows.

  $ NHOCR_DICCODES=ascii+:zh_CN ; export NHOCR_DICCODES

   NHocr's built-in default is ascii+:jpn for ASCII and
   Japanese characters.


3. License

Licensed under the Apache License, Version 2.0 (the "License").
See http://www.apache.org/licenses/LICENSE-2.0

4. Authors

  Zhuguo Shi
  Hideaki Goto

For details:
  http://code.google.com/p/nhocr/
  http://sourceforge.jp/projects/nhocr/
--
Dec. 26, 2009  Hideaki Goto,  Tohoku University, Japan



Tags: [Raspberry Pi], [電子工作]


[HOME] | [BACK]
リンクフリー(連絡不要、ただしトップページ以外は Web構成の変更で移動する場合があります)
Copyright (c) 2016 FREE WING,Y.Sakamoto
Powered by 猫屋敷工房 & HTML Generator

http://www.neko.ne.jp/~freewing/raspberry_pi/raspberry_pi_3_ocr_nhocr/