WO1995017734A1

WO1995017734A1 - Procede et appareil destines a la reconnaissance de structures et procede de compilation d'un dictionnaire en vue de la reconnaissance de structures

Info

Publication number: WO1995017734A1
Application number: PCT/JP1994/002160
Authority: WO
Inventors: Takao Kobayashi
Original assignee: Birds Systems Research Institute, Inc.
Priority date: 1993-12-21
Filing date: 1994-12-20
Publication date: 1995-06-29
Also published as: JPH07182453A; EP0686933A4; CA2156521A1; EP0686933A1; US5689584A; JP2937729B2; KR960701413A; KR100242458B1

Description

明細書パターン認識方法及び装置並びにパターン認識用辞書作成方法技術分野

本発明は、所定の辞書を参照して入力された文字や各種パ夕一ンを認識するパターン認識方法及び装置、並びにそれに用いるパターン認識用辞書の作成方法に関する。背景技術

一般的に、文字、数字、各種パターン等を認識するためのパターン認識は、標準のパターンを格納した辞書を用い、読み取ったパ夕ーンと辞書のパターンとを照合することにより行われている。したがって、認識対象とされる文字、数字、各種パターン等の種類が多くなると、それらを格納する辞書が大型化し、それに伴って認識処理時間が長くなるという問題がある。そこで、パターン認識の所要時間を短縮することが要望されている。

従来技術に係るパターン認識方法には、パターン照合による方法. 特徴点抽出による方法等がある。パターン照合による方法は、例えば、印刷文字や手書き文字等をスキャナ等により光学的に読み取り. パターン認識用辞書に格納された複数の標準パターンと照合し、類似度が最大となる標準パターンの名称を入力パターンの名称と判定するものである。

また、特徴点抽出による方法は、例えば、文字の各部の垂直方向及び水平方向の分布や文字素片と隣接文字素片との関係等を文字の特徴として記録した辞書をあらかじめ作成しておき、読み取った文字についても同様に特徴点を求め、それぞれの特徴点を比較して、類似度が最大となる特徴点に対応する文字を読み取り文字と判定するものである。

さらに、ニューロコンピュータを用いたパターン認識方法も知られている。このパターン認識方法は、例えば、認識すべき文字、数字、各種パターン等の二次元パターンを構成するドットにそれぞれ対応するニューロからなる入力層と、認識出力に対応するニュー口からなる出力層と、それらの間の重みづけによる接続を行う中間層とを有し、バックプロパゲ一ション則等によって中間層の重みづけを調整し、学習完了により、入力層に入力されたパターンに対して出力層からパターン名称等の認識結果を出力するものである。

従来のパターン照合による認識方法においては、入力パターンの大きさや位置等と、辞書に格納されている標準パターンの大きさや位置等とを同等とするための前処理を必要とし、かつ、入力パターンと辞書に格納されている全標準バタ一ンとを照合する必要があり- したがって、前処理と照合処理とに要する時間が長くなるという欠点があった。

また、特徴点抽出による認識方法においては、認識すべき文字のすべての特徴点について比較する必要があり、かつ、文字、数字、各種パターンのそれぞれに対する特徴点の数が膨大となる。そのため、高い認識率を得ようとすれば辞書が大型化するという問題があり、結果として認識処理時間が長くなるという欠点があった。

また、標準パターンと共にゴシック体ゃイタリツク体等の文字種が混在している文字、数字等の場合においては、各文字種毎にパ夕一ン照合又は特徴点の抽出 · 比較を行う必要があり、同一文字名に対して各文字種に対応する数の照合又は比較等の処理が必要となり . 認識に要する時間が長くなるという欠点があった。また、逐次比較を行う代わりに、大分類を行って認識すべきパターン種類を絞り込むことが考えられているが、認識率を低下させないように大分類を行うための最適な手段が実現されていない。

また、ニューロコンピュータを用いたパターン認識方法は、学習を 1 0〜数 1 0 0 0回繰り返す必要があり、かつ、認識可能なパ夕一ン数も少ないので、現在は実用化されていない。

かかる実情に鑑み、本発明の目的は、辞書作成時間を短縮し、多数の文字種が混在するような場合でも認識処理時間を短縮し、かつ, 認識率の向上を図った、パターン認識方法及び装置並びに辞書作成方法を提供することにある。また、本発明の更なる目的は、認識処理においてすべてのカテゴリーに対する類似度が得られるようにする ^-とにある。発明の開示

本発明に係るパターン認識方法は、（a) 入力パターンの認識対象領域を N個の領域に分割し、それぞれに対応する分割領域番号を付与して、 N個の分割領域を作成するステップと；（b) 該 N個の分割領域の各々に対して、所定の基準に従って特徴量を算出し、該 N個の特徴量を要素とする特徴べクトルを作成するステップと；（c) 該特徴べクトルの N個の要素の中の最大のもの又は最小のものを検索し、該検索された要素に対応する 1個の分割領域番号からなる第 1 の特徴集合を作成し、次いで、最大のもの又は最小のものから順に 2個を検索し、該検索された 2個の要素に対応する 2個の分割領域番号の組み合わせからなる第 2の特徵集合を作成し、以下同様にして（N— 1 ) 個の分割領域番号の組み合わせからなる第（N— 1 ) の特徴集合まで作成することにより、合計（N— 1 ) 個の特徴集合を作成するステップと；（d) 前記ステップ（a) から（c) までを予め各種の手本パターンに対して実施して得られた特徵集合を該手本パターンのカテゴリ一名とともに記録した辞書を参照することにより . 該入力パターンの特徴集合と該辞書内の特徴集合との類似度をカテゴリ一名対応に求め、該類似度が最大となるカテゴリ一名を該入力パターンのカテゴリ一名と判定するステップと；を具備する。

また、本発明に係るパターン認識装置は、認識されるべきパ夕一ンを入力するパターン入力手段と；入力されたパターンの認識対象領域を N個の領域に分割し、それぞれに対応する分割領域番号を付与して、 N個の分割領域を作成する手段と；該 N個の分割領域の各々に対して、所定の基準に従って特徴量を算出し、該 N個の特徴量を要素とする特徴べクトルを作成する手段と；該特徴べクトルの N 個の要素の中の最大のもの又は最小のものを検索し、該検索された要素に対応する 1個の分割領域番号からなる第 1 の特徴集合を作成し、次いで、最大のもの又は最小のものから順に 2個を検索し、該検索された 2個の要素に対応する 2個の分割領域番号の組み合わせからなる第 2の特徴集合を作成し、以下同様にして（N— 1 ) 個の分割領域番号の組み合わせからなる第（N— 1 ) の特徴集合まで作成することにより、合計（N— 1 ) 個の特徴集合を作成する手段と前記パターン入力手段、分割領域作成手段、特徴べクトル作成手段. 及び特徴集合作成手段を予め各種の手本パターンに対して適用して得られた特徵集合を該手本パターンのカテゴリ一名とともに記録した辞書を記憶する手段と；該入カバターンの特徴集合と該辞書内の特徴集合との類似度をカテゴリ一名対応に求め、該類似度が最大となるカテゴリ一名を該入力パターンのカテゴリ一名と判定する手段と；を具備する。

また、本発明に係るパターン認識用辞書作成方法は、（a) 入力された手本パターンの認識対象領域を N個の領域に分割し、それぞれに対応する分割領域番号を付与して、 N個の分割領域を作成するステツプとパ (b) 該 N個の分割領域の各々に対して、所定の基準に従つて特徴量を算出し、該 N個の特徴量を要素とする特徴べクトルを作成するステップと；（c) 該特徴べクトルの N個の要素の中の最大のもの又は最小のものを検索し、該検索された要素に対応する 1個の分割領域番号からなる第 1 の特徴集合を作成し、次いで、最大のもの又は最小のものから順に 2個を検索し、該検索された 2個の要素に対応する 2個の分割領域番号の組み合わせからなる第 2の特徵集合を作成し、以下同様にして（N— 1 ) 個の分割領域番号の組み合わせからなる第（N— 1 ) の特徵集合まで作成することにより、合計（N— 1 ) 個の特徴集合を作成するステップと (d) 該特徵集合の各々と該手本パターンのカテゴリ一名とを対応させて所定のメモリに格納するステップと；を具備する。図面の簡単な説明

図 1 は、本発明の原理を説明するための図である。

図 2は、本発明の一実施例に係るパターン認識装置のハードゥエァ構成を示すプロック図である。

図 3 A、 3 B及び 3 Cは、特徴ベクトルの抽出について説明するための図である。

図 4 A、 4 B及び 4 Cは、特徴ベクトルの概要を説明するための図である。

図 5は、パターン認識用辞書を説明するための図である。

図 6は、パターン認識用辞書のデータ構造を説明するための図であ Q ₀

図 7は、辞書データの圧縮について説明するための図である。図 8は、特徴べクトル作成処理の手順を示すフローチヤ一トであ O 図 9 〜 1 3は、入力パターンのドットの重みづけ処理の手順を示すフローチヤ一トである。

図 1 4 A , 1 4 B , 1 4 C， 1 4 D , 1 4 E及び 1 4 Fは、ノ、。夕一ンが重みづけ処理により変化する様子を例示する図である。

図 1 5は、入力パターンを例示する図である。 ^ 図 1 6は、図 1 5に示される入力パターンを重みづけ処理して得られるパターンを示す図である。

図 1 7は、図 1 4 Fに示されるパターンに対する分割領域内ドット計測処理に関し、各領域に配分されるドットの値を説明するための図である。

図 1 8は、図 1 7に示されるドットの配分についてのドット計測処理により得られる特徴べクトルを示す図である。

図 1 9及び 2 0は、分割領域内ドット計測処理の手順を示すフ口一チヤ一トである。

図 2 1 〜 2 3は、辞書作成処理の手順を示すフローチヤ一トである

図 2 4及び 2 5は、入力パターン認識処理の手順を示すフローチヤートである。

図 2 6及び 2 7は、辞書サーチ処理の手順を示すフローチヤ一トである。発明を実施するための最良の形態

本発明をより詳細に説述するために、添付の図面に従ってこれを説明する。

図 1 は、本発明の原理を説明するための図である。本発明に係るパターン認識装置は、基本的には、この図に示すように、パターン入力部 1 と、パターン認識用辞書 2 と、パターン認識処理部 3 とから構成される。パターン入力部 1 は、パターンの読取りが可能なスキヤナにより構成されるか、又は画像データを格納したメモリにより構成される。また、パターン認識用の辞書 2は、片仮名、平仮名，漢字等の文字名、数字名、星印等の各種パターン名より得られる特徴集合をそのカテゴリー名と対応付けてメモリに格納した構成を有する。なお、辞書 2には、同一カテゴリ一名に属する複数の文字種について手本パターンから特徴集合を求めて格納することができる ₍ この手本パターンの追加をする必要がない場合は、リードオンリメモリ（R O M ) によって辞書 2を形成することも可能である。また, パターン認識処理部 3は、マイクロプロセッサ等の演算処理機能を用いて、パターン入力部 1 からの入力パターンから、辞書 2の作成時と同様な処理によって特徴集合を求め、この入力パターンの特徴集合と辞書 2に格納された特徴集合との類似度をカテゴリ一名対応に求め、類似度が最大となるカテゴリ一名を入力パターンのカテゴリー名と判定する処理を行うものである。

図 2は、本発明の一実施例に係るパターン認識装置のハ一ドゥエァ構成を示すブロック図である。この図において、符号 1 0は、汎用マイクロプロセッサからなる C P Uを示す。符号 1 1 は、 C P U 1 0のプログラム及びバタ一ン認識用辞書を格納する R O Mを示す, 符号 1 2は、 C P U 1 0の演算 ·制御処理過程における一時的なデ一夕を格納する R A Mを示す。符号 1 3は、光学的手段で認識対象のパターンを走査するスキャナを示し、符号 1 4は、そのスキャナに対する制御回路を示す。符号 1 5は、パターン認識用辞書、パ夕一ン認識結果等をフアイルとして格納するハードディスク装置を示し、符号 1 6 は、そのハードディスク装置に対する制御回路を示す, 符号 1 7は、同様にそのようなファイルを格納するフレキシブルデイスク装置を示し、符号 1 8は、そのフレキシブルディスク装置に対する制御回路を示す。符号 1 9 は、パターン認識処理結果等をプリントァゥトするためのプリン夕装置を示し、符号 2 0は、そのプリンタ装置に対する制御回路を示す。 C P U 1 0、 R OM 1 1、 R AM I 2並びに制御回路 1 4、 1 6、 1 8及び 2 0は、システムバス 3 0によって接続される。い.

パターン認識用辞書について説明する。かかる辞書は、例えばパターンスキャナ 1 3を介して入力した手本パターンについて、特徵集合を求め、文字名、数字名、パターン名等のカテゴリ一名と対応させてその特徴集合をメモリ（例えば、 R OM 1 1 ) に格納したものである。かかる特徵集合は、特徴べクトルから求められる。また. その特徴べクトルは、手本パターンの認識対象領域を等面積若しくは等ドット数となるように N個に分割し、各分割領域のドット数ゃ面積等を要素とするか、又は手本パ夕一ンより N個の他の特徴量を求めて要素とするものである。この特徴ベクトル Vは、

V = { V 1 , V 2 , V 3 , ···, V i , ···, V N } … 1 ) と表すことができる。

そして、特徴べクトル Vの要素 V , 〜 v _N の大きいものから順に. 又は小さいものから順に、 I個（ I = 1 〜N— 1 ) を選ぶ。選ばれた I個の要素のべクトル上の位置（これは分割領域の番号に一致する。）を要素とする集合を特徴集合 T , と称する。 I = 1〜N_ 1 として、（N— 1 ) 個の特徴集合が作成されることとなる。この (N - 1 ) 個の特徴集合 T , を I の順番に並べた列 Τ , , Τ₂ , ー, ΤΝ-, を特徴集合列と称する。例えば、（ 1 ) 式において各要素が大きいものから順に配列されているとした場合、すなわち V , , V V 3 , …， V _Ν の順に小さくなるとした場合、 I = 1 に対応する特徵集合は { 1 } 、 I = 2に対応する特徴集合は { 1 , 2 } 、 1 = 3 に対応する特徴集合は { 1 , 2 , 3 } 、以下同様にして最後に、 I =N— 1 に対応する特徴集合は { 1 , 2， 3 , ···, Ν - 1 } となる < このように計（Ν— 1 ) 個の特徴集合が得られる。この各特徴集合と手本パターンのカテゴリ一名とを対応させてメモリに格納することにより、パターン認識用辞書が作成される。

例えば、図 3 Αに示す文字「A」について、認識対象領域が X ドット X Yドットで構成される場合において、縦に 4等分、横に 4等分するときには、 1 6個の等面積の分割領域が形成される。そして. 各分割領域に領域番号 1〜 1 6を付与し、文字部分を黒として、各分割領域内の黒ドット数を計数する。この計数値をそれぞれ V , 〜 V ₁₆とすると、（ 1 ) 式の特徴べクトル Vが得られる。そして V 1 〜v ₁₆の中から大きいものから順に順次 I (= 1〜N— 1 ) 個を選ぶ。次いで、選ばれた I個のべクトル要素に対応する I個の分割領域番号を要素とする特徴集合 Τ, ( I = 1〜N— 1 ) を求める。これらを Iの順番に並べた集合の列 T, 〜T_N-i ( = T, 〜T₁₅) を特徴集合列とする。

この文字「A」について、分割領域内の黒ドット数が大きいものから順に領域番号 1〜 1 6を並べたとき、

6, 7, 10, 11, 13, 16, 2, 3, 9,12， 5, 8, 14, 15, 1, 4 であるとすると、特徵集合列〜T₁₅は、

Τ, = {6 }

Τ₂ = {6,7}

Τ 3 = {6， 7, 10}

Τ ₄ = {6, 7, 10, 11}

Τ ₅ = {6， 7, 10, 11, 13}

Τ ₁₅= {1,2,3,5, 6, 7, 8， 9， 10, 11， 12, 13, 14， 15, 16} となる。これらをカテゴリ "τ名 A,と対応付けてメモリに格納する。また、図 3 Bは、黒ドット数が同一となるように、認識対象領域を先ず縦に分割し、次に各分割領域についても、黒ドット数が同一となるようにそれぞれ横に分割し、各分割領域に領域番号 1〜 2 0 を付与した場合を示す。そして、各分割領域の面積をそれぞれ V , 〜v₂。とすると、（ 1 ) 式の特徴べクトル Vが得られる。そして、面積の大きいものから順に、或いは面積の小さいものから順に、順次 I (= 1〜N— 1 ) 個を選ぶ。次いで、選ばれた I個のベクトル要素に対応する I個の分割領域番号を要素とする特徴集合 T , ( I = 1〜N— 1 ) を求める。これらを Iの順番に並べた集合の列 T , 〜！^ ( = T, 〜Τ₁₉) を特徴集合列とする。

また、図 3 Cは、同心円と放射方向の線とによってパターンの認識対象領域を分割した例を示す。この例においては、分割領域内の黒ドット数を計数し、一番外側の 8個の領域について計数値の一番大きいものの領域の番号を 1 とし、そこを基準位置として順に領域番号 2〜 2 4を付与し、各領域の黑ドット数を計数して 2 4個の要素からなる特徴べクトルを作成する。そして、上位又は下位から順に、 1個、 2個、 …、 2 3個の特徴ベクトル要素を選ぶ。選ばれた I個のべクトル要素に対応する I個の分割領域番号を要素とする特徵集合 Τ , ( Ι = 1〜Ν— 1 ) を求める。これらを Iの順番に並べた集合の列 Τ, 〜Τ_Ν-, ( = Τ, 〜Τ₂₃) を特徵集合列とする。この方式も、各種のパターンについて認識を行う場合に適用することができる。

次に、ドットの重みづけ処理について説明する。図 3 Αにおいて横のドット数を Xとし、縦のドット数を Yとした X XY ( ドット）のパターン認識対象領域について、

f (X, y) e { 0 , 1 } … （ 2 ) l o ここで、 0≤ xく X_s 0≤ y < Y. x, は整数

と定義する。従って、関数 f (x,y) は格子点を表すことになる。また、（ 2 ) 式を実数上に拡張し、

f (X, y) _R e { 0 , 1 } - ( 3 ) ここで、 0≤ x <X, 0≤ y < Y . χ， yは実数

と定義する。従って、関数 f (x,y) は格子点間も表すことになる。また、点（x,y) を輪郭点とすると、その点（x,y) の極く近くに f (x,y) ≠ f (χ' ,γ' ) となる点（x' ,y' ) が存在する。即ち、極く近い点（x,y) ， (x'.y') について f (x,y) ≠ f (χ',γ') である点は輪郭点である。

また、点（x，y) から最も近い輪郭点までの距離を d (x,y，f) と表し、区間 [0，X)， [0, Y) をそれぞれ η_χ , η _Ύ 等分し、 n_x x n _r =N個の分割領域を形成し、特徴べクトル Vの要素 V i を、

V i = f_Ri ( 2 ■ f(x,y)- 1 ) xd(x，y，f) dxdy … ( 4 ) と表すことができる。但し、 R iは長方形の分割領域で、

JJ_Ri ( ) dxdyはその長方形の分割領域の面積分を示す。また、 1 ≤ i ≤ Nである。

前述の（ 4 ) 式の（ 2 · f (X, y) — 1 ) は、 f (x, y) が 0又は 1 であるから、 f (X, y) = 1のときは 1、 f (X, y) = 0のときは一 1 となる。すなわち、（ 4 ) 式は、最も近い輪郭点からの距離に応じて、重み付けして特徴べクトル Vの要素を求める場合を示すものである。そして、前述のように、特徴べクトル Vを求め、要素 V の大きいものから順に、或いは小さいものから順に、順次 I (= 1 〜N— 1 ) 個を選ぶ。そして、選ばれた I個のべクトル要素に対応する I個の分割領域番号を要素とする特徴集合 T , ( I = 1〜N— 1 ) を求める。これらを Iの順番に並べた集合の列 Τ, 〜Τ_Ν— , を特徴集合列とする。図 4 A、 4 B ,び.4 Cは、特徴べクトルの概要を説明するための図であり、それぞれ次元 Nを 4 とした特徴べクトル Vの要素を示す < 図中の（ 1 ) 〜（ 4 ) は、分割領域番号を示す。図 4 A、 4 B及び 4 Cにそれぞれ示された特徴ベクトルを V a， V b , V c とすると-

V a = ( 5 0, 0 0 , 1 0 0， 2 0 0，一 1 0 )

V b = ( 3 0 , 2 9 , 2 8 , 2 7 )

V c = (— 3，一 2， — 1 , - 4 )

となる。

特徴べクトル V aの中の大きいものから順に、順次 1〜N— 1個- 即ち、 1個、 2個、 3個を選び、特徴集合 T a , 、 T a ₂ 、 T a ₃ を求めると、

T a , = { 1 }

T a 2 = { 1 , 3 }

T a a = { 1 , 2 , 3 }

となる。同様に、特徴べクトル V bから特徴集合を求めると、

T b , = { 1 }

T b 2 = { 1 , 2 }

T b 3 = { 1 , 2 , 3 }

となる。また、特徴べクトル V cから特徴集合を求めると、

T c a = { 3 }

T c 2 = { 2 , 3 }

T c 3 = { 1 , 2 , 3 }

と 7よる。

次に、例えば、カテゴリ一名「Α」，「 B」について、複数種類の印刷文字、手書き文字等の各手本パターンを 4種類入力し、認識領域を 6個に分割し（すなわち、特徴べクトルの次元を 6 とする） . 分割領域番号を 1〜 6 として、それぞれの分割領域のドット数を計数した結果、次のようになった場合を仮定する

領域番号 1 2 3 4 5 6

II V A l = ( 100, 90, 80， 70, 60, 50)

V A 2 = ( 40， 50， 45, 33, 35, 34)

V A 3 = ( 1980, 12, 2000, 1， 0, 2)

V A 4 = ( 96, 95, 94， 99, 98, 97)

V B l = ( 24, 22, 30, 32, 28, 26)

V B 2 = ( 24, 22， 64, 60 52, 56)

V B 3 = ( 154, 155, 175, 174, 165， 164)

V B 4 = ( -60， - 5, -4, -3， -2， -1)

特徴べクトル V A l 〜V A 4 ， V Β 1 〜V B 4から作成される特徴集合列 T A l 〜T A 4 , T B ト Τ Β 4は、特徴べクトルの要素の大きいものから順に、 1個、それと次の要素との 2個というように、順次要素を 1 〜 5個選択し、その選択された要素に対応する領域番号を組合せたものであり、

TA1= {1} , {1,2} , {1,2, 3} , {1,2, 3,4} ， {1,2, 3, 4, 5}

TA2= {2} , {2,3} , {1,2, 3} , {1,2,3, 5} ， {1,2, 3, 5, 6}

ΤΑ3= {3} , {1, 3} , {1,2,3} , {1,2, 3, 6} , {1,2, 3, 4, 6}

{4, 5} ， {4, 5, 6} ， 11, 4, 5, 6} ， {1,2, 4, 5, 6}

ΤΒ1= {4} , {3, 4} , {3, 4, 5} ， {3,4, 5, 6} , {1, 3, 4, 5, 6}

ΤΒ2= {3} , {3, 4} , {3, 4, 6} ， {3,4, 5, 6} , {1,3,4, 5, 6}

ΤΒ3= {3} , {3, 4} , {3, 4, 5} , {3, 4,5, 6} ， {2, 3, 4, 5, 6}

ΤΒ4= {6} , {5, 6} , {4, 5, 6} ， {3, 4, 5, 6} , {2, 3, 4, 5, 6} となる。

これらの特徴集合とカテゴリ一名とを対応させてメモリに格納することにより、辞書が作成される。図 5は、上述の例に基づく辞書の一部を示す。例えば、特徴集合 { 3 } は、カテゴリ一名「AJ , 「 B J :に'共通であることを示している。このように、辞書は、手本パターンより特徴集合を作成し、特徴集合とカテゴリー名とを対応させてレコードを作成し、そのレコードを特徴集合の順番に並べるものである。そして、 1 つの特徴集合に対して複数のカテゴリ一名が対応するのを可能とする。したがって、辞書作成に要する時間は. 手本パターン数に比例した時間で済み、辞書作成のための所要時間を従来例に比較して大幅に短縮することができる。また、手本バターンを追加するときも、辞書の一部を修正、追加するだけで済むから、簡単に追加することができる。また、このような辞書構造を有することにより、パターン認識処理における所要時間を短縮することが可能となる。

図 6は、パターン認識用辞書のデータ構造を説明するための図であり、カテゴリ一名をビット位置で表現した場合の例である。前述のように、同一の特徴集合に対して、異なるカテゴリ一名 L X , , L X 2 が対応するとき、カテゴリ一名 L X , , L X 2 の論理和をとつて辞書に格納するカテゴリ一名 L X ' とすることができる。このような処理を行うことにより、認識すべきカテゴリ一名の個数と等しいビット数のビット列で表されるカテゴリ一名と特徴集合との組合せによって辞書の 1 レコードが形成されることになる。また、特徴集合 T Xについても、特徴べクトルの要素位置すなわち分割領域番号を、分割領域数に等しいビット数のビット列におけるビット位置で表現することができる。例えば、前述の 6分割の場合における " 1 " 〜 " 6 " の各要素は、それぞれ 6 ビットのビット列におけるビット位置で表現され、その場合、特徵集合 { 2 , 3 } は、 " 0 0 0 1 1 0 " と表現される。

図 6に示す、特徴集合 T Xとカテゴリ一名 L Xとを対応させた辞書は、分割領域数 = 6、カテゴリ一数 = 1 0の例を示すものである, 例えば、特徴集合 TX = 1 ("000001") にはカテゴリ一名 L X = 2 ("0000000010") が対応し、この場合、 1個のカテゴリ一名が対応することになる。特徴集合 TX = 2 ("000010") にはカテゴリ一名 L X = 5 ("0000000101") が対応し、 " 1 " のビット位置で示される二つのカテゴリ一名が対応することになる。

なお、カテゴリ一数が多く、すなわちカテゴリー名 L Xのビット数が多くなる場合は、各種のデータ処理に適用されているデータの圧縮復元技法を適用することができる。例えば、図 7に示すように、 L Xデ一夕を並べ換え、重複するものを削除することにより圧縮して、新たな L Xデータを作成する。そして、 Τ Χの値と L Xデ一夕へのポインタ情報とを組とするテーブルを作成する。また、認識処理に差し支えなければ、これらのテーブルをさらに圧縮してもよい。

また、特徴集合 ΤΧをァドレスによって表現することができる。その場合、例えば、図 6における Τ X = し 2 , 3 , 5， ···， 6 3 は、アドレス 1 , 2 , 3 , 5 , ···, 6 3 として表現され、アドレス 1 には L X = 2、アドレス 2には L X = 5 というように格納し、また、アドレス 4 には対応するカテゴリ一名 L Xがないため、ァドレス 4には L X = 0を格納する。

次に、特徴ベクトルの具体的な作成手順について説明する。図 8 は、特徴べクトル作成の処理手順を示す概略フローチヤ一トである, この特徴べクトル作成ルーチンは、後に説明する辞書作成処理及び入力パターン認識処理において呼び出されるものである。なお、特徵べクトル作成処理は、個々のパターン認識システムの用途等に応じて各種の変形例を採用できるものであり、以下の実施例は、代表的なものを示す。

まず、パターンデータについて重みづけを行うか否かを判定する (ステップ i 0 2 ) 。重みづけを行う場合には、パターンデータのドットの重みづけ処理（ステップ 1 0 4 ) を行ってから、その重みづけ処理されたドットについての計測処理を行う（ステップ 1 0 6 ) また、重みづけを行わない場合には、直ちに、パターンデータのドットの計測処理を行う（ステップ 1 0 6 ) 。以上が特徴べクトル作成処理の概略である。次に、重みづけ処理及び計測処理の詳細について説明する。

図 9〜 1 3は、重みづけ処理のフローチャートを示し、図 8のステツプ 1 0 4 における処理の一例である。まず、変数 I (認識領域内のドット位置を指定する）に 0を代入する（ステップ 2 0 2 ) 。次いで、入力バタ一ンの認識領域の横のドット数を X、縦のドット数を Yとして、 Iが X X Yより小さいか否か、すなわち I が認識領域内の最終ドット位置以下を指しているか否かを判定する（ステツプ 2 0 4 ) 。 I ≥ X X Yの場合にはステップ 2 1 0に移行し、 I く X x Yの場合はステップ 2 0 6に移行する。

ステップ 2 0 6においては、入力パターン P 〔 I 〕に所定の中間値 MIDDLEVAL を乗算して、重みづけされたパターン Q 〔 I〕を作成する。なお、この入力パターン P 〔 I〕は、例えば、白ドットを

" 0 " 、黑ドットを " 1 " としたものである。したがって、中間値を " 1 6 " とすると、黒の " 1 " のドットが " 1 6 " の値に重みづけされる。次いで、 I をインクリメントして（ス.テツプ 2 0 8 ) 、ステップ 2 0 4 にループバックする。この中間値は、白（ " 0 " ) の領域が重みづけの結果、最終的に負の値となることを回避するように選定することが演算処理上望ましく、本実施例においてもそのために " 1 6 " に設定される。しかし、これに限定きれるものではない。

全ての Iすなわち全ドットについてステップ 2 0 6の処理が終了し、ステップ 2 0 4 において I = X X Yが成立すると、ステップ 2 1 0 (図 1 0 ) に移行する。例えば、図 1 4 Aに示すような入力パターン P 〔 I 〕 (X = 9 , Y= l l すなわち 1 = 0〜9 8 ) が入力されたときには、ステップ 2 1 0実行時点において図 1 4 Βに示すパターン Q 〔 I 〕が作成されている。なお、図 1 4 Αにおいて、

" 1 " は黒ドット、 "0 " は白ドットを示す。

ステップ 2 1 0においては、中間値 MIDDLEVAL を変数 Jに代入する。次いで、変数 I に 0を代入し、所定のフラグ F L Gを 0に設定する（ステップ 2 1 2 ) 。次いで、 I と X X Yとを比較する（ステップ 2 1 4 ) 。 I = X x Yの場合にはステップ 2 3 8に移行し、 I く X X Υの場合にはステップ 2 1 6に移行する。ステップ 2 1 6では、 Q 〔 I 〕と 0 とを比較し、 Q 〔 I 〕 ≠ 0の場合にはステップ 2 3 6 に移行し、 Q 〔 I 〕 = 0の場合にはステップ 2 1 8に移行する。ステップ 2 1 8では、 Ι — Χと 0 とを比較し、 I — Xく 0の場合にはステップ 2 2 2に移行し、 I — X≥ 0の場合にはステップ 2 2 0に移行する。ステップ 2 2 0では、 Q 〔 Ι — Χ〕と J とを比較し、 Q C I - X) = Jの場合にはステップ 2 3 4 に移行し、 Q C I - X) ≠ Jの場合にはステップ 2 2 2に移行する。すなわち、処理中のドットの値 Q 〔 I 〕が 0でその一つ上のドットの値 Q 〔 I 一 X〕が J に等しいときには、 Q 〔 I〕を変更すべくステップ 2 3 4に移行すステップ 2 2 2では、 I + Xと X x Yとを比較し、 I + X≥ X x Υの場合にはステップ 2 2 6に移行し、 Ι + Χく Χ Χ Υの場合にはステップ 2 2 4 に移行する。ステップ 2 2 4では、 Q 〔 Ι + Χ〕と J とを比較し、 Q 〔 I + X〕 = Jの場合にはステップ 2 3 4に移行し、 Q 〔 I + X〕 ≠ Jの場合にはステップ 2 2 6に移行する。すなわち、処理中のドットの値 Q 〔 I 〕が 0でその一^ D下のドットの値 Q 〔 I + X〕が Jに等しいときには、 Q 〔 I〕を変更すべくステツプ 2 3 4に移行する。

また、ステップ 2 2 6 (図 1 1 ) では、 I ZXの余りすなわち I %Xと 0 とを比較し、余りが 0の場合すなわち I %X = 0の場合にはステップ 2 3 0に移行し、余りが 0でない場合すなわち I % X≠ 0の場合にはステップ 2 2 8に移行する。なお、 " " は、 C言語における剰余（モジュロ）演算子である。ステップ 2 2 8では、 Q 〔 1 — 1〕と Jとを比較し、 Q 〔 I 一 1〕 = Jの場合にはステップ 2 3 4に移行し、 Q 〔 1 — 1〕 ≠ Jの場合にはステップ 2 3 0に移行する。すなわち、処理中のドットの値 Q 〔 I〕が 0でその左隣のドットの値 Q 〔 I 一 1〕が Jに等しいときには、 Q 〔 I〕を変更すベくステップ 2 3 4に移行する。

ステップ 2 3 0では、 I ZXの余りすなわち I %Xと X— 1 と比較し、 I %X = X— 1の場合にはステップ 2 3 6に移行し、 I %X ≠X- 1の場合にはステップ 2 3 2に移行する。ステップ 2 3 2では、 Q 〔 1 + 1〕と Jとを比較し、 Q 〔 1 + 1〕 = Jの場合すなわち Q 〔 I〕の右隣が Jと等しい場合にはステップ 2 3 4に移行し、 Q 〔 I + 1〕 ≠ Jの場合にはステップ 2 3 6に移行する。すなわち. 処理中のドットの値 Q 〔 I〕が 0でその右隣のドットの値 Q C I + 1〕が Jに等しいときには、 Q 〔 I〕を変更すべくステップ 2 3 4 に移行する。

ステップ 2 3 4においては、 Q 〔 I〕に J一 1を代入し、かつ、フラグ F L Gを " 1 " にセットする。これは、入力パターンの白と黒との境界線に隣接した白ドッ卜の重みづけを J— 1の値（最初は. 1 6 - 1 = 1 5 ) とすることを意味する。

また、ステップ 2 3 6では、次のドットに関して上述の処理を実行すべく、変数 Iの値をインクリメントしてステップ 2 1 4にル一プバックする。

全てのドットに関して以上の処理が完了し、ステップ 2 1 4において I = X X Yが成立すると、ステップ 2 3 8に移行する。前述の図 1 4 Bのパターンは、第 1回目のステップ 2 3 8実行時点において図 1 4 Cに示すように変化しており、境界線に隣接した白ドット部分には "1 5 " がセットされている。

ステップ 2 3 8では、フラグ F L Gが "0 " か否かを判定する。フラグが "1 " である場合には、 Jをデクリメントして（ステップ 2 4 0 ) 、ステップ 2 1 2にループバックする。ステップ 2 3 8においてフラグ F L Gが " 0 " であることは、前述の図 1 4 Cを例にして言えば、図 1 4 Dまで処理がなされたことを意味する。そして、その場合には、ステップ 2 4 2に移行する。

ステップ 2 4 2 (図 1 2 ) においては、変数 Jに中間値 MIDDLEVAL を代入する。次のステップ 2 4 4では、変数 Iに横のドット数 Xを代入するとともに、フラグ F L Gを "0" とする。次いで、ステツプ 2 4 6においては、 I と X X Y— Xとを比較し、 I =X xY— X の場合にはステップ 2 6 6に移行し、 I く XxY— Xの場合にはステツプ 2 4 8に移行する。ステップ 24 8では、 Q 〔 I〕と Jとを比較し、 Q 〔 I〕 = Jの場合にはステップ 2 5 0に移行し、 Q 〔 I〕 ≠ Jの場合にはステップ 2 6 4に移行する。

ステップ 2 5 0では、 Q 〔 I—X〕と Jとを比較し、 Q 〔 I—X〕く Jの場合にはステップ 2 6 4に移行し、 Q 〔 I一 X〕 ≥ Jの場合すなわち Q 〔 I〕の一つ上のドットが変数 Jと等しい場合にはステップ 2 5 2に移行する。

ステップ 2 5 2では、 Q 〔 I +X〕と Jとを比較し、 Q 〔 I +X〕 < Jの場合にはステップ 2 6 4に移行し、 Q 〔 I +X〕 ≥ Jの場合すなわち Q 〔 I〕の一つ下のドットが変数 Jと等しい場合にはステップ 2 5 4に移行する。

ステップ 2 5 4では、 I /Xの余りすなわち I % Xと 0とを比較し、 I %X= 0の場合にはステップ 2 6 4に移行し、 I %X≠ 0の場合にはステップ 2 5 6に移行する。ステップ 2 5 6 (図 1 3) では、 Q 〔 1— 1〕と Jとを比較し、 Q C ί - Π く Jの場合にはステツプ 2 6 4に移行し、 Q 〔 I一 1〕 ≥ Jの場合すなわち Q 〔 I〕の左隣が Jと等しい場合にはステツプ 2 5 8に移行する。

ステップ 2 5 8では、 I ZXの余りすなわち I %Xと X— 1 とを比較し、 I %X = X— 1の場合にはステップ 2 6 4に移行し、 1 % X≠ X - 1の場合にはステツプ 2 6 0に移行する。ステップ 2 6 0 では、 Q 〔 1 + 1〕と Jとを比較し、 Q 〔 1 + 1〕く Jの場合にはステップ 2 6 4に移行し、 Q 〔 1 + 1〕 ≥ Jの場合すなわち Q 〔 I〕の右隣が Jと等しい場合にはステップ 2 6 2に移行する。

ステップ 2 6 2では、 Q 〔 I〕並びにその一つ上、一- 5下、左隣及び右隣の全てが Jに等しいため、 Q 〔 I〕に J+ 1を代入する。すなわち、変数 Jの値が 1 6 (最初の値）のときには、 Q 〔 I〕に 1 7を代入する。そして、フラグ F L Gを 1 とし、ステップ 2 6 4 に移行する。

ステップ 2 6 4では、次のドットに関し同様の処理を実行すベく、変数 Iをインクリメントして、ステップ 2 4 6にループバックする。

ステップ 2 4 6において最初に I = X X Y— Xが成立するときには、前述の図 1 4 Dを例にして言えば、図 1 4 Eに示すパターンにまで重みづけ処理が進行している。

ステップ 2 6 6では、フラグ F L Gが "0 " か否かを判定し、 "0" でない場合には Jをインクリメントして（ステップ 2 6 8 ) 、ステップ 2 4 4にループバックする。また、ステップ 2 6 6でフラグ F L Gが "0 " である場合には、前述の図 1 4 Eのパターンが最終的な図.1. 4 Fのパターンにまで処理されたことを意味し、本重みづけ処理を終了する。このようにして、入力パターン P 〔 I〕（図 1 4 A) から、白と黒との境界線からの距離に従って重みづけされたパターン Q 〔 I〕（図 1 4 F) を得ることができる。

図 1 5は、図 1 4 Aよりもドット数の多い更なる入カバターンの例であり、その図においては、英字 Tに相当する入力パターン P

〔 I〕が示されている。この入力パターン P 〔 I〕について前述の重みづけ処理（中間値 MIDDLEVAL を 1 6 とする）を実施すると、処理結果は、図 1 6に示すものとなる。すなわち、入力パターン P 〔 I〕の "1 " の領域の境界からの距離に応じて 1 7， 1 8 , 1 9 の重みづけが行われ、また、 "0 " の領域の境界からの距離に応じて 1 5， 1 4 , ···， 7 , 6の重みづけが行われることになる。

次に、入力パターン又は重みづけ処理後のパターンから特徴べクトルを求めるために実施する、分割領域内のドットの計測処理（図 8のステップ 1 0 6 ) について、その処理手順を詳細に説明する。この計測処理は、認識対象領域を複数に分割することにより作成された分割領域内の黒のドット数又は重みづけされたドットの値の加算処理を行うものである。

なお、横のドット数 Xを横の分割数 VXで割ったときに整数と成らない場合、及び縦のドット数 Yを縦の分割数 VYで割ったときに整数とならない場合については、境界線にかかるドットの値を面積に比例して各領域に配分する。そして、その計算においては、小数点以下の計算をしなくても済むように、境界線上のドットの値を面積比に応じて除算する代わりに、境界線上にないドットの値を VX XVY倍して数えるようにする。その結果、求められた特徴べクトル Vの値は、 VX XV Y倍されているが、大小関係だけがわかればよいので、そのまま使用することができる。例えば、図 1 4 Fのパターン（X= 9 , Y= l l ) を VX= 2, VY= 3 として,分割する場合には、図 1 7に示すようなデータについて加算処理を実行することとなり、図 1 8に示される特徴べクトルが得られる。

そのような計測処理の具体的な処理手順は、図 1 9及び 2 0のフローチャートに示される。まず、変数 Iを 0 とし（ステップ 3 0 2 ) I と N (N =特徴べクトルの次元）とを比較し（ステップ 3 0 4 ) 、 I = Nの場合にはステップ 3 1 0に移行し、 I く Nの場合にはステップ 3 0 6に移行する。ステップ 3 0 6では、特徴べクトル Vの要素 V 〔 I〕に 0を代入し、次のステップ 3 0 8では、 Iをインクリメントしてステップ 3 0 4にループバックする。すなわち、ステツプ 3 0 4 , 3 0 6及び 3 0 8により、特徴べクトル Vの各要素 V 〔 I〕を初期状態の 0 とする。

ステップ 3 1 0では、変数 Jを 0 とする。次のステップ 3 1 2では、 J = Yx VYか否かを判定する。なお、 VYは認識領域の縦の分割数、 VXは横の分割数を示し、従って、特徴べクトルの次元 N は、 N = VX xVYとなる。 J = YXVYの場合には、本計測処理を終了する。 J <Y xVYの場合には、変数 Iを 0 とし（ステップ 3 1 4 ) 、 1 = か否かを判定し（ステップ3 1 6 ) 、 1 = X xVXの場合にはステップ 3 2 2に移行し、 I く X XVXの場合はステップ 3 1 8に移行する。

ステップ 3 1 8では、式

V[(J/Y)*VX+ I/X]*-V[(J/Y)*VX+ I/X] + Q[(J/VY)*X+ I/VX] による演算を実行する。これは、前述のように、横のドット数 Xを横の分割数 VXで割った時に整数とならない場合、及び縦のドット数 Yを縦の分割数 VYで割った時に整数とならない場合について考慮して加算処理を行うものである。

そして、ステップ 3 2 0では、 Iをインクリメントしてステップ 3 1 6にル一プバックする。また、ステップ 3 2 2では、 Jをインクリメントして、ステップ 3 1 2にループバックする。

以上の処理により、分割数 VX, V Yで X X Yの認識領域內を分割した場合の各分割領域におけるドット数又は重みづけされたドットの値が加算されることとなる。例えば、図 1 4 Fのパターン（X = 9 , Y= l 1 ) を VX = 2， VY= 3 として分割する場合には、図 1 7に示すようなデータについての加算処理が実行されて、その結果、図 1 8 に示される特徴ベクトルが得られることが容易に理解されるであろう。

次に、前述の特徴べクトル作成処理を使用して辞書を作成する手順について説明する。図 2 1〜 2 3は、かかる辞書作成処理の手順を示すフローチャートである。なお、特徴べクトル Vの次元数は N であり、本ルーチンは、図 6に示すように、特徴集合 TXとカテゴリー名 L Xとからなるレコードを複数個格納した辞書を作成するものである。

まず、レコードのアドレスを指定するカウンタ C NTをクリアして " 0 " とする（ステップ 4 0 2 ) 。次に、パターンファイル（例えば、ハードディスク 1 5に格納されている）をオープンする（ステツプ 4 0 4 ) 。次に、そのファイル内の全てのパターンデータについて処理を完了したか否かを判定する（ステップ 4 0 6 ) 。

完了していない場合には、手本パターンのパターンデータを 1 つ取り出す（ステップ 4 0 8 ) 。そして、所定の変数 C O D Eに、当該カテゴリ一名と 1対 1 に対応する、 0〜： L— 1 の内の 1つの数値をセットする（ステップ 4 1 0 ) 。ここで、 Lはカテゴリ一名の数である。そして、前述の手順により、 N個の要素からなる特徴べクトル Vの作成処理を行う（ステップ 4 1 2 ) 。手本パターンの特徴べクトルが作成されると、特徵集合 Tに初期値の 0を代入し（ステップ 4 1 4 ) 、変数 Iを 0 とする（ステップ 4 1 6 ) 。

次いで、 I と N— 1 とを比較し（ステップ 4 1 8 ) 、 I =N— 1 の場合（すなわち、後述するステップ 4 3 4における Iのインクリメントの結果、 I =N— 1 となった場合）にはステップ 4 0 6にループバックし、 I く N— 1の場合にはステップ 4 2 0に進む。

ステップ 4 2 0では、変数 MAX Jを 0 とし、かつ、 Jを 1 としてステップ 4 2 2へ進む。ステップ 4 2 2では、 Jと Nとを比較し、 J =Nの場合にはステップ 4 3 0に移行し、 J <Nの場合にはステップ 4 2 4に移行する。ステップ 4 2 4においては、特徴べクトル Vの要素 V 〔J〕と今までの最大値 V (MAX J) とを比較し、 V 〔J〕 > V CM A X J ) の場合にはステップ 4 2 6に進み、 V 〔J〕 ≤ V 〔M A X J〕の場合にはステップ 4 2 8に進む。ステップ 4 2 6においては、今回の要素 V 〔J〕が前回までの最大値 V CMAX J〕より大きいため、変数 MAX Jに現在の Jの値を代入し、ステップ 4 2 8に進む。ステップ 4 2 8では、 Jをインクリメントしてステップ 4 2 2にループバックする。

ステップ 4 3 0においては、次に最大の要素を探すときに今回検索された最大の要素が検出されないように V 〔MAX J〕に一 1を代入する。なぜならば、本実施例の特徴ベクトル作成処理においては、前述したように、べクトルの要素が負の値をとらないようにされているからである。また、特徴集合 Tの第 MAX J番目のビットを 1 とする。ただし、最下位ビット（L S B) をビット 0 とする。この処理は、 C言語のビット処理用演算子の 1つである左シフト演算子 " < < " を使用すれば、

T T+ ( 1 < <MAX J)

で表される。

次のステップ 4 3 2においては、こうして求められた特徴集合 T を特徴集合テーブル TX 〔CNT〕の内容とする。また、第 C OD E番目のビットを 1 とし（ただし、最下位ビット（ L S B ) をビット 0 とする。）、他のビットを 0 としたビット列をカテゴリー情報テーブル L X CCNT) の内容とする。これらの処理は、下の式で示される。

TX 〔CNT〕 — T

L X 〔CNT〕 - 1 くく C OD E

そして、カウンタ CNTをインクリメントしてステップ 4 3 4に進む。ステップ 4 3 4では、変数 Iをインクリメントしてステップ 4 1 8にループノくックする。

すなわち、 1つのパターンデータについて、大きいものから順に特徴べクトル Vの要素を見つけ出しては、特徴集合とカテゴリ一情報とからなる 1 レコードを作成する処理を繰り返し、計（N— 1 ) のレコードを作成する。そして、 1つのパターンデータについて処理が完了するとステップ 4 0 6に戻って、まだ処理すべきパ夕一ンが存在するかを確認するのである。

パターンファイルに格納された全パ夕一ンデータについて前述の処理が終了すると、パターンファイルをクローズする（ステップ 4 3 6 ) 。次いで、特徴集合 TXとカテゴリー情報 L Xとからなるテ —ブルをソートする（ステップ 4 3 8 ) 。ここで、ソート処理には, いわゆる度数ソートを使用することが処理速度の面からは望ましい, 度数ソートを使用すると、辞書作成時間がパターン数に比例した時間で済むからである。もちろん、その他のソート法を使用しても差し支えない。次いで、今回の辞書作成処理が辞書ファイルの新規作成に関するものか、又は既作成の辞書へのデータ追加に関するものか、を判定する（ステップ 4 4 0 ) 。新規作成の場合には、メモリ上の内容をファイルに書き出す（ステップ 4 4 2 ) 。その際、同一の特徴集合に関しては、図 6に示されたマージ処理を同時に実行する。また、追加の場合には、その辞書とメメモリ内容とをマージしながらファイルに書き出す（ステップ 4 4 4 ) 。以上の処理によりパターン認識用の辞書が作成される。

次に、図 2 4及び 2 5の'フローチャートに基づいて、入力パターン認識処理の手順について説明する。まず、入力パターンについて前述の辞書作成における場合と同様な特徴べクトルを作成する（ステツプ 5 0 2 ) 。そして、変数 Iを 0 とし（ステップ 5 0 4 ) 、 I = L (ここで、 L =カテゴリ一名の数）か否かを判定する（ステツプ 5 0 6 ) 。 I =Lの場合にはステップ 5 1 2に移行する。 I ≠ L の場合には、辞書内の当該カテゴリ一名（変数 Iによって識別される）と特徴集合との類似度 S C OR E S 〔 I〕を初期値の 0 とし (ステップ 5 0 8 ) 、 Iをインクリメントして（ステップ 5 1 0 ) - ステップ 5 0 6にループバックする。すなわち、ステップ 5 0 4〜 5 1 0により、類似度 S C OR E S C n ( I = 0〜L— 1 ) が初期化される。

ステップ 5 1 2では特徴集合 Tを初期値の 0 とし、次のステップ 5 1 4では変数 Kを 0 としてステップ 5 1 6に移行する。ステップ 5 1 6では、 K = N— 1か否かを判定し、 K = N— 1の場合にはステツプ 5 3 4に移行する。また、 K <N— 1の場合は、ステップ 5 1 8に移行する。

ステップ 5 1 8〜 5 2 8は、前述の辞書作成処理におけるステツプ 4 2 0〜4 3 0 と同一であり、これらのステップで特徴集合丁が求められる。そして、後述する辞書サーチ処理を行い（ステップ 5 3 0 ) 、 Kをインクリメントして（ステップ 5 3 2 ) 、ステップ 5 1 6にループバックする。

ステップ 5 3 4では、類似度 S C 0 R E S 〔 I〕が最大となる I を求め、その Iに対応するカテゴリ一名を入力パターンのカテゴリ一名と判定して、当該入力パターンの認識処理を終了する。

図 2 6及び 2 7は、前述の入力パターン認識処理におけるステツプ 5 3 0で実行される辞書サーチ処理の手順を示すフローチヤ一トである。まず、ステップ 6 0 2において、変数 I S T A R Tに 0、変数 I E NDに所定値 T B LMAXを代入することにより初期設定をする。なお、所定値 TB LMAXは、辞書内のレコード数を示す < 次のステップ 6 0 4では、 I S T A R Tと I E NDとを比較し、 I S TART= I ENDの場合には辞書サーチ処理を終了し、 I ST A R T≠ I ENDの場合にはステップ 6 0 6に移行する。

この実施例におけるサーチ処理は、 2分割法に従っており、ステップ 6 0 6においては、変数 I Wに（ I START+ I END) , 2を代入する。すなわち、スタートアドレスとエンドアドレスとの和の 1 2を中間アドレス I Wとする。次のステップ 6 0 8では、特徴集合 Tと TX 〔 I W〕とを比較し、 T = TX 〔 I W〕の場合にはステップ 6 1 4へ移行し、 Tく TX 〔 I W〕の場合にはステップ 6 1 0へ移行し、 T>TX 〔 I W〕の場合にはステップ 6 1 2へ移行する。

ステップ 6 1 0においては、 I E N Dに I Wを代入してステップ 6 0 4へループバックする。また、ステップ 6 1 2においては、 I STARTに I W+ 1を代入して、ステップ 6 0 4へループバックする。ステップ 6 1 4においては Iに 0を代入して、次のステップ 6 1 6へ移行する。

ステップ 6 1 6においては、 I と Lとを比較し、 I = Lの場合には辞書サーチ処理を終了し、 I < Lの場合にはステップ 6 1 8へ移行する。ステップ 6 1 8では、カテゴリ一名 L X 〔 I W〕の第 I ビットが 1 となっているかをテストする。ただし、最下位ビットを第 0 ビット.とする。換言すれば、 L X 〔 I W〕と 1 くく I との論理積 L X 〔 I W〕 & 1 くく Iが 0か否かをテストする。当該論理積が 0 であるときにはステップ 6 2 2へ移行し、 0でないときにはステツプ 6 2 0へ移行する。

ステップ 6 2 0においては、類似度 S C O R E S 〔 I 〕を + 1 して、ステップ 6 2 2へ移行する。ステップ 6 2 2では、 I をインクリメントしてステップ 6 1 6ヘループバックする。以上が辞書サーチ処理の手順である。

ここで、特徴集合と類似度とについて詳細に解説する。カテゴリ一名ごとの一つの手本パターンの特徴集合列、

T > ^(C) , ···, Τ_Ν-, ^(C)

(但し、 l ≤ c ≤ L、 L =カテゴリ一名の総数）

を格納したパターン認識用の辞書を用いるとする。特徵集合、

T , * , …， Τ_Ν-, *

を有する入力パターンと、 c番目のカテゴリ一名の手本パターンとの類似度 S ^(c) は、

S (^c) = [ （π-Ι^ Σ , - ,

)) … （ 5 ) ここで、 φ (T Ti) = 0 ( ≠ Τ₂ のとき）

Φ (Τι,Τ₂) = 1 ( Τ, = Τ₂ のとき）

Σ , Ν-¹ は、 I = 1 から I = Ν— 1 までの累算と表される。

これを、各カテゴリ一名が、異なる書体等に対応して、複数の手本パターンについてそれぞれ特徴集合列を持つ場合に拡張する。すなわち、あるカテゴリ一名 cについて m個の手本パターンが存在し特徴集合のマトリクス、 ) T c )

T ( c

12 ( c ) T (

.― 1

T i 1

T_ML ( c ) , T ( c ) T ( c ) が形成される場合、類似度を次のように定義し、これを [、巾空間類似度」と呼ぶこととする。

S ^(c) = [1/(N-1)]∑ N一 1

I - 1 d xmax { φ (T ，Τ ( c )

i I )} i 匪 1

( 6 ) 但し、 C , は定数（通常は 1 )

1 は、 1 〜m

I は、 1 〜N— 1

max { } ,⁰¹は、 i は 1 〜mとしたときの

{ } 内の値の最大値

本発明は、入力パターンから求めた特徴集合と、文字認識用辞書に格納された特徴集合とについて、前述の（ 6 ) 式による巾空間類似度を計算し、最大の類似度となる手本パターンのカテゴリ一名が入力パターンのカテゴリ一名である、と判定するものである。

例えば、未知のカテゴリ一名の入力パターン P X 1 , P X 2について、図 5に示すパターン認識用の辞書を用いて認識する場合を考える。入力パターン P X 1 , P X 2の特徴ベクトル VX 1 , VX 2 が、

V X 1 = ( 6 , 8 8 8 9 9 9 9 , — 5 5， 7 7 , - 4 4 4 )

V X 2 = ( 2 5 , 1 6 3 4， 6 1 , 5 2 , 4 3 )

であるとする。入力バタン P X 1 の特徴べクトル VX 1 から作成される特徴集合列は、

{3} ， {2， 3} , {2,3, 5} ， {1,2,3,5} , {1,2,3,4,5}

となる。入力パターン P X 2の特徴ベクトル VX 2から作成される特徵集合列は、 ,

{4} ， {4, 5} ， {4, 5, 6} ， {3, 4, 5, 6} , {1, 3, 4, 5, 6}

となる。

入力パターン P X 1 の特徴集合と図 5の辞書の特徴集合とをみる -と、入力パターン P X 1 の各特徴集合について次のことがわかる。すなわち、

{ 3 } は、カテゴリ一名 A， Bにリンクする。

{ 2 , 3 } は、カテゴリ一名 Aにリンクする。

{ 2 , 3 , 5 } は、何れのカテゴリ一名にもリンクしない。

{ 1 , 2 , 3 , 5 } は、カテゴリ一名 Aにリンクする。

{ 1 , 2， 3， 4， 5 } は、カテゴリ一名 Aにリンクする。

従って、前述のリンク 1 回について 1 5点を与えることとすると、入力パターン P X 1 のカテゴリ一名 Aとの類似度は、 4 Z 5 となる。また、入力パターン P X 1 のカテゴリ一名 Bとの類似度は 1 / 5 となる。

同様に計算して、入力パターン P X 2のカテゴリ一名 Aとの類似度は 3 / 5 となり、入力パターン P X 2のカテゴリ一名 Bとの類似度は 4ノ 5 となる。従って、入力パターン P X 1 はカテゴリ一名 A と認識し、入力パターン P X 2はカテゴリ一名 Bと認識する。なお- 類似度の順に認識候補カテゴリ一名を表示することも可能である。

また、複数種類の類似度算出方法による類似度、例えば、 A方法と B方法とによる類似度 S A ^(c〉， S B ^(c) を求め、合成した類似度 S ^(c) を、

S ^(c) = ( S A ^(c) + S B ^(c) ) / 2

により求めることも可能である。また、大分類、中分類、小分類等の分類によって文字認識を行う場合、前述の認識方法を任意の段階の分類に適用することも可能である。これは、本発明が総てのカテゴリーについて類似度を算出しているからであり、各種の応用が可能である。

以上説明したように、本発明は、入力パターンの特徴集合と、辞書の特徴集合との「巾空間類似度」を求めて、最大の類似度を有するカテゴリ一名を入力パターンのカテゴリ一名と判定するものであり、認識率が高いことが確認されている。また、類似度計算においては、辞書の各レコードが特徴集合の順番に配列され、例えば 2分割法、アドレス表現法等によってサーチすることができる。そのため、辞書の全部の特徴集合に対して類似度計算を行うことなく、その一部を参照すれば済むから、認識所要時間を短縮できる利点がある。また、類似度計算は、全カテゴリ一名に対して行うものであるから、パターン認識における大分類等に適用することができるなど応用性にも優れているという利点がある。

実際に、ドットプリンタにより、半角文字のアルフアベットの大小 5 2文字と、数字 1 0文字とをプリントアウトし、分解能 3 0 0

( d p i ；ドットインチ）のスキャナにより読み取って、辞書作成用の手本パターンと、認識率測定用の入力パターンとした。また. 辞書に使用した文字数は 6 2文字種 X 8 0セット = 4 9 6 0文字、認識率測定用に入力した文字数は 6 2文字種 X 4 0セット = 2 4 8

0文字とした。その結果、辞書作成に要する時間は、パーソナルコンピュー夕を使用した場合、約 1 5 1秒、認識率は 9 8 . 7 5 %であった。この場合、大文字と小文字とが殆ど類似のパターンを有することに起因する誤認識が生じたが、文字の大きさの情報を入力することにより、認識率を 9 9 . 7 5 %とすることができた。

また、 J I S第 1水準の漢字 2 9 6 5文字種をレーザプリン夕でプリントァゥトし、前述の 3 0 0 d p i のスキャナにより読み取つて辞書作成用の手本パターン及び認識率測定用の入力パターンとした。その場合、.惑識率は、 9 9 . 9 7 %であった。この場合の 1文字当たりの認識所要時間は約 0 , 0 1 9秒であった。また、 0〜 9 及び Xの手書き文字について辞書作成及び認識率測定を行った。その場合、全文字数 1 0 9 9 4 に対して、認識率は 9 8 . 8 6 %であつた。すなわち、実用上充分な認識率を得ることができた。

また、パターン認識用の辞書は、手本パターンより N個の特徴量を抽出して特徵ベクトルとし、その特徴ベクトルより N— 1個の特徵集合を形成し、それらを手本パターンのカテゴリ一名と対応させてメモリに格納するものであり、一つの特徴集合に複数のカテゴリ —名を対応させることができる。そのため、手本パターン及びカテゴリ一名が多数の場合でも、辞書作成に要する時間は短くて済み、経済的に辞書を作成することができる。さらに、手本パターンを追加する場合でも、辞書の一部を修正して追加すれば良いから、簡単に追加することができるという利点がある。産業上の利用可能性

本発明は、特徴べクトル作成方法を適切に選ぶことによってあらゆるパターン認識に応用することができる。すなわち、本発明は、コンピュータの入力装置としての光学式文字読み取り装置（O C R ) を初めとして、医療診断システムや音声認識システム（音声波形をパターンとみなして利用する）にも適用可能であろう。なぜならば、辞書作成時間の短縮及び認識所要時間の短縮という効果は、これまで説明したように、特徴べクトル作成方法がどんなものであろうとも得られるからである。また、高い認識率が得られることは、辞書作成に使用されたパターンは必ず正解となること、及び文字認識の各種の事例（手書き文字、印刷文字、数字、英数字、漢字等）においていずれも良好な認識率が実際に得られたことによって証明されている

Claims

請求の範囲

1. (a) 入力パターンの認識対象領域を N個の領域に分割し、それぞれに対応する分割領域番号を付与して、 N個の分割領域を作成するステップと、

(b) 該 N個の分割領域の各々に対して、所定の基準に従って特徴量を算出し、該 N個の特徴量を要素とする特徴べクトルを作成するステップと、

(c) 該特徵べクトルの N個の要素の中の最大のもの又は最小のものを検索し、該検索された要素に対応する 1個の分割領域番号からなる第 1 の特徴集合を作成し、次いで、最大のもの又は最小のものから順に 2個を検索し、該検索された 2個の要素に対応する 2個の分割領域番号の組み合わせからなる第 2の特徴集合を作成し、以下同様にして（N— 1 ) 個の分割領域番号の組み合わせからなる第

( N - 1 ) の特徴集合まで作成することにより、合計（N— 1 ) 個の特徴集合を作成するステップと、

(d) 前記ステップ（a) から（c) までを予め各種の手本パターンに対して実施して得られた特徴集合を該手本パターンのカテゴリ一名とともに記録した辞書を参照することにより、該入力パターンの特徴集合と該辞書内の特徴集合との類似度をカテゴリー名対応に求め. 該類似度が最大となるカテゴリ一名を該入力パターンのカテゴリ一名と判定するステップと、

を具備するパターン認識方法。

2. ステップ（a) における分割は、手本パターンの認識対象領域を N個の等面積の領域に分割するものであり、かつ、ステップ（b) における特徴量は、分割領域内のドットの値の合計に基づくものである、請求の範囲第 1項に記載のパターン認識方法。

3. ステップ（a) における分割は、手本パターンの認識対象領域をそれぞれドットの値の合計が同一となるように N個の領域に分割するものであり、かつ、ステップ（b) における特徴量は、分割領域の面積に基づくものである、請求の範囲第 1項に記載のパターン認

6 法。

4. 前記分割領域内のドットの値は、手本パターンの黒白境界線からの距離に応じて重みづけされている、請求の範囲第 2項に記載のパターン認識方法。

5. 認識されるべきパターンを入力するパターン入力手段と、入力されたパターンの認識対象領域を N個の領域に分割し、それぞれに対応する分割領域番号を付与して、 N個の分割領域を作成する手段と、

該 N個の分割領域の各々に対して、所定の基準に従って特徴量を算出し、該 N個の特徴量を要素とする特徴べクトルを作成する手段と、

該特徴べクトルの N個の要素の中の最大のもの又は最小のものを検索し、該検索された要素に対応する 1個の分割領域番号からなる第 1 の特徴集合を作成し、次いで、最大のもの又は最小のものから順に 2個を検索し、該検索された 2個の要素に対応する 2個の分割領域番号の組み合わせからなる第 2の特徴集合を作成し、以下同様にして（N— 1 ) 個の分割領域番号の組み合わせからなる第（N— 1 ) の特徴集合まで作成することにより、合計（N— 1 ) 個の特徴集合を作成する手段と、

前記パターン入力手段、分割領域作成手段、特徴べクトル作成手段、及び特徴集合作成手段を予め各種の手本パターンに対して適用して得られた特徵集合を該手本パターンのカテゴリー名とともに記録した辞書を記憶する手段と、該入力パターンの特徴集合と該辞書内の特徴集合との類似度を力テゴリ一名対応に求め、該類似度が最大となるカテゴリ一名を該入力パターンのカテゴリ一名と判定する手段と、

を具備するパターン認識装置。

6. ステップ（a) における分割は、手本パターンの認識対象領域を N個の等面積の領域に分割するものであり、かつ、ステップ（b) における特徴量は、分割領域内のドットの値の合計に基づくものである、請求の範囲第 5項に記載のパターン認識装置。

7. ステップ（a) における分割は、手本パターンの認識対象領域をそれぞれドットの値の合計が同一となるように N個の領域に分割するものであり、かつ、ステップ（b) における特徴量は、分割領域の面積に基づくものである、請求の範囲第 5項に記載のパターン認

8. 前記分割領域内のドットの値は、手本パターンの黑白境界線からの距離に応じて重みづけされている、請求の範囲第 6項に記載のパターン認識装置。

9. (a) 入力された手本パターンの認識対象領域を N個の領域に分割し、それぞれに対応する分割領域番号を付与して、 N個の分割領域を作成するステップと、

(c) 該特徴べクトルの N個の要素の中の最大のもの又は最小のものを検索し、該検索された要素に対応する 1個の分割領域番号からなる第 1 の特徵集合を作成し、次いで、最大のもの又は最小のものから順に 2個を検索し、該検索された 2個の要素に対応する 2個の分割領域番号の組み合わせからなる第 2の特徴集合を作成し、以下同様にして（N— 1 ) 個の分割領域番号の組み合わせからなる第 ( N - 1 ) の特徴集合まで作成することにより、合計（N— 1 ) 個の特徴集合を作成するステツプと、

(d) 該特徴集合の各々と該手本パターンのカテゴリー名とを対応させて所定のメモリに格納するステツプと、

を具備するパターン認識用辞書作成方法。

10. ステップ（a) における分割は、手本パターンの認識対象領域を N個の等面積の領域に分割するものであり、かつ、ステップ（b) における特徴量は、分割領域内のドットの値の合計に基づくものである、請求の範囲第 9項に記載のパターン認識用辞書作成方法。

11. ステップ（a) における分割は、手本パターンの認識対象領域をそれぞれドットの値の合計が同一となるように N個の領域に分割するものであり、かつ、ステップ（b) における特徴量は、分割領域の面積に基づくものである、請求の範囲第 9項に記載のパターン認識用辞書作成方法。

12. 前記分割領域内のドットの値は、手本パターンの黒白境界線からの距離に応じて重みづけされている、請求の範囲第 1 0項に記載のパターン認識用辞書作成方法。