DE2247942A1 - Zeichenerkennungsverfahren zur verbesserung der erkennbarkeit gestoerter zeichen - Google Patents
Zeichenerkennungsverfahren zur verbesserung der erkennbarkeit gestoerter zeichenInfo
- Publication number
- DE2247942A1 DE2247942A1 DE19722247942 DE2247942A DE2247942A1 DE 2247942 A1 DE2247942 A1 DE 2247942A1 DE 19722247942 DE19722247942 DE 19722247942 DE 2247942 A DE2247942 A DE 2247942A DE 2247942 A1 DE2247942 A1 DE 2247942A1
- Authority
- DE
- Germany
- Prior art keywords
- bit
- decision point
- probability
- contrast
- decision
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/20—Combination of acquisition, preprocessing or recognition functions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Description
Böblingeri, 28. September 1972
bt/we-fr
Anmelderin: International Business Machines
Corporation, Armonk, N.Y. 10504
Amtl. Aktenzeichen: Neuanmeldung _ Q . ~
Aktenzeichen der Anmelderin: RO 9 70 026
Zeichenerkennungsverfahren zur Verbesserung der
Erkennbarkeit gestörter Zeichen
Die Erfindung betrifft ein Verfahren der automatischen Zeichenerkennung,
bei dem ein Bereich eines Aufzeichnungsträgers abgetastet und sein Informationsgehalt binär digitalisiert einem
Speicher, vorzugsweise einem Schieberegister, zugeführt wird, zur Verbesserung der Erkennbarkeit von gestörten Zeichen.
Die Zuverlässigkeit von Zeichenerkennungssystemeh hängt in großem Maße davon ab, wie weit die aus dem abgetasteten Zeichen gewonnenen
Merkmale mit den erwartenden definierten Vergleichsmerkmalen
übereinstimmen. Infolge einer Reihe von Einflüssen, auf die der Benutzer solcher Anlagen oftmals keinen Einfluß ausüben kann,
korrespondieren die aus dem abgetasteten Zeichen gewonnenen .Zeichenmerkmale
nicht in ausreichender Weise mit den Vergleichsmerkmalen.
So können beispielsweise von einem Schreibmaschinendurchschlag abgetastete Zeichen viel zu große Strichstärken aufweisen,
wozu noch kaum diskriminierbare Zeichenränder kommen« Es ist sogar häufig der Fall, daß sich Ränder benachbarter Zeichen berühren.
Ähnlich schwierig ist die Erkennung sehr leicht gedruckter Zeichen, bei denen Zeichenteile für maschinelle Erkennung zu undeutlich
sind oder gänzlich fehlen.
Zur Verbesserung der Betriebssicherheit von Zeichenerkennungs-
3098U/0935
maschinen ist es bekannt, bereits vor dem zur Erkennung führenden
Vergleich auf die abgetasteten Zeichenmerkmale in der Weise einzuwirken, daß die Zeichenmerkmale den Vergleichsmerkmalen angepaßt
werden. Ein Beispiel für eine derartige Anordnung findet sich in der US-Patentschrift 3 196 398. Durch diese bekannte
Anordnung wird aus einem Zeichen mit variabler Strichstärke ein durch die Vergleichseinrichtung besser verarbeitbares Zeichenmuster
mit kontinuierlicher Linienführung konstanter Strichstärke gewonnen. Das bekannte System ist jedoch nicht in der Lage, eine
Reihe von weiteren, bei der maschinellen Zeichenerkennung auftretenden Störungen, wie beispielsweise zu überhaupt keinem Zeichen
gehörende Fehlmarkierungen oder Zeichenberührungen, zu verarbeiten.
Zur Verbesserung der Zuverlässigkeit und Wirtschaftlichkeit von
Maschinen zur automatischen Zeichenerkennung hat sich die vorliegende Erfindung die Vermeidung dieser Nachteile zum Ziel gesetzt.
Diese Aufgabe wird durch ein Verfahren der automatischen Zeichenerkennung, bei dem ein Bereich eines Aufzeichnungsträgers
abgetastet und sein Informationsgehalt binär digitalisiert einem Speicher, vorzugsweise einem Schieberegister, zugeführt wird, zur
Verbesserung der Erkennbarkeit von gestörten Zeichen gelöst, welches sich dadurch auszeichnet, daß eine Reihe von Grundmerkmalen
definiert wird, aus denen sich alle zu erkennenden Zeichen zusammensetzen, daß eine Zelle des Speichers als Entscheidungsstelle
XKJi die einen Bezugspunkt definiert, festgelegt wird,
für deren Umgebung die Wahrscheinlichkeit I (Konvergenzwahrscheinlichkeit) , daß nämlich die der Entscheidungsstelle XRJ benachbarten
Speicherzelleninhalte ein Grundmerkmal erfüllen, und die Wahrscheinlichkeit E (Divergenzwahrscheinlichkeit), daß nämlich
die der Entscheidungsstelle X1.T benachbarten Speicherzelleninhalte
kein Grundmerkmal erfüllen, bestimmt wird, wobei im ersten Fall vorausgesetzt wird, daß die Entscheidungsstelle X_,_ ein
KJ
Zeichenteil enthält, während im zweiten Fall angenommen wird, die Entscheidungsstelle selbst enthalte kein Zeichenelement,
daß in Abhängigkeit vom in der Umgebung der Entscheidungsstelle
ro 970 026 3098 U/0935
X herrschenden Kontrast Schwellwerte T und T für die Wahrscheinlichkeiten
I und E bestimmt v/erden, und daß abhängig von dem Verhältnis der Wahrscheinlichkeiten I bzw. E zu ihren entsprechenden
Schwellwerten T1 und T„ der Speicherinhalt der Entscheidungsstelle
X„T belassen oder verändert wird.
Die vorliegende Erfindung kann in vorteilhafter Weise in die Software eines Zeichenerkennungssystems inplementiert werden. Zur
Erkennung der Zeichenmuster werden über eine Mehrzahl von Elementarflächen, in die der abzutastende Aufzeichnungsträger eingeteilt
wurde, z.B. mittels eines Lichtpunktabtasters abgefühlt. Die infolge
des unterschiedlichen Remissionsgrades der Oberfläche auf-'
tretende Variatione der zurückgestrahlten Lichtmenge wird durch optoelektrische Wandler abgefühlt und in digitalisierter Form
einem matrixartig aufgebauten Schieberegister seriell zugeführt.
Ein Teil dieses Schieberegisters wird als sogenanntes Maskenfeld
bezeichnet und innerhalb dieses Feldes eine Speicherzelle als Entscheidungsstelle X _ definiert. Sobald ein neues Bit in die
letztgenannte Speicherzelle eintritt, wird eine Serie von Operationen
durchgeführt, an deren Ende die Entscheidung steht, ob das eingeführte Bit in seinem Status belassen oder geändert wird.
Die Entscheidung, ob in der Speicherzelle ΧνΎ ein "schwarzes" oder
"weißes" Bit eingeschrieben werden soll, wird unabhängig von dem tatsächlich an dieser Stelle gespeicherten Bit getroffen.
Weitere Einzelheiten, die die Arbeitsweise der Erfindung betreffen,
können der nachfolgenden Beschreibung, weitere Merkmale den Patentansprüchen entnommen werden.
Auf den Zeichnungen zeigen:
Fign. Ia-Ic eine Reihe von Zeichen in ihrem Ursprungszustand
und in verdeutlichter.Form,
KO 9 70 026 Λ . . _ .Λr
3098U/093B
Fign. 2a-2c eine zweite Buchstabengruppe in ursprünglicher
und verdeutlichter Form,
Fig· 3 eine Übersicht einer Anordnung zur Durchführung
des erfindungsgemäßen Verfahrens,
Fig. 4 ein Flußdiagrarran der Verfahrensschritte,
Fig. 5 ein Ausschnitt des Schieberegisters in Fig. 3,
Fig. 6 graphische Darstellungen einer Reihe von Grund-
merkmalen,
Fig. 7 die Lage des Maskenfeldes innerhalb des Speichers,
Fign. 8 u. 9 empirisch ermittelte Kurven zur Bestimmung der
Schwellwerte T und T ,
Fig. 10 eine Zusammenstellung der die Auswahl der Schwellwerte T_ und T_ bestimmenden Regeln.
A. Allgemeines Konzept
Die beschriebene Verdeutlichungstechnik zur Verbesserung der Erkennbarkeit von Zeichen bewirkt eine Erhöhung der Zuverlässigkeit
konventioneller Zeichenerkennungssysteme. Dies erfolgt durch Veränderung von undeutlichen Zeichenmustern in der Weise,
daß das Auftreten von Zeichenausfüllungen, Fehlmarkierungen und Zeichenfehlstellen, die in und um sich auf einem zu lesenden
Aufzeichnungsträger befindenden Zeichen auftreten, vermindert wird. Als Resultat der Korrekturtechnik werden die Zeichenmerkmale
akzentuiert, die Merkmalgrenzen bereinigt und die Strichstärken des Zeichens standardisiert. Außerdem werden Fehlmarkierungen,
die die Erkennbarkeit des Zeichens beeinflussen können, eliminiert.
Fig. la zeigt das aus undeutlichen Zeichen bestehende englische Wort JUMP. Derartige relativ leicht gedruckte und daher kaum
RO 970 026
3098U/093B
definierte Zeichen können das Resultat schlechter Farbbänder oder ungenügender Tintenzufuhr sein.
Fig. 2a zeigt in ebenfalls undeutlichen Zeichen die beiden Buchstaben
A und M. Diese Zeichen mit sehr großer Strichstärke, die auch insgesamt sehr breit sind, können durch Verwendung eines
neuen, sehr stark getränkten Farbbandes auf der Schreibmaschine oder beim Kopieren mit einem nicht korrekt eingestellten Kopiergerät
entstehen. Daß für automatische Zeichenerkennungsmaschinen gewisse Schwierigkeiten bei der Erkennung von Zeichen, seien sie
nun relativ schwach ausgeprägt wie in Fig. la oder sehr fett wie in Fig. 2a, bestehen, liegt auf der Hand. Um die Zeichen zu standardisieren
und die Merkmalgrenzen zu akzentuieren, werden die Begrenzungen jedes Zeichens untersucht, um festzustellen, ob und
an welcher Stelle zur Verdeutlichung des Zeichenmusters Markierungen eingesetzt werden müssen.
Es soll noch darauf hingewiesen werden, daß üblicherweise die Zeichen auf abzutastenden Aufzeichnungsträgern aus meist zusammenhängenden
Linien bestehen, während hier zur Erläuterung der Wirkungsweise die Zeichen aus diskreten Markierungspunkten zusammengesetzt
dargestellt sind. Es· kommt noch hinzu, daß die Verdeutlichungsoperation, die das Wesen diesem Erfindung ausmacht,
auf Zeichen angewandt wird, deren ursprüngliche Ausbildung auf ein Muster aus diskreten Punkten reduziert wurde.
Die einzelnen Punkte entsprechen der Aufteilung des zu lesenden Aufzeichnungsträgers in Elementarflächen, von denen jede abgetastet
wird, um zu bestimmen, ob sie entweder eine vorgegebene Mindestschwärzung aufweist oder ein den Hintergrund des Aufzeichnungsträgers
anzeigendes Fehlen einer solchen Markierung erkennen läßt. Elernentarflächen, deren Schwärzung den vorgegebenen
Mindestwert erreicht, werden im folgenden als schwarze Elementarflächen, solche, in denen der Mindestwert nicht erreicht
wird, als weiße Elementarflächen bezeichnet. Die Ausdrücke schwarze
bzw. weiße Elementarfläche werden natürlich nur benutzt, um
RO970026 . 3093U/0935
den Kontrast zwischen einer Markierung und dem Hintergrund des
Aufzeichnungsträgers zu definieren. Demzufolge können schwarze Elementarflächen auch solche sein, die sich durch eine gegenüber
dem dunklen Hintergrund abhebende helle Markierung auszeichnen.
Die Umformung des undeutlichen Zeichens in eine Serie von diskreten
Markierungen ist durchaus konventioneller Art und wird erreicht durch Betrachtung des Dokuments in der Weise, als ob es
aus einer Vielzahl von Elernentarflächen bestünde. Der Aufzeichnungsträger
kann beispielsweise durch einen Abtaststrahl entlang eines Rastermusters abgetastet werden, bei dem der Abtaststrahl
jeweils eine Reihe von Elementarflächen überstreicht.
Dabei kann, wie es bekannt ist, der Lauf des Abtaststrahls in elementare, diskriminierbare Inkremente unterteilt werden. Innerhalb
jedes Abtastschrittes wird die Intensität des reflektierten bzw. remittierten Strahls gemessen, um feststellen zu können, ob
der Strahl sich über eine markierte oder eine unmarkierte Elementarfläche bewegt hat.
Die Fign. Ib und 2b illustrieren einige der durch das System
vorgenommenen Entscheidungen, durch die selektiv der Status einer Reihe von Elementarflächen geändert wurde. Darin bezeichnet das
Symbol X Elementarflächen, die vom weißen in den schwarzen Zustand
übergeführt werden müssen, während das Symbol 0 ursprünglich schwarze Elementarflächen bezeichnet, die zu weißen verändert
werden sollen.
Die Fign. Ic und 2c zeigen die so veränderten Zeichen. Es soll
an dieser Stelle darauf hingewiesen werden, daß das System iterativ arbeitet, das bedeutet, die ZeichenVerdeutlichung kann
mehrere Durchläufe des Zeichenmusters durch das System erfordern; jeder Durchlauf benutzt das beim vorhergehenden veränderte Zeichenmuster.
Auf diese Art und Weise werden die Grenzen des Zeichenmusters kontinuierlich - oder besser: in kleinen Schritten verbessert,
indem sie durch Verbreiterung oder Verschmälerung
einer standardisierten Strichstärke angenähert werden. Wie aus
RO 970 026
3098U/0935
Fig. lc zu erkennen ist» beträgt die Strichstärke der einzelnen
Zeichen nahezu einheitlich drei Elementarflächen.
Fig. 3 zeigt die Vorrichtung zur Verbesserung der Erkennbarkeit
von Zeichen. Der Abtaster 2 tastet das auf dem Aufzeichnungsträger
6 befindliche Zeichen 4 ab. Der Abtaststrahl durchläuft eine Anzahl vertikaler Abtastbahnen 1, 2, ... n, deren jede aus einer
Anzahl von die Elementarflächen definierenden unterscheidbaren Inkrementen besteht. Die Intensität des von jeder der Elementarflächen
reflektierten bzw. remittierten Lichtes wird durch den opto-elektrischen Wandler 8 in ein elektrisches Signal umgewandelt,
welches vorteilhafterweise in binärer Form - also als Bit angibt, ob sich in der abgetasteten Elementarfläche eine die
Mindestschwärzung übertreffende Markierung befindet oder nicht. Die dabei entstehenden elektrischen Signale sollen demgemäß als
schwarzes bzw. weißes Bit bezeichnet werden. Die Ausgangssignale
des Wandlers 8 werden einem in Matrixform angeordneten, zweidimensionalen
Schieberegister 10 zugeleitet, das insgesamt L Spalten und m Zeilen enthält. Die Anzahl der Zeilen wird durch die Anzahl
der Inkremente je Abtastbahn, die ja gleich ist der Anzahl der Elementarfläche je Bahn, bestimmt. Jedes in das Register 10
eingespeiste Bit tritt an der Stelle X0 n ein und wandert entlang
der Spalte 0 bis zur Zeile m. Danach wird dieses Bit an die Stelle
X_ , verschoben, durchläuft diese Spalte usw.
Ein Teil des Matrixregisters 10 wird als Maskenfeld 12 benutzt, in dessen Mitte sich die Speicherstelle XKJr die die Lage des
Entscheidungsbits definiert, befindet. Da jedes in das Schieberegister 10 eintretende Bit durch das gesamte Register geschoben
wird, erreicht es auch zu einem bestimmten Zeitpunkt die Stelle Χντ. Wenn sich das in der Entseheidungsstelle befindliche
JmJ
Bit auf dem abgetasteten Aufzeichnungsträger gerade an der Grenze
einer Markierung - gleichgültig, ob diese ein Zeichen oder eine Fehlmarkierung darstellt - befindet, werden einige Operationen
durchgeführt, die eine eventuelle Änderung des gespeicherten Bit
bewirken. Die die Änderung bewirkende Entscheidung wird unabhän-
R0 97ÜO26 3098U/093B
gig davon getroffen, ob sich an der Stelle ΧνΎ ein schwarzes oder
ein weißes Bit befindet, d.h., sie hängt nur von den in der Umgebung der Entscheidungsstelle festgestellten Markierungen ab. Dies
soll im folgenden noch näher erläutert werden.
Wenn beispielsweise festgestellt wird, daß der Inhalt der Stelle Xx,_ ein Randbit darstellt, wird eine Rand-Konvergenzmessung und
is. J
-Divergenzmessung durchgeführt. Diese Berechnungen werden durch Untersuchung der Inhalte der die Entscheidungsstelle XRJ umgebenden Speicherstellen bewerkstelligt. Hierbei wird festgestellt, ob diese umgebenden Elementarflächen Teil eines festgelegten Satzes ausgewählter Grundmerkmalmuster darstellen, die eine ebenso a priori festgelegte Merkmalverteilung aufweisen. Mathematisch werden diese beiden Wahrscheinlichkeiten ausgedrückt als
-Divergenzmessung durchgeführt. Diese Berechnungen werden durch Untersuchung der Inhalte der die Entscheidungsstelle XRJ umgebenden Speicherstellen bewerkstelligt. Hierbei wird festgestellt, ob diese umgebenden Elementarflächen Teil eines festgelegten Satzes ausgewählter Grundmerkmalmuster darstellen, die eine ebenso a priori festgelegte Merkmalverteilung aufweisen. Mathematisch werden diese beiden Wahrscheinlichkeiten ausgedrückt als
P )x + S/X"KJ = 0 V - E (1)
P (X + S/X'KJ = 1 i = I (2)
Darin bedeuten:
X das Markierungsmuster, d.h. den Mustervektor der die Entscheidungsstelle umgebenden Elementarflächen;
S den n~dimensionalen Raum, der die a priori festgelegten
Grundmerkmalstriche enthält, d.h. eine Reihe von festgelegten Grundmerkmalen mit einer
definierten Strichstärke;
(X' «0) Hypothese, daß die Entscheidung für die Stelle XVT auf weiß fällt;
(X'K =1) Hypothese, daß die Entscheidung auf schwarz fällt.
Die Gleichung 1 zeigt, daß E ein Maß für die Wahrscheinlichkeit dafür ist, daß das Muster X schwarzer Bits, die die Entscheidungsstelle
umgeben, nicht Teil irgendeiner der definierten Merkmalgruppen ist unter der Voraussetzung, daß das in der Entscheidungs-
R0 970026 3098H/0935
- 9 stelle enthaltene Bit weiß ist.
In Gleichung 2 ist I ein Maß für die Wahrscheinlichkeit, daß das Muster X schwarzer Bits, die die Entscheidungsstelle XRJ umgeben,
unter der Voraussetzung, daß das in letzterer enthaltene Bit schwarz ist, Teil eines der definierten Merkmalsätze ist.
Die Tatsache, daß der festgestellte Wert von I hoch ist, beinhaltet
noch nicht genügend Information, um darauf die Entscheidung zu stützen, daß das Bit an der Stelle X„, Teil oder nicht Teil
einer Zeichengrenze darstellt. Die Gleichungen 1 und 2 sind einfach Ausdrücke für die Wahrscheinlichkeit, daß das Bit an der
Stelle X„T und die es umgebenden schwarzen Bits Teile zumindestens
einer definierten Merkmalgruppe darstellen, wobei diese Entscheidung auf dem Vergleich der Umgebungsbits mit den vorgegebenen Merkmalsätzen
basiert.
Nichtsdestotrotz muß auch die Möglichkeit in Betracht gezogen werden, daß das Grundmerkmal tatsächlich Teil eines Zeichens ist.
Eine Anzeige für diese Wahrscheinlichkeit kann aus der Untersuchung des Kontrastes in der Umgebung der Stelle X _ gewonnen werden.
Es sei beispielsweise angenommen, daß die Wahrscheinlichkeit I als groß und die Wahrscheinlichkeit E als niedrig festgestellt
wurden. Dies führt zum Schluß, daß das Bit an der Stelle X„,
wahrscheinlich ein schwarzes Bit darstellen soll. Wenn aber durch viele in der Umgebung der Stelle XRJ befindliche schwarze Bits
ein starker Kontrast angezeigt wird, ist die Wahrscheinlichkeit, daß das in der Entscheidungsstelle befindliche Bit ebenfalls
Teil einer Zeichenmarkierung darstellt, höher, als sie wäre, wenn der Kontrast in- der Umgebung nur leicht wäre. Dadurch wird
der Vertrauensbereich einer hohen I-Wahrscheinlichkeit vergrößert,
wenn sich das Bit in einem Bereich dunklen Kontrastes auf dem Aufzeichnungsträger befindet; demgegenüber wird der Vertrauensbereich verkleinert, wenn das Bit sich in einer Sektion niedrigen
Kontrastes befindet.
RO 970.026
309314/0935
Auf ähnliche Weise vergrößert sich der Vertrauensbereich der Wahrscheinlichkeit E, daß das Bit in der Entscheidungsstelle
X-.T weiß sein sollte, wenn der Umgebungskontrast leicht ist;
umgekehrt liegt der Fall, wenn der Umgebungskontrast sich als dunkel erweist. Auf diese Art müssen die Wahrscheinlichkeitsmaße I und £ bezogen werden auf den Umgebungskontrast, um so
eine sinnvolle Determinierung des in der Entscheidungsstelle befindlichen Bits zu erzielen.
Gemäß der Lehre der Erfindung wird der relative Kontrast der Umgebung der X„ -Position ausgedrückt als Schwellenwahrschein-
KJ
lichkeitspegel Tx und T . die im nachfolgenden auch als Kontrastschwellen
bezeichnet werden. Die gemessenen Werte der Wahrscheinlichkeiten I und E werden verglichen mit den Werten T
und T , wobei das Resultat dieses Vergleichs die den endgültigen Status des in der Entscheidungsstelle befindlichen Bits
bestimmende Entscheidung beeinflußt. Die spezifischen durchgeführten Kontrastmessungen und die Art, in der sie zur Bestimmung
von Tx und Tx, aufeinander bezogen werden, sind weiter unten be-
X Cl
schrieben. A An dieser Stelle ist es für das Verständnis ausreichend
zu wissen> daß zwei Schwellenpegel, die den Kontrast in
der Umgebung der Entscheidungsstelle beschreiben, determiniert werden. Sobald die Werte I, E, Tx und T„ für ein bestimmtes an
X Cl
der Stelle Xx,x befindliches Bit bestimmt wurden, wird die end-
KJ
gültige Entscheidung über das an dieser Stelle befindliche Bit getroffen. Bezeichnet man den endgültigen Status des an der
Stelle X1,T befindliche Bit als X' , so' lassen sich die Ent-
KJ KJ
scheidungsregeln mathematisch folgendermaßen ausdrücken:
a) X'KJ - 1
wenn 11 - E | £ τ
und IiT-, E< T_
und IiT-, E< T_
X L·
worin T ■ |T£ - T_|
Dies bedeutet, daß die existierende Grenze beibehalten wird, wenn das in der Entscheidungssteile X„_ befindliche Bit ein schwarzes
KJ
RO970026 309814/0935
- 11 -
war. War letzteres jedoch ein weißes Bit, so wird es zu einem schwarzen Bit konvertiert, um den Zeichenrand zu glätten.
b) X'KJ- 0
wenn 11 - E | >_ T
und E > T_
und E > T_
— Ei
und I < T1
War demnach das in der Entscheidungsstelle XRJ enthaltene Bit
ein schwarzes, so wird es zu einem weißen konvertiert, um den Zeichenrand zusammenlaufen zu lassen. War das Bit X ursprünglich
ein weißes, so wird es beibehalten.
c) x'kj ~ xkj
wenn Il - e|< T
Dies bedeutet, daß die Daten zur Entscheidungsfindung nicht ausreichend
sind.
d) | wenn | I | - TI | und E > T„, |
dann | X | 'kj ** | 1 | |
wenn | . I | > E | ||
und | X | 1 =s KJ |
0 | |
wenn | E | > I |
Die beschriebene Technik zur Bestimmung des gewünschten Status einer jeden Elementarfläche aufgrund von Wahrscheinlichkeiten
wird durch einen entsprechend programmierten Universalrechner in Verbindung mit einer konventionellen Abtastvorrichtung und
einem zweidimensionalen Matrix-Schieberegister implementiert. Die Programmierung eines solchen Rechners bereitet für den betreffenden
Durchschnittsfachmann keine Schwierigkeiten. In Fig. 4 ist das Verfahren gemäß der Erfindung als Ablaufplan dargestellt.
Unter Steuerung des Rechners wird eine Elementarfläche abgetastet
RÜ97ÜO26 309814/0936
und der "Inhalt' dieser Elementarfläche als schwarzes oder weißes
Bit dargestellt. Dieses wird in das beschriebene Register eingegeben und gleichzeitig der vorherige Registerinhalt um ein Feld
verschoben. Danach werden die in der Maskenfläche befindlichen Bits gelesen und das Entscheidungsbit der Stelle X„j bestimmt.
Wird festgestellt, daß es sich um ein Randbit handelt, so werden die Wahrscheinlichkeitsmaße I und E bestimmt. Unter der Voraussetzung,
daß E + I > 0 ist, wobei die entgegengesetzte Bedingung einen Trivialfall definieren würde, werden die Kontrastmessungen
zur Bestimmung von T und T durchgeführt. Wenn |E - l| kleiner
festgestellt wird als T = |τ_ - TxI, ist die Information für die
Entscheidungsfindung nicht ausreichend, und das Bit ΧΎ.Ύ wird als
KJ
Entscheidung ΧνΎ angenommen. Wenn die Bedingung I>
T und E > T beide erfüllt sind, wird der gemessene Wert von I mit E verglichen.
Wenn I größer ist als E, wird X' T - 1 gesetzt. Eine detailliertere
Schilderung der genannten Regeln findet sich in Zusammenhang mit der Beschreibung der Schaltungen zur Bestimmung
der einzelnen Größen.
des Grundmerkmalsatzes zur Wahrschelnlichkeitsbe-
s_timmung
In Fig. 3 ist der Block 14 dargestellt, durch den die Konvergenz- und Divergenzmessungen vorgenommen werden, bei denen für jedes
neue an die Stelle X1.T gelangende Bit festgestellt wird, ob es
KJ
sich um ein Randbit (Block 16) oder um ein Merkmalbit, d.h. um ein einen Teil eines definierten Grundmerkmals bildendes Bit
handelt (Block 17). Auf der Basis dieser Entscheidungen wird eine Berechnung der Divergenzwahrscheinlichkeit E und der Konvergenzwahrscheinlichkeit
I vorgenommen.
Die erste im Block 16 vorgenommene Bestimmung betrifft die Feststellung,
ob der Inhalt der Speicherstelle Xv- ein Randbit ist.
KJ
Als Randbit soll hier ein solches Bit verstanden werden, das eine Randbedingung erster Ordnung erfüllt. Selbstverständlich ist es
möglich, die Definition eines Randbits auch von der Erfüllung von
ro 970026 3098U/093S
_ 1 ο _
Randbedingungen höherer Ordnung abhängig zu machen. Zur Erläuterung
der Randbedingungen wird auf Fig. 5 verwiesen» Diese Figur zeigt das Maskenfeld 12 im Register 10. Wenn das in der Position
XT.T befindliche Bit zumindest einem weißen Bit benachbart
KJ
ist, wird es als Randbit erster Ordnung definiert. Dies bedeutet, daß, wenn eine der Positionen H, P, T, U, V, Q, M oder I
ein weißes Bit enthält, das in der Position XKJ befindliche Bit
als Randbit erster Ordnung bezeichnet wird. Ein Randbit zweiter Ordnung an der Stelle Xj v/ürde vorliegen, wenn zumindest ein
weißes Bit an einer der Stellen G, 0, S/ X, Y, 2, α, β, W, R,
M, Ff E, D, C oder B vorhanden wäre, unter der Voraussetzung,
daß im vorgenannten inneren Bereich sich kein zweites Bit befindet. Randuntersuchungen zweiter oder höherer Ordnung sind
dann von Interesse, wenn es um die Beschleunigung der Konvergenz oder Divergenz eines Musters geht. Zur Erläuterung der
Arbeitsweise der Erfindung ist jedoch eine Beschränkung auf die Randbedingungen erster Ordnung ausreichend.
unter Bezug auf Fig. 5 kann die Randbedingung erster Ordnung ausgedrückt
werden durch den Booleschen Ausdruck
BD1 = (T+ü+V+Q+M+T+H+P)
Dieser Ausdruck stellt in mathematisch klarer Form die oben bereits
beschriebene Bedingung dar, daß das Bit XKJ ein Randbit
erster Ordnung darstellt, wenn eine oder mehrere der Stellen T,
ü, V, Q, M, I, H oder P innerhalb des Maskenfeldes 12 mit einem weißen Bit belegt sind. Wenn beispielsweise eine logische 0 ein
weißes Bit repräsentieren soll, wird der Schritt der Randbit-Feststellung
durch Auslesen des Speicherinhalts in den obengenannten Feldern bewerkstelligt und die Präsenz einer logischen
0 in mindestens einer der Speicherstellen festgestellt.
Der nächste Schritt besteht darin, festzustellen, ob das an der Stelle .X befindliche Bit Teil eines vorherbestimmten Grundmerl·
malsatzes ist. In der hier vorgeschlagenen Ausführungsform, die
RO 970 026
30981 A/0935
sich als vorteilhaft erwiesen hat, werden insgesamt vier Grundmerkmale
ausgewählt. Selbstverständlich ist weder Anzahl noch Art der Grundmerkmale auf die vier hier genannten beschränkt.
Die vier verwendeten Grundmerkmale sind:
eine horizontale Linie (H)
eine vertikale Linie (V)
eine Diagonale unter 45° mit positiver Steigung (+D)
eine Diagonale unter 45° mit negativer Steigung (-D).
Im nachfolgenden sojLlen die Kriterien beschrieben werden, nach
denen bestimmt wird, ob ein Mustervektor Teil eines Grundmerkmales darstellt. Es soll nochmals darauf hingewiesen werden,
daß eine weitere Untersuchung des an der Stelle X„_ befindli-
KJ
chen Bits nur dann vorgenommen wird, wenn es sich dabei um ein Randbit handelt. Demnach muß jedes Merkmal bezogen werden
auf üie der Entscheidungsstelle benachbarten Elementarflächen. Dies bedeutet, daß das horizontale Merkmal relativ zu den oberen
und unteren Seiten, das vertikale Merkmal relativ zu den rechten und linken Seiten und die diagonalen Merkmale unter Berücksichtigung
der gesamten Umgebung definiert werden.
Diese Kriterien werden am deutlichsten verständlich unter Bezugnahme
auf Fig. 6 und die in Fig. 5 benutzten Bezeichnungen der Elementarflächen. In Fig. 6 soll die Markierung X ein schwarzes
Bit und die Markierung 0 ein weißes Bit kennzeichnen. Die ebenfalls anzutreffende Kennzeichnung mit einem horizontalen oder
vertikalen Strich bedeutet, daß- die an dieser Stelle zu treffenden Entscheidung unabhängig vom Inhalt der mit dem Strich bezeichneten
Elementarfläche erfolgt. Die Lage des Bezugsfeldes X wird durch
KJ
ein Θ bezeichnet.
Benutzt man die in Fig. 5 angewandten Bezeichnungen der einzelnen Felder, so können die Grundmerkmale, die eine vorgewählte Strich
stärke von zwei Feldern entsprechend 2 Bits aufweisen, folgendermaßen definiert werden:
Rü 970026 3098U/093B
STH = | (PTUVQZ) |
8BH = | (PQHIMD) |
8RV = | (IUTPHÖ) |
8LV = | (IUVQMR) |
8T (+D) | = (MQUTYZ") |
SB(+D) | = (TPIMED) |
8T(-D) | = (HPUV3Z) |
SB(-D) | = (CHIQVD) |
Diese Merkmale wurden ausgewählt, da, wie festgestellt wurde,
die Zeichenmaskierungen größtenteils in diesen Formen erscheinen.
Die Gruppierungen der Grundmerkmale in eine Kategorie S kann ausgedrückt werden durch;
8H + 8V + S+D + 8-D
hierin bedeuten:
8H = 8TH + 8BH' 8V m SRV + 8LV Und S°
Wenn immer die Bedingung S erfüllt ist, wird das Bit X definiert
als schwarzes Bit, das Teil eines Grundmerkmals mit vorherbestimmter Strichstärke ist. Auf diese Weise wird der gewählte
Wert des Bits in Position X- wie folgt ausgewählt:
X' , = 1; wenn (BDn χ S) + BD1 = 1
KJ 1 _ 1
Χ'ντ = 0, wenn (BD, χ S) = 1
KJ 1
darin bedeuten:
X' , = 1 die Auswahl eines schwarzen Bits
Js. J
X' , = 0 die Auswahl eines weißen Bits
Ku
RO970026 anaBU/0936
In einer vorteilhaften Ausgestaltung der Erfindung können variable
Wahrscheinlichkeitswerte I und E dann entwickelt werden, wenn BD als Maß für die Anzahl der das Entscheidungsfeld umgebenden
weißen Bits benutzt wird. Durch Bestimmung der Anzahl weißer und schwarzer Bits in der Gruppe der benachbarten Elementarflächen
können die Maße I und E als Zahlen zwischen 0 und 1 abhängig von dem Verhältnis der Belegung mit schwarzen bzw. weißen Bits bezogen
auf das am nächsten kommende Grundmerkmal bestimmt werden.
Der bevorzugte Algorithmus zur Definition der variablen Wahrscheinlichkeit
ist:
1 - (BV Smax maj + 55I
Unter der Voraussetzung, daß es sich um eine Grenze erster Ordnung
handelt, bedeuten darin:
Anzahl der das am nächsten kommende Grundmerkmalmuster (f.) erfüllenden Bits
max maj Gesamtzahl der f. definierenden Bits und
E = I-I
Dieser Algorithmus kann auch als Funktion der Wahrscheinlichkeit E ausgedrückt werden:
E - (BV smax maj
Auch hier wird wieder vorausgesetzt, daß es sich um Randbedingungen
erster Ordnung handelt.
Es bedeuten:
RO 9 70 026
RO 9 70 026
3098U/0936
Anzahl der das am nächsten kommende Grundmerkmalmuster (f.) nicht erfüllenden Bits
i
X
1
^
max maj ~ Gesamtzahl der f^ definierenden Bits
So berechnet bewegen sich die Werte der Größen I und E zwischen 0 und 1. Selbstverständlich können verschiedene andere Algorithmen
zur Bestimmung der Werte I und E benutzt werden. So ist es beispielsweise möglich, folgenden Booleschen Ausdruck zur Bestimmung
zu benutzen:
I = BD S +
Hierin bedeuten:
I=O oder 1
E=I-I
E=I-I
S = 5H+ 8V+ S(+D)
Die obige Beschreibung setzt ein vorherbestimmtes Maskenfeld
voraus; nachfolgend soll die Bestimmung der Größe dieses Feldes beschrieben werden.
Die Größe des Maskenfeldes ist von erheblicher Bedeutung sowohl für die Randkonvergenz- und Randdivergenz-Messungen als auch für
die Kontrastbestimmungen. Eine der Grundvoraussetzung für die Bestimmung der Maskengröße ist die, daß es ausreichend groß sein
muß, um beide Begrenzungen der größten definierten Strichstärke auch dann enthalten muß, wenn einer der Ränder sich in Position
X„_ befindet. Zum zweiten sollte der maskierte Bereich aus Wirt-'
schaftlichkeitsgründen nicht größer als notwendig gewählt werden. Im folgenden wird Maskengröße bezogen auf die Strichstärke des
ausgedehntesten definierten Grundmerkmalsatzes, wie er im Maskenfeld
erscheint.
RO 970 026
309814/0935
Die Größe des Maskenfeldes sei LxA.
(A-I)
Unter der Voraussetzung, daß L = A ist J—ζ—- = SW.
Darin ist SW die größte Strichbreite, die definiert wurde. Daraus ergibt sich, daß A = 2 (SW) + 1.
Nimmt man beispielsweise für SW den Wert 3 an, so ergibt sich L = A » 7.
Nun kann man natürlich die maximale Strichbreite in vertikaler
Richtung unterschiedlich zu der in horizontaler Richtung wählen. Unter dieser Bedingung ist L / A, wobei L in gleicher Weise definiert
wird wie A.
h^. λ m cw
2 faWV
2 faWV
Darin bedeutet SWV die maximale vertikale Strichbreite. Es ergibt
sich
L - 2SWV + 1,
so daß bei SW = 2 sich L = 5 ergibt.
so daß bei SW = 2 sich L = 5 ergibt.
Nachfolgend sei nochmals das Arbeitsprinzip zusammengefaßt. Sobald
ein neues Bit in der Entscheidungsposition X erscheint,
JVÜ
wird bestimmt, ob es sich um ein Randbit handelt oder nicht. Ist dem so, erfolgt die Bestimmung eines Wertes, der die Wahrscheinlichkeit
dafür angibt, daß der Mustervektor aus den die Entscheidungsposition X umgebenden Speicherplätzen einen Teil definierter
Grundmerkmale darstellt.
Wie vorher bereits erläutert, stellen die berechneten Wahrscheinlichkeitswerte
E und I Maße für den Vertrauenspegel dar, daß das Muster aus schwarzen Bits um die Entscheidungsposition X herum
zu einem Grundmerkmal gehört. Die Wahrscheinlichkeit, daß dieses Muster außerdem Teil eines Zeichenmerkmals ist, beruht auf Kontras
tmessungen.
RO 970 026
3098U/0935
22A79A2
C. Kontrastmessung
In diesem Teil wird die Messung des Randkontrastes, der zur
quantitativen Bestimmung der durchschnittlichen Strichbreite ebenso wie zur Kontrastbeziehung zwischen undeutlichen Zeichenmustern
und dem Hintergrund benutzt wird, beschrieben. Weiterhin können diese· Messungen als qualitative Kriterien für die
Trennung nach Qualitäts-Parametern, also zur Unterscheidung von Fehlmarkierungen, Schatten und Schwärzungsvariationen von
guten Zeichen dienen.
Fig. 7 zeigt das Schieberegister 10, wobei besondere Rücksicht auf die Darstellung der für die Kontrastmessung bedeutsamen
Positionen genommen wurde. Insgesamt werden vier Kontrastmessungen durchgeführt, die im einzelnen weiter unten behandelt werden. Die
erste Kontrastmessung B__ ist ein Maß für den lokalen Kontrast
KJ
um die Position X„T und wird bestimmt durch die Zählung der
KJ
schwarzen Bits innerhalb des maskierten Feldes. Das Maß S„_ ist
KJ
der durchschnittliche begrenzte Flächenkontrast innerhalb einer Abtastbahn um die Entscheidungsstelle Xx,,. Genauer gesagt ist es
kj
die durchschnittliche Summe der ΒνΎ, die von der Verarbeitung der
kj
vorhergehenden benachbarten Abtastbahn J + 1 herrührt. Für jedes
der m Bits, die die Position Xx, _ erreichen, wird während der
KJ
Abtastung der Bahn J + 1 der lokale Kontrast BRJ bestimmt und
zusammen mit dem durchschnittlichen Wert von B,.T über diese m
KJ
Bits gespeichert. Der Wert Ax._. ist die durchschnittliche Summe
KJ
der SKJ aus der vorhergehenden Verarbeitung einer vorgewählten
Anzahl von Abtastbahnen. In der vorteilhaften Ausfuhrungsform
der Erfindung wird der durchschnittliche Zeichenflächenkontrast über die Abtastbahnen J + 1 bis J + N genommen, wobei eine Untersuchung
der Spalten 1 bis L + 11 eingeschlossen werden kann. Die vierte Kontrastmessung ist schließlich die Bestimmung ΔΒ Jf wobei
es sich um ein Maß für die Kontraständerung aus dem Vergleich der B1,- handelt. Diese Messung, die den lokalen Kontrast um Xv-,
KJ KJ
vergleicht mit dem lokalen Kontrast um ein um ein vertikales
RO 970 Ο26
3098U/0935
Inkrement verschobenes Flächenelement, wird benutzt, um eine
mögliche iterative Arbeitsweise der gesamten Anordnung einzuleiten.
Mathematisch können diese Messungen mittels der folgenden Gleichungen
ausgedrückt werden:
Bx,.,. = Σ Σ Α. μ .
KJ a=0 1=0 ia(b)
KJ a=0 1=0 ia(b)
c
SKJ
SKJ
L+l m
Σ Σ (B )
a=+l 1=0 *Jla
L+ll m
Σ Σ (S-._ )
A . a=+l 1=0 KJla
KJ (L+11)-(J+1)
A . a=+l 1=0 KJla
KJ (L+11)-(J+1)
L A+D
ÄBKJ - BK+A,J - BKJ - ^0 I^ xia(b)> " BKJ
ÄBKJ - BK+A,J - BKJ - ^0 I^ xia(b)> " BKJ
Darin bedeuten:
Bx,T: den lokalen Kontrast definiert als die Anzahl der
IS. J
schwarzen Bits innerhalb des Maskenfeldes 12, Sx. _: durchschnittliche Summe der B„_, die aus der Ver-
arbeitung der vorhergehenden benachbarten Abtastbahn (J+l) herrühren, als begrenzter Flächenkontrast bezeichnet,
A„_: durchschnittliche Summe der S„T, die aus der Ver-
A„_: durchschnittliche Summe der S„T, die aus der Ver-
i\ü &J
arbeitung der letzten (L+ll)-(J+l) Abtastbahnen herrühren, als Zeichenflächenkontrast bezeichnet,
Y. die Anzahl der in der Abtastbahn J+l enthaltenen Bits, die in E + I
> 0 resultierten,
Xia(b): e*n scnwarzes Bit innerhalb der Maskenfläche 12,
R0 97° O26 3098U/0935
L; die Anzahl der Spalten innerhalb der Maskenfläche, M; die Anzahl der Zeilen pro Spalte, die der Anzahl der
pro Abtastbahn erzeugten Bits entspricht, A; die Anzahl der Zeilen innerhalb der Maskenfläche.
Diese vier Messungen beziehen den lokalen Kontrast und seine differentielle Änderung an der Merkmalkante innerhalb der Maskenfläche
auf den Kontrast der unmittelbaren begrenzten Flächennachbarschaft und auf den Kontrast der unmittelbaren Zeichenflächennachbarschaft.
Diese Messungen werden benutzt, um die Schwellenwerte Tx und T„ zu bestimmen.
J. Ci
Die Kontrastkrxterien können auch in normalisierter Form benutzt werden. Dabei ergibt sich,
Anzahl der schwarzen Bits B " (normalisiert) = i* Maskenfläche
■#vfh Ap \ AAX^«!***! *Ael» iJU t& *■· v^«A>
<■* / ν ^t
Es wird vorausgesetzt, daß die am häufigsten auftretenden Merkmale
die oben definierten Grundmerkmale sind. Unter dieser Voraus
setzung kann der normalisierte Wert für B„_ für eine Strichstärke
Ku
von 2 oder 3 Bit Breite definiert werden als
BVT (normalisiert) = ψ f
KJ . LA L
hierin bedeuten:
Unter der Voraussetzung L = A = 7
für SW =2: B^T (normalisiert) = % = 0,29
für SW = 3: ΒνΎ (normalisiert) = |- = 0.43.
Daher bewegt sich der gewünschte lokale Kontrast B' (normalisiert)
i\j
für ein Grundmerkmal innerhalb einer Maske von 7x7 Elementarflächen
bei einer Strichbreite von 2 bis 3 Bit innerhalb eines Bereiches von 0,29 bis 0,43. Dies bedeutet, daß die Anzahl der
RO 970 026
3098U/0935
schwarzen Bits im Zeichenmuster, das innerhalb der Maske zu sehen
ist, zwischen 14 und 21 liegen sollte. Da S„T und ΑνΎ zu B„,
KJ KJ KJ
lineare Beziehungen besitzen, repräsentiert jede dieser Kontrastmessungen
die durchschnittliche Strichstärke.
Die Beziehung zwischen den Werten B1,,, A1.T und S„T und den Schwell*
KJ KJ KJ
werten werden im nachfolgenden diskutiert. Die relativen Beziehungen
zwischen den Kontrastmessungen sind ebenso bedeutsam wie die absoluten Werte jeder Messung. Die absolute Höhe jeder der Messungen
indiziert den durchschnittlichen Schwarz/Weiß-Strichkontrast, während ihre Beziehung untereinander zur Definition von Fehlmarkierungen,
Schatten oder sonstigen Unregelmäßigkeiten innerhalb oder zwischen Zeichen dienen können. Diese Kontrastmessungen
werden benutzt, um die Schwellwerte T„ und T_ festzulegen. Die
r. X
beiden letztgenannten Schwellwerte dienen sodann zur Definition der als Minimum akzeptierbaren Wahrscheinlichkeitswerte E und I
und ihrer absoluten Minimaldifferenz, die benötigt wird, um eine Entscheidung über das in der Position X befindliche Bit zu
treffen.
Die in den Fign. 6 und 9 dargestellten Kurven beziehen die
Schwellwerte T und T auf die Kontrastmessungen. Der Verlauf
dieser Kurven wurde empirisch bestimmt. Die verschiedensten Zeichentypen, z.B. aus Maschinenausdrucken, von manuellen oder
elektrischen Schreibmaschinen hergestellte und handgeschriebene Zeichen wurden analysiert und gewünschten Qualitätsbedingungen
gegenübergestellt. Für jeden der drei Werte Bv-, S„_ und A„T
KJ KJ KJ
sowie für ihre Kombinationen wurde eine Vielzahl von Schwellwerten
untersucht, bis die gewünschte Qualität erreicht war. Das Resultat dieser Bestimmungen für die Maske aus 7x7
Feldern ist in den Kurven T , T__, T_. und T„_ in Fign. 8 und
XX X/ £>X ti/
9 dargestellt. Die Werte von T und T wurden entsprechend dem
oben beschriebenen Algorithmus entwickelt. Diese Werte werden für andere Algorithmen sich verändern, jedoch wird ihre Beziehung
untereinander ähnlich bleiben. In gleicher Weise, wie eine Normalisierung des Wertes B T erfolgt, können die absoluten Größen
JKU
RO 970 026 , , . ΛΛ - F
3098U/0935
von A.,T und ST,_. zvir Erzielung einer generellen Beziehung für die
Ku KJ
Kontrastregeln benutzt werden.
Die folgenden Regeln für die Kontrastbeziehung sind experimentell entwickelt worden unter Benutzung der Kontrastmessungen ARJf
STJ._ und B^, zur Erzielung einer Entscheidung, die auf den Schwell-
KJ KJ
funktionen T und T1 basiert. Der Aufbau der Regel kann am besten
unter Zugrundelegung eines speziellen Falles verstanden werden, bei dem der gewünschte lokale Kontrast für das Grundmerkmal innerhalb
des maskierten Feldes aus 7x7 Feldern zwischen 14 und 21 rangiert. Normalisiert man diesen Wert, so muß der gewünschte
Kontrast im Bereich zwischen O,29 und 0,43 liegen. Als erstes
sei die Bestimmung von AxJ betrachtet. Dieser Wert wird benutzt,
um die Zeichenmuster in zwei Kontrastklassen zu separieren, in solche, die eine größere als die gewünschte Strichbreite aufweisen
und in solche, deren Strichbreite gleich oder kleiner als die gewünschte Stärke ist. Wenn demzufolge der Wert A
> 22 ist,
KJ —*
wodurch eine größere als die gewünschte Strichstärke angezeigt wird, werden die Werte T_ und T_ als konstant behandelt. Dies
Ei JL
bedeutet, daß T =K , während Tg-K5, ist. In diesem speziellen
Beispiel ergibt sich für T =0,1 und T =0,4. Wenn der Wert AT,,
<
£> X KJ —
ist, werden die Muster in zwei weitere getrennte Kategorien eingeteilt.
Hierzu dient der Wert B _, der die Muster unterteilt in
KJ
solche, die einen größeren lokalen Kontrast als den gewünschten aufweisen, und solche, deren Wert ΒνΎ
< 22 ist. Für Muster, die
KJ
einen größeren als den gewünschten lokalen Konstrast aufweisen d.h.,
daß BKJ <_ 22 ist - werden die Kurven aus Fig. 8 benutzt.
Da dies anzeigt, daß die Nachbarschaft des Entscheidungsfeldes
dunkel ist, d.h. also starken Kontrast aufweist, wird durch die Kurven in Fig. 8 der Schwellwert T„ wesentlich niedriger als
der Schwellwert T angesetzt. Dadurch wird die Extraktion höher gewichtet als die Einsetzung.
Sobald festgestellt wird, daß der lokale Kontrast B_, <
22 ist -
KJ
in diesem speziellen Fall wird N2=22 gesetzt - wird die Beziehung
zwischen S , A und B .. zur Bestimmung der Schwellwertauswahl
HO 97Ο 026
30 98H/0935
benutzt. Bei gleichmäßigem Druck, d.h., wenn S„- = A„, = B1,T oder
Ku KJ JxJ
wenn das in der Entscheidungsposition X1. _ befindliche Bit sich
KJ
am Anfang oder Ende des Musters befindet, so daß S-,- 7* A„T,
KJ KJ
werden die Kurven aus Fig. 9 zur Bestimmung der Schwellwerte T und T benutzt. Für jedes die Bedingung erfüllende Muster,
wobei sowohl ΆνΎ und B1.T jeweils
< 22 und weiterhin S1,_ φ A1,_ f
KJ KJ KJ KJ
Bx, _, wodurch angezeigt wird, daß der Druck nicht gleichmäßig ist,
werden die Kurven aus Fig. 8 nur im Bereich B
< 22 benutzt. Die Beziehung zwischen den drei Kontrastmessungen sind in der Tafel
auf Fig. 10 zusammengestellt.
Die Methoden zur Bestimmung der Wahrscheinlichkeiten I und E sind ebenso dargestellt worden wie die Festlegung der Schwellwerte
T£ und T-. Die Entscheidung, das an der Stelle XRJ befindliche
Bit schwarz oder weiß zu machen, erfolgt, sobald diese genannten Werte bestimmt sind, gemäß nachfolgenden Regeln.
a) x'kj β x
Wenn |I -Ej >T * |Tg-T1 j
und I > T_ sowie E < T_.
und I > T_ sowie E < T_.
— JL Ci
Unter der Voraussetzung, daß das in Position X„_ befindliche Bit
KiJ
ursprünglich schwarz war, wird dieses schwarze Bit als ein Teil des existierenden Randes beibehalten. War jedoch das in der Entscheidungsposition
befindliche Bit ursprünglich weiß, so wird zur Glättung des Randbereichs an dieser Stelle ein schwarzes
Bit eingesetzt.
b) x-KJ - 0
Wenn j I -Ej ^ T
und E > T„ sowie I < TT.
— ti
X
Wenn in diesem Fall die Stelle X„, ein schwarzes Bit enthielt,
KJ
RO 970 026
3098U/0935
wird dieses schwarzes Bit extrahiert und dadurch die Kante geglättet
bzw. konvergiert. Enthielt die Entscheidungsstelle ursprünglich ein weißes Bit, so wird dieses Bit beibehalten.
c) X'kJ = XKJ
zeigt an, daß keine Änderung vorgenommen werden kann, da für die Entscheidungsfxndung ausreichende Daten nicht zur Verfügung
stehen. Dies tritt ein, wenn |E -Ij < T.
Wie oben bereits erwähnt, ist, unter der Voraussetzung |l - Ej
> T sowohl I > T_ und E > T„, I verglichen wird mit E und die
— — I ■ — iu
Steuerung durch den größeren der beiden Werte erfolgt.
Die Benutzung der Messung ΔΒ soll nicht beschrieben werden.
Dieses Maß wird benutzt, um die Iterativsteuerschaltung 30 selektiv zu triggern. Die Schaltung 30 kann betrachtet werden als ein
Schalter zur Verbindung des Ausgangsschieberegisters 32 mit der Entscheidungslogik und nicht mit dem Eingangsregister 10. Dies
ist schematisch in Fig. 3 durch die Schalter 34 und 36 dargestellt. In Wirklichkeit wird der Inhalt des Ausgangsregisters
nicht in das Eingangsregister geschoben, sondern ausgewählte Bereiche des Registers 32 werden gelesen und in die Entscheidungslogik
und nicht in das Register 10 übertragen.
Wie anhand von Fig. 7 deutlich wird, werden die Werte ΒνΎ und
ΒΚ+Δ J ^**r Jet*es Bit, das an die Position XRJ gelangt, berechnet.
Der Wert B„+Ä j wird bestimmt durch das konzeptgemäße Bewegen
der Maskenfläche auf den Mittelpunkt in Xr+a j und durch Zählung
der schwarzen Bits in diesem Bereich.
Erweist sich ΔΒντ als positiv und B„T
> 36, so ist der lokale Kontrast um XRJ zu dunkel um ein wertvolles Merkmal abzugeben,
und auch der unmittelbare zukünftige Kontrast wird dunkler. Es ist daher wünschenswert, ein verdeutlichtes Videosignal zu benutzen,
d.h. die Elementarflächen, wie sie im Ausgangsregister
3098U/0935
gespeichert sind, durch die Bereiche, die durch starken Kontrast verborgen sind, hindurchzuführen. Die Entscheidungen werden auf
der Basis des Inhalts der Spalten J+l, J+2 und J+3 im Ausgangsregister
32 getroffen und nicht aufgrund des Inhalts dieser
Spalten im Eingangsregister 10.
Spalten im Eingangsregister 10.
Die Erfindung wurde hier im einzelnen beschrieben am Beispiel
einer vorteilhaften Ausführungsform. Das Wesen der Erfindung
macht jedoch nicht diese Ausführungsform, sondern das dahinterstehende allgemeine Prinzip aus.
einer vorteilhaften Ausführungsform. Das Wesen der Erfindung
macht jedoch nicht diese Ausführungsform, sondern das dahinterstehende allgemeine Prinzip aus.
RO 970 026
3098U/0935
Claims (6)
- PATENTANSPRÜCHEVerfahren der automatischen Zeichenerkennung, bei dem ein Bereich eines Aufzeichnungsträgers abgetastet und sein Informationsgehalt binär digitalisiert einem Speicher, vorzugsweise einem Schieberegister, zugeführt wird, zur Verbesserung der Erkennbarkeit von gestörten Zeichen, dadurch gekennzeichnet,daß eine Reihe von Grundmerkmalen definiert wird, aus denen sich alle zu erkennenden Zeichen zusammensetzen, daß eine Zelle des Speichers als Entseheidungsstelle Χχ,τ* die einen Bezugspunkt definiert, festgelegt wird, für deren Umgebung die Wahrscheinlichkeit I (Konvergenzwahrscheinlichkeit) , daß nämlich die der Entscheidungsstelle X^_ benachbarten Speicherzelleninhalte ein Grundmerkmal erfüllen, und die Wahrscheinlichkeit E (Divergenzwahrscheinlichkeit), daß nämlich die der Entscheidungsstelle X^ benachbarten Speicherzelleninhalte kein Grundmerkmal erfüllen, bestimmt wird, wobei im ersten Fall vorausgesetzt wird, daß die Entscheidungsstelle 2L.J ein Zeichenteil enthält, während im zweiten Fall angenommen wird, die Entseheidungsstelle selbst enthalte kein Zeichenelement, daß in Abhängigkeit vom in der Umgebung der Entscheidungsstelle XxJ herrschenden Kontrast Schwellwerte T und T für die Wahrscheinlichkeiten I und E bestimmt werden, und daß abhängig von dem Verhältnis der Wahrscheinlichkeiten I bzw. E zu ihren entsprechenden Schwellwerten T_ bzw. T„ der Speicherinhalt der Ents cheidungs stelle X^ belassen oder verändert wird.
- 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß bei Verwendung eines matrixartig in Serie geschalteten Schieberegisters die den Bezugspunkt definierende Entscheidungsstelle Χ.., den Mittelpunkt eines vorzugsweise quadratischen Feldes (Maskenfeld 12) bildet, und daß nur der Inhalt innerhalb dieses Maskenfeldes (12)RO 970 0263098U/0935liegender Speicherzellen zur Bestimmung der Wahrscheinlichkeiten I und E und der Schwellwerte Tx und T_ dient.
- 3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß zur Bestimmung der Wahrscheinlichkeiten I und E nur der Inhalt eines innerhalb des Maskenfeldes (12) befindlichen, die Ents ehe i dungs s teile XT, T einschließenden inneren FeldesKJdient, dessen Lage und Größe von dem zu vergleichenden Grundmerkmal abhängt,und daß zur Bestimmung der Schwellwerte Tx und T_ der Inhalt des gesamten Maskenfeldes (12) ausgewertet wird,
- 4. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß zur Bestimmung der Schwellwerte T und T_ das Maskenfeld (12) um mindestens eine Spalte und/oder Zeile verschoben werden kann.
- 5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Grundmerkmale nach Richtung und Strichstärke definiert werden.
- 6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß insgesamt vier Grundmerkmale, nämlich horizontale, vertikale, und unter einem Winkel von +45° oder -45° gegenüber der Vertikalen geneigte Linien vorgegebener Strichstärke definiert werden.RO 9 70 026 , , ΛΛΛ1-3098U/0935
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US18521471A | 1971-09-30 | 1971-09-30 |
Publications (1)
Publication Number | Publication Date |
---|---|
DE2247942A1 true DE2247942A1 (de) | 1973-04-05 |
Family
ID=22680075
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19722247942 Withdrawn DE2247942A1 (de) | 1971-09-30 | 1972-09-29 | Zeichenerkennungsverfahren zur verbesserung der erkennbarkeit gestoerter zeichen |
Country Status (5)
Country | Link |
---|---|
US (1) | US3737855A (de) |
JP (1) | JPS5627910B2 (de) |
DE (1) | DE2247942A1 (de) |
FR (1) | FR2154532B1 (de) |
GB (1) | GB1381970A (de) |
Families Citing this family (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS604505B2 (ja) * | 1972-07-10 | 1985-02-04 | スキヤン − オプテイクス インコ−ポレ−テツド | マルチ・フオント光学式文字認識装置 |
FR2262834B1 (de) * | 1973-04-09 | 1977-10-21 | Calspan Corp | |
JPS527349A (en) * | 1975-07-08 | 1977-01-20 | Toyo Netsuki Kk | Method of surface treating to form metal coating and products thereby |
JPS5218132A (en) * | 1975-08-01 | 1977-02-10 | Hitachi Ltd | Binary circuit |
IT1055651B (it) * | 1975-11-03 | 1982-01-11 | Elsag | Sistema elettronico per la lettura di simboli |
US4162481A (en) * | 1976-12-22 | 1979-07-24 | Recognition Equipment Incorporated | Adaptive correlator for video processing |
US4119947A (en) * | 1977-07-20 | 1978-10-10 | Howard Noyes Leighton | Optical signal processor |
JPS5451733A (en) * | 1977-10-03 | 1979-04-23 | Toshiba Corp | Character reading system |
JPS5537092A (en) * | 1978-09-05 | 1980-03-14 | Ibm | Mode switch for setting threshold value |
US4491964A (en) * | 1979-04-23 | 1985-01-01 | Recognition Equipment Incorporated | Image processing integrated circuit |
US4414685A (en) * | 1979-09-10 | 1983-11-08 | Sternberg Stanley R | Method and apparatus for pattern recognition and detection |
US4298858A (en) * | 1980-03-27 | 1981-11-03 | The United States Of America As Represented By The Secretary Of The Air Force | Method and apparatus for augmenting binary patterns |
US4408343A (en) * | 1981-02-27 | 1983-10-04 | Burroughs Corporation | Image enhancement for optical character readers |
US4672186A (en) * | 1981-10-01 | 1987-06-09 | Banctec Inc. | Digital document scanning system |
US4468809A (en) * | 1981-12-23 | 1984-08-28 | Ncr Corporation | Multiple font OCR reader |
US4625330A (en) * | 1983-12-19 | 1986-11-25 | Ncr Corporation | Video enhancement system |
US4541116A (en) * | 1984-02-27 | 1985-09-10 | Environmental Research Institute Of Mi | Neighborhood image processing stage for implementing filtering operations |
US4577235A (en) * | 1984-08-20 | 1986-03-18 | The Mead Corporation | Text/continuous tone image decision processor |
JPS6164370A (ja) * | 1984-09-07 | 1986-04-02 | Hitachi Cable Ltd | 金属管材の内面処理方法 |
US4698843A (en) * | 1985-08-19 | 1987-10-06 | Rca Corporation | Method for compensating for void-defects in images |
US4742557A (en) * | 1985-11-08 | 1988-05-03 | Ncr Corporation | Adaptive character extraction method and system |
US4764971A (en) * | 1985-11-25 | 1988-08-16 | Eastman Kodak Company | Image processing method including image segmentation |
US4797806A (en) * | 1987-02-19 | 1989-01-10 | Gtx Corporation | High speed serial pixel neighborhood processor and method |
US4982294A (en) * | 1987-07-24 | 1991-01-01 | Eastman Kodak Company | Apparatus for enhancing and thresholding scanned microfilm images and methods for use therein |
US4853795A (en) * | 1987-07-24 | 1989-08-01 | Eastman Kodak Company | Forward look ahead techniques for tracking background and noise levels in scanned video images |
US4868670A (en) * | 1987-07-24 | 1989-09-19 | Eastman Kodak Company | Apparatus and method for improving the compressibility of an enhanced image through use of a momentarily varying threshold level |
US4969202A (en) * | 1988-03-31 | 1990-11-06 | Honeywell Inc. | Image recognition edge detection method and system |
JPH01292487A (ja) * | 1988-05-19 | 1989-11-24 | Sony Corp | 文字認識装置 |
US5224179A (en) * | 1988-12-20 | 1993-06-29 | At&T Bell Laboratories | Image skeletonization method |
US7382929B2 (en) | 1989-05-22 | 2008-06-03 | Pixel Instruments Corporation | Spatial scan replication circuit |
US6529637B1 (en) | 1989-05-22 | 2003-03-04 | Pixel Instruments Corporation | Spatial scan replication circuit |
US5060284A (en) * | 1990-03-23 | 1991-10-22 | Eastman Kodak Company | Adaptive error diffusion thresholding for document images |
FR2661061B1 (fr) * | 1990-04-11 | 1992-08-07 | Multi Media Tech | Procede et dispositif de modification de zone d'images. |
EP0526295B1 (de) * | 1991-07-10 | 2000-09-27 | Fujitsu Limited | Bilderzeugungsgerät |
ATE181631T1 (de) * | 1991-07-19 | 1999-07-15 | Princeton Video Image Inc | Fernsehanzeigen mit ausgewählten eingeblendeten zeichen |
EP0539854B1 (de) * | 1991-11-01 | 1999-03-17 | Eastman Kodak Company | Verfahren und Gerät zur Detektion von Text in Punktmatrixdruck zur Verbesserung von optischer Zeichenerkennung |
US5357581A (en) * | 1991-11-01 | 1994-10-18 | Eastman Kodak Company | Method and apparatus for the selective filtering of dot-matrix printed characters so as to improve optical character recognition |
CA2081406C (en) * | 1991-12-23 | 1997-09-16 | Chinmoy Bhusan Bose | Method and apparatus for connected and degraded text recognition |
US5212741A (en) * | 1992-01-21 | 1993-05-18 | Eastman Kodak Company | Preprocessing of dot-matrix/ink-jet printed text for Optical Character Recognition |
US6469741B2 (en) | 1993-07-26 | 2002-10-22 | Pixel Instruments Corp. | Apparatus and method for processing television signals |
US5778105A (en) * | 1994-01-14 | 1998-07-07 | R.R. Donnelley & Sons Company | Method of and apparatus for removing artifacts from a reproduction |
JPH0951489A (ja) * | 1995-08-04 | 1997-02-18 | Sony Corp | データ符号化/復号化方法および装置 |
US6983083B2 (en) * | 2001-02-13 | 2006-01-03 | Eastman Kodak Company | Image specific perceived overall contrast prediction |
JP3982817B2 (ja) * | 2003-03-07 | 2007-09-26 | 株式会社東芝 | 画像処理装置および画像処理方法 |
US8787660B1 (en) * | 2005-11-23 | 2014-07-22 | Matrox Electronic Systems, Ltd. | System and method for performing automatic font definition |
EP2320390A1 (de) * | 2009-11-10 | 2011-05-11 | Icar Vision Systems, SL | Verfahren und System zum Lesen und Validieren von Identitätsdokumenten |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE1250166B (de) * | 1962-05-21 | 1967-09-14 | International Business Machines Corporation Armonk, NY (V St A) | Vorrichtung zur maschinellen Zeichen erkennung |
US3588818A (en) * | 1967-07-07 | 1971-06-28 | Ncr Co | Character recognition system employing continuity detection and registration means |
FR1599243A (de) * | 1968-12-12 | 1970-07-15 |
-
1971
- 1971-09-30 US US00185214A patent/US3737855A/en not_active Expired - Lifetime
-
1972
- 1972-08-23 GB GB3918872A patent/GB1381970A/en not_active Expired
- 1972-08-25 JP JP8466272A patent/JPS5627910B2/ja not_active Expired
- 1972-09-12 FR FR7233192A patent/FR2154532B1/fr not_active Expired
- 1972-09-29 DE DE19722247942 patent/DE2247942A1/de not_active Withdrawn
Also Published As
Publication number | Publication date |
---|---|
JPS5627910B2 (de) | 1981-06-27 |
FR2154532B1 (de) | 1973-12-07 |
FR2154532A1 (de) | 1973-05-11 |
US3737855A (en) | 1973-06-05 |
GB1381970A (en) | 1975-01-29 |
JPS4843542A (de) | 1973-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE2247942A1 (de) | Zeichenerkennungsverfahren zur verbesserung der erkennbarkeit gestoerter zeichen | |
DE1549930C3 (de) | Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen | |
DE3633743C2 (de) | ||
DE2238715C2 (de) | Verfahren zum Aufbereiten eines beim Abtasten einer Vorlage gewonnenen Videosignales zum Auszählen und/oder Ausmessen von Bildeinzelheiten und Schaltungsanordnung zum Durchführen dieses Verfahrens | |
DE2909153C2 (de) | Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern | |
DE2801536C2 (de) | Zeichenformkodiervorrichtung | |
DE3408337C2 (de) | ||
DE3320691C2 (de) | ||
EP0096084A1 (de) | Verfahren zur Vermeidung von Bildfehlern beim Mehrfarbendruck, die durch fehlerhaften Übereinanderdruck der Farbauszüge entstehen | |
DE4427992C2 (de) | Verfahren zum Erzeugen einer Dokumenten-Darstellung aus einem Bitmap-Bild eines Dokuments | |
DE2939457A1 (de) | Verfahren zur hervorhebung eines bildbereiches innerhalb eines bildes, das auf einem bildschirm dargestellt wird | |
DE3615906A1 (de) | Bildinformationserkennungsgeraet | |
EP0048941A2 (de) | Verfahren zum Verkleinern von grafischen Mustern | |
DE3241673C2 (de) | Verfahren zum Verdichten von Daten Zwei-wertiger Bilddarstellungen | |
EP0301384B1 (de) | Schaltungsanordnung zur Aufbereitung von schrägstehenden, insbesondere handgeschriebenen Zeichen | |
DE1774672A1 (de) | Zeichenerkennungsvorrichtung | |
WO1992010056A1 (de) | Verfahren zur generierung und speicherung von digitalisierten dichte-schwellwerten zur rasterung einer halbton-bildvorlage | |
DE1549764B2 (de) | Zeichenerkennungsgerat mit einer Zeichentrennschaltung | |
DE2254913A1 (de) | Verfahren zur erzeugung graphischer darstellungen aus parametrischen daten | |
DE3341371A1 (de) | Verfahren und einrichtung zum erzeugen eines kombinierten bildsignals | |
DE2928378A1 (de) | Verfahren und einrichtung zur elektronischen erzeugung einer halbton- nachbildung eines originalbildes | |
DE1524416A1 (de) | Anordnung zur Auswahl von Datenreferenzen zum Quervergleich mit einem unbekannten Datensatz | |
WO1991016783A1 (de) | Verfahren zur digitalisierten rasterung einer halbton-bildvorlage | |
DE3830990C2 (de) | ||
DE1549860C3 (de) | Verfahren zur Herstellung eines korrigierten Textes und Vorrichtung zur Durchführung dieses Verfahrens |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OD | Request for examination | ||
8139 | Disposal/non-payment of the annual fee |