DE2247942A1 - Zeichenerkennungsverfahren zur verbesserung der erkennbarkeit gestoerter zeichen - Google Patents

Zeichenerkennungsverfahren zur verbesserung der erkennbarkeit gestoerter zeichen

Info

Publication number
DE2247942A1
DE2247942A1 DE19722247942 DE2247942A DE2247942A1 DE 2247942 A1 DE2247942 A1 DE 2247942A1 DE 19722247942 DE19722247942 DE 19722247942 DE 2247942 A DE2247942 A DE 2247942A DE 2247942 A1 DE2247942 A1 DE 2247942A1
Authority
DE
Germany
Prior art keywords
bit
decision point
probability
contrast
decision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
DE19722247942
Other languages
English (en)
Inventor
Alfred Cutaia
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of DE2247942A1 publication Critical patent/DE2247942A1/de
Withdrawn legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/20Combination of acquisition, preprocessing or recognition functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

Böblingeri, 28. September 1972 bt/we-fr
Anmelderin: International Business Machines
Corporation, Armonk, N.Y. 10504
Amtl. Aktenzeichen: Neuanmeldung _ Q . ~
Aktenzeichen der Anmelderin: RO 9 70 026
Zeichenerkennungsverfahren zur Verbesserung der Erkennbarkeit gestörter Zeichen
Die Erfindung betrifft ein Verfahren der automatischen Zeichenerkennung, bei dem ein Bereich eines Aufzeichnungsträgers abgetastet und sein Informationsgehalt binär digitalisiert einem Speicher, vorzugsweise einem Schieberegister, zugeführt wird, zur Verbesserung der Erkennbarkeit von gestörten Zeichen.
Die Zuverlässigkeit von Zeichenerkennungssystemeh hängt in großem Maße davon ab, wie weit die aus dem abgetasteten Zeichen gewonnenen Merkmale mit den erwartenden definierten Vergleichsmerkmalen übereinstimmen. Infolge einer Reihe von Einflüssen, auf die der Benutzer solcher Anlagen oftmals keinen Einfluß ausüben kann, korrespondieren die aus dem abgetasteten Zeichen gewonnenen .Zeichenmerkmale nicht in ausreichender Weise mit den Vergleichsmerkmalen. So können beispielsweise von einem Schreibmaschinendurchschlag abgetastete Zeichen viel zu große Strichstärken aufweisen, wozu noch kaum diskriminierbare Zeichenränder kommen« Es ist sogar häufig der Fall, daß sich Ränder benachbarter Zeichen berühren. Ähnlich schwierig ist die Erkennung sehr leicht gedruckter Zeichen, bei denen Zeichenteile für maschinelle Erkennung zu undeutlich sind oder gänzlich fehlen.
Zur Verbesserung der Betriebssicherheit von Zeichenerkennungs-
3098U/0935
maschinen ist es bekannt, bereits vor dem zur Erkennung führenden Vergleich auf die abgetasteten Zeichenmerkmale in der Weise einzuwirken, daß die Zeichenmerkmale den Vergleichsmerkmalen angepaßt werden. Ein Beispiel für eine derartige Anordnung findet sich in der US-Patentschrift 3 196 398. Durch diese bekannte Anordnung wird aus einem Zeichen mit variabler Strichstärke ein durch die Vergleichseinrichtung besser verarbeitbares Zeichenmuster mit kontinuierlicher Linienführung konstanter Strichstärke gewonnen. Das bekannte System ist jedoch nicht in der Lage, eine Reihe von weiteren, bei der maschinellen Zeichenerkennung auftretenden Störungen, wie beispielsweise zu überhaupt keinem Zeichen gehörende Fehlmarkierungen oder Zeichenberührungen, zu verarbeiten.
Zur Verbesserung der Zuverlässigkeit und Wirtschaftlichkeit von Maschinen zur automatischen Zeichenerkennung hat sich die vorliegende Erfindung die Vermeidung dieser Nachteile zum Ziel gesetzt. Diese Aufgabe wird durch ein Verfahren der automatischen Zeichenerkennung, bei dem ein Bereich eines Aufzeichnungsträgers abgetastet und sein Informationsgehalt binär digitalisiert einem Speicher, vorzugsweise einem Schieberegister, zugeführt wird, zur Verbesserung der Erkennbarkeit von gestörten Zeichen gelöst, welches sich dadurch auszeichnet, daß eine Reihe von Grundmerkmalen definiert wird, aus denen sich alle zu erkennenden Zeichen zusammensetzen, daß eine Zelle des Speichers als Entscheidungsstelle XKJi die einen Bezugspunkt definiert, festgelegt wird, für deren Umgebung die Wahrscheinlichkeit I (Konvergenzwahrscheinlichkeit) , daß nämlich die der Entscheidungsstelle XRJ benachbarten Speicherzelleninhalte ein Grundmerkmal erfüllen, und die Wahrscheinlichkeit E (Divergenzwahrscheinlichkeit), daß nämlich die der Entscheidungsstelle X1.T benachbarten Speicherzelleninhalte kein Grundmerkmal erfüllen, bestimmt wird, wobei im ersten Fall vorausgesetzt wird, daß die Entscheidungsstelle X_,_ ein
KJ
Zeichenteil enthält, während im zweiten Fall angenommen wird, die Entscheidungsstelle selbst enthalte kein Zeichenelement, daß in Abhängigkeit vom in der Umgebung der Entscheidungsstelle
ro 970 026 3098 U/0935
X herrschenden Kontrast Schwellwerte T und T für die Wahrscheinlichkeiten I und E bestimmt v/erden, und daß abhängig von dem Verhältnis der Wahrscheinlichkeiten I bzw. E zu ihren entsprechenden Schwellwerten T1 und T„ der Speicherinhalt der Entscheidungsstelle X„T belassen oder verändert wird.
Die vorliegende Erfindung kann in vorteilhafter Weise in die Software eines Zeichenerkennungssystems inplementiert werden. Zur Erkennung der Zeichenmuster werden über eine Mehrzahl von Elementarflächen, in die der abzutastende Aufzeichnungsträger eingeteilt wurde, z.B. mittels eines Lichtpunktabtasters abgefühlt. Die infolge des unterschiedlichen Remissionsgrades der Oberfläche auf-' tretende Variatione der zurückgestrahlten Lichtmenge wird durch optoelektrische Wandler abgefühlt und in digitalisierter Form einem matrixartig aufgebauten Schieberegister seriell zugeführt.
Ein Teil dieses Schieberegisters wird als sogenanntes Maskenfeld bezeichnet und innerhalb dieses Feldes eine Speicherzelle als Entscheidungsstelle X _ definiert. Sobald ein neues Bit in die letztgenannte Speicherzelle eintritt, wird eine Serie von Operationen durchgeführt, an deren Ende die Entscheidung steht, ob das eingeführte Bit in seinem Status belassen oder geändert wird. Die Entscheidung, ob in der Speicherzelle ΧνΎ ein "schwarzes" oder "weißes" Bit eingeschrieben werden soll, wird unabhängig von dem tatsächlich an dieser Stelle gespeicherten Bit getroffen.
Weitere Einzelheiten, die die Arbeitsweise der Erfindung betreffen, können der nachfolgenden Beschreibung, weitere Merkmale den Patentansprüchen entnommen werden.
Auf den Zeichnungen zeigen:
Fign. Ia-Ic eine Reihe von Zeichen in ihrem Ursprungszustand und in verdeutlichter.Form,
KO 9 70 026 Λ . . _ .Λr
3098U/093B
Fign. 2a-2c eine zweite Buchstabengruppe in ursprünglicher
und verdeutlichter Form,
Fig· 3 eine Übersicht einer Anordnung zur Durchführung
des erfindungsgemäßen Verfahrens,
Fig. 4 ein Flußdiagrarran der Verfahrensschritte,
Fig. 5 ein Ausschnitt des Schieberegisters in Fig. 3,
Fig. 6 graphische Darstellungen einer Reihe von Grund-
merkmalen,
Fig. 7 die Lage des Maskenfeldes innerhalb des Speichers,
Fign. 8 u. 9 empirisch ermittelte Kurven zur Bestimmung der
Schwellwerte T und T ,
Fig. 10 eine Zusammenstellung der die Auswahl der Schwellwerte T_ und T_ bestimmenden Regeln.
A. Allgemeines Konzept
Die beschriebene Verdeutlichungstechnik zur Verbesserung der Erkennbarkeit von Zeichen bewirkt eine Erhöhung der Zuverlässigkeit konventioneller Zeichenerkennungssysteme. Dies erfolgt durch Veränderung von undeutlichen Zeichenmustern in der Weise, daß das Auftreten von Zeichenausfüllungen, Fehlmarkierungen und Zeichenfehlstellen, die in und um sich auf einem zu lesenden Aufzeichnungsträger befindenden Zeichen auftreten, vermindert wird. Als Resultat der Korrekturtechnik werden die Zeichenmerkmale akzentuiert, die Merkmalgrenzen bereinigt und die Strichstärken des Zeichens standardisiert. Außerdem werden Fehlmarkierungen, die die Erkennbarkeit des Zeichens beeinflussen können, eliminiert.
Fig. la zeigt das aus undeutlichen Zeichen bestehende englische Wort JUMP. Derartige relativ leicht gedruckte und daher kaum
RO 970 026
3098U/093B
definierte Zeichen können das Resultat schlechter Farbbänder oder ungenügender Tintenzufuhr sein.
Fig. 2a zeigt in ebenfalls undeutlichen Zeichen die beiden Buchstaben A und M. Diese Zeichen mit sehr großer Strichstärke, die auch insgesamt sehr breit sind, können durch Verwendung eines neuen, sehr stark getränkten Farbbandes auf der Schreibmaschine oder beim Kopieren mit einem nicht korrekt eingestellten Kopiergerät entstehen. Daß für automatische Zeichenerkennungsmaschinen gewisse Schwierigkeiten bei der Erkennung von Zeichen, seien sie nun relativ schwach ausgeprägt wie in Fig. la oder sehr fett wie in Fig. 2a, bestehen, liegt auf der Hand. Um die Zeichen zu standardisieren und die Merkmalgrenzen zu akzentuieren, werden die Begrenzungen jedes Zeichens untersucht, um festzustellen, ob und an welcher Stelle zur Verdeutlichung des Zeichenmusters Markierungen eingesetzt werden müssen.
Es soll noch darauf hingewiesen werden, daß üblicherweise die Zeichen auf abzutastenden Aufzeichnungsträgern aus meist zusammenhängenden Linien bestehen, während hier zur Erläuterung der Wirkungsweise die Zeichen aus diskreten Markierungspunkten zusammengesetzt dargestellt sind. Es· kommt noch hinzu, daß die Verdeutlichungsoperation, die das Wesen diesem Erfindung ausmacht, auf Zeichen angewandt wird, deren ursprüngliche Ausbildung auf ein Muster aus diskreten Punkten reduziert wurde.
Die einzelnen Punkte entsprechen der Aufteilung des zu lesenden Aufzeichnungsträgers in Elementarflächen, von denen jede abgetastet wird, um zu bestimmen, ob sie entweder eine vorgegebene Mindestschwärzung aufweist oder ein den Hintergrund des Aufzeichnungsträgers anzeigendes Fehlen einer solchen Markierung erkennen läßt. Elernentarflächen, deren Schwärzung den vorgegebenen Mindestwert erreicht, werden im folgenden als schwarze Elementarflächen, solche, in denen der Mindestwert nicht erreicht wird, als weiße Elementarflächen bezeichnet. Die Ausdrücke schwarze bzw. weiße Elementarfläche werden natürlich nur benutzt, um
RO970026 . 3093U/0935
den Kontrast zwischen einer Markierung und dem Hintergrund des Aufzeichnungsträgers zu definieren. Demzufolge können schwarze Elementarflächen auch solche sein, die sich durch eine gegenüber dem dunklen Hintergrund abhebende helle Markierung auszeichnen.
Die Umformung des undeutlichen Zeichens in eine Serie von diskreten Markierungen ist durchaus konventioneller Art und wird erreicht durch Betrachtung des Dokuments in der Weise, als ob es aus einer Vielzahl von Elernentarflächen bestünde. Der Aufzeichnungsträger kann beispielsweise durch einen Abtaststrahl entlang eines Rastermusters abgetastet werden, bei dem der Abtaststrahl jeweils eine Reihe von Elementarflächen überstreicht. Dabei kann, wie es bekannt ist, der Lauf des Abtaststrahls in elementare, diskriminierbare Inkremente unterteilt werden. Innerhalb jedes Abtastschrittes wird die Intensität des reflektierten bzw. remittierten Strahls gemessen, um feststellen zu können, ob der Strahl sich über eine markierte oder eine unmarkierte Elementarfläche bewegt hat.
Die Fign. Ib und 2b illustrieren einige der durch das System vorgenommenen Entscheidungen, durch die selektiv der Status einer Reihe von Elementarflächen geändert wurde. Darin bezeichnet das Symbol X Elementarflächen, die vom weißen in den schwarzen Zustand übergeführt werden müssen, während das Symbol 0 ursprünglich schwarze Elementarflächen bezeichnet, die zu weißen verändert werden sollen.
Die Fign. Ic und 2c zeigen die so veränderten Zeichen. Es soll an dieser Stelle darauf hingewiesen werden, daß das System iterativ arbeitet, das bedeutet, die ZeichenVerdeutlichung kann mehrere Durchläufe des Zeichenmusters durch das System erfordern; jeder Durchlauf benutzt das beim vorhergehenden veränderte Zeichenmuster. Auf diese Art und Weise werden die Grenzen des Zeichenmusters kontinuierlich - oder besser: in kleinen Schritten verbessert, indem sie durch Verbreiterung oder Verschmälerung einer standardisierten Strichstärke angenähert werden. Wie aus
RO 970 026
3098U/0935
Fig. lc zu erkennen ist» beträgt die Strichstärke der einzelnen Zeichen nahezu einheitlich drei Elementarflächen.
Fig. 3 zeigt die Vorrichtung zur Verbesserung der Erkennbarkeit von Zeichen. Der Abtaster 2 tastet das auf dem Aufzeichnungsträger 6 befindliche Zeichen 4 ab. Der Abtaststrahl durchläuft eine Anzahl vertikaler Abtastbahnen 1, 2, ... n, deren jede aus einer Anzahl von die Elementarflächen definierenden unterscheidbaren Inkrementen besteht. Die Intensität des von jeder der Elementarflächen reflektierten bzw. remittierten Lichtes wird durch den opto-elektrischen Wandler 8 in ein elektrisches Signal umgewandelt, welches vorteilhafterweise in binärer Form - also als Bit angibt, ob sich in der abgetasteten Elementarfläche eine die Mindestschwärzung übertreffende Markierung befindet oder nicht. Die dabei entstehenden elektrischen Signale sollen demgemäß als schwarzes bzw. weißes Bit bezeichnet werden. Die Ausgangssignale des Wandlers 8 werden einem in Matrixform angeordneten, zweidimensionalen Schieberegister 10 zugeleitet, das insgesamt L Spalten und m Zeilen enthält. Die Anzahl der Zeilen wird durch die Anzahl der Inkremente je Abtastbahn, die ja gleich ist der Anzahl der Elementarfläche je Bahn, bestimmt. Jedes in das Register 10 eingespeiste Bit tritt an der Stelle X0 n ein und wandert entlang der Spalte 0 bis zur Zeile m. Danach wird dieses Bit an die Stelle X_ , verschoben, durchläuft diese Spalte usw.
Ein Teil des Matrixregisters 10 wird als Maskenfeld 12 benutzt, in dessen Mitte sich die Speicherstelle XKJr die die Lage des Entscheidungsbits definiert, befindet. Da jedes in das Schieberegister 10 eintretende Bit durch das gesamte Register geschoben wird, erreicht es auch zu einem bestimmten Zeitpunkt die Stelle Χντ. Wenn sich das in der Entseheidungsstelle befindliche
JmJ
Bit auf dem abgetasteten Aufzeichnungsträger gerade an der Grenze einer Markierung - gleichgültig, ob diese ein Zeichen oder eine Fehlmarkierung darstellt - befindet, werden einige Operationen durchgeführt, die eine eventuelle Änderung des gespeicherten Bit bewirken. Die die Änderung bewirkende Entscheidung wird unabhän-
R0 97ÜO26 3098U/093B
gig davon getroffen, ob sich an der Stelle ΧνΎ ein schwarzes oder ein weißes Bit befindet, d.h., sie hängt nur von den in der Umgebung der Entscheidungsstelle festgestellten Markierungen ab. Dies soll im folgenden noch näher erläutert werden.
Wenn beispielsweise festgestellt wird, daß der Inhalt der Stelle Xx,_ ein Randbit darstellt, wird eine Rand-Konvergenzmessung und
is. J
-Divergenzmessung durchgeführt. Diese Berechnungen werden durch Untersuchung der Inhalte der die Entscheidungsstelle XRJ umgebenden Speicherstellen bewerkstelligt. Hierbei wird festgestellt, ob diese umgebenden Elementarflächen Teil eines festgelegten Satzes ausgewählter Grundmerkmalmuster darstellen, die eine ebenso a priori festgelegte Merkmalverteilung aufweisen. Mathematisch werden diese beiden Wahrscheinlichkeiten ausgedrückt als
P )x + S/X"KJ = 0 V - E (1)
P (X + S/X'KJ = 1 i = I (2)
Darin bedeuten:
X das Markierungsmuster, d.h. den Mustervektor der die Entscheidungsstelle umgebenden Elementarflächen;
S den n~dimensionalen Raum, der die a priori festgelegten Grundmerkmalstriche enthält, d.h. eine Reihe von festgelegten Grundmerkmalen mit einer definierten Strichstärke;
(X' «0) Hypothese, daß die Entscheidung für die Stelle XVT auf weiß fällt;
(X'K =1) Hypothese, daß die Entscheidung auf schwarz fällt.
Die Gleichung 1 zeigt, daß E ein Maß für die Wahrscheinlichkeit dafür ist, daß das Muster X schwarzer Bits, die die Entscheidungsstelle umgeben, nicht Teil irgendeiner der definierten Merkmalgruppen ist unter der Voraussetzung, daß das in der Entscheidungs-
R0 970026 3098H/0935
- 9 stelle enthaltene Bit weiß ist.
In Gleichung 2 ist I ein Maß für die Wahrscheinlichkeit, daß das Muster X schwarzer Bits, die die Entscheidungsstelle XRJ umgeben, unter der Voraussetzung, daß das in letzterer enthaltene Bit schwarz ist, Teil eines der definierten Merkmalsätze ist.
Die Tatsache, daß der festgestellte Wert von I hoch ist, beinhaltet noch nicht genügend Information, um darauf die Entscheidung zu stützen, daß das Bit an der Stelle X„, Teil oder nicht Teil einer Zeichengrenze darstellt. Die Gleichungen 1 und 2 sind einfach Ausdrücke für die Wahrscheinlichkeit, daß das Bit an der Stelle X„T und die es umgebenden schwarzen Bits Teile zumindestens einer definierten Merkmalgruppe darstellen, wobei diese Entscheidung auf dem Vergleich der Umgebungsbits mit den vorgegebenen Merkmalsätzen basiert.
Nichtsdestotrotz muß auch die Möglichkeit in Betracht gezogen werden, daß das Grundmerkmal tatsächlich Teil eines Zeichens ist. Eine Anzeige für diese Wahrscheinlichkeit kann aus der Untersuchung des Kontrastes in der Umgebung der Stelle X _ gewonnen werden. Es sei beispielsweise angenommen, daß die Wahrscheinlichkeit I als groß und die Wahrscheinlichkeit E als niedrig festgestellt wurden. Dies führt zum Schluß, daß das Bit an der Stelle X„, wahrscheinlich ein schwarzes Bit darstellen soll. Wenn aber durch viele in der Umgebung der Stelle XRJ befindliche schwarze Bits ein starker Kontrast angezeigt wird, ist die Wahrscheinlichkeit, daß das in der Entscheidungsstelle befindliche Bit ebenfalls Teil einer Zeichenmarkierung darstellt, höher, als sie wäre, wenn der Kontrast in- der Umgebung nur leicht wäre. Dadurch wird der Vertrauensbereich einer hohen I-Wahrscheinlichkeit vergrößert, wenn sich das Bit in einem Bereich dunklen Kontrastes auf dem Aufzeichnungsträger befindet; demgegenüber wird der Vertrauensbereich verkleinert, wenn das Bit sich in einer Sektion niedrigen Kontrastes befindet.
RO 970.026
309314/0935
Auf ähnliche Weise vergrößert sich der Vertrauensbereich der Wahrscheinlichkeit E, daß das Bit in der Entscheidungsstelle X-.T weiß sein sollte, wenn der Umgebungskontrast leicht ist; umgekehrt liegt der Fall, wenn der Umgebungskontrast sich als dunkel erweist. Auf diese Art müssen die Wahrscheinlichkeitsmaße I und £ bezogen werden auf den Umgebungskontrast, um so eine sinnvolle Determinierung des in der Entscheidungsstelle befindlichen Bits zu erzielen.
Gemäß der Lehre der Erfindung wird der relative Kontrast der Umgebung der X„ -Position ausgedrückt als Schwellenwahrschein-
KJ
lichkeitspegel Tx und T . die im nachfolgenden auch als Kontrastschwellen bezeichnet werden. Die gemessenen Werte der Wahrscheinlichkeiten I und E werden verglichen mit den Werten T und T , wobei das Resultat dieses Vergleichs die den endgültigen Status des in der Entscheidungsstelle befindlichen Bits bestimmende Entscheidung beeinflußt. Die spezifischen durchgeführten Kontrastmessungen und die Art, in der sie zur Bestimmung von Tx und Tx, aufeinander bezogen werden, sind weiter unten be-
X Cl
schrieben. A An dieser Stelle ist es für das Verständnis ausreichend zu wissen> daß zwei Schwellenpegel, die den Kontrast in der Umgebung der Entscheidungsstelle beschreiben, determiniert werden. Sobald die Werte I, E, Tx und T„ für ein bestimmtes an
X Cl
der Stelle Xx,x befindliches Bit bestimmt wurden, wird die end-
KJ
gültige Entscheidung über das an dieser Stelle befindliche Bit getroffen. Bezeichnet man den endgültigen Status des an der Stelle X1,T befindliche Bit als X' , so' lassen sich die Ent-
KJ KJ
scheidungsregeln mathematisch folgendermaßen ausdrücken:
a) X'KJ - 1
wenn 11 - E | £ τ
und IiT-, E< T_
X
worin T ■ |T£ - T_|
Dies bedeutet, daß die existierende Grenze beibehalten wird, wenn das in der Entscheidungssteile X„_ befindliche Bit ein schwarzes
KJ
RO970026 309814/0935
- 11 -
war. War letzteres jedoch ein weißes Bit, so wird es zu einem schwarzen Bit konvertiert, um den Zeichenrand zu glätten.
b) X'KJ- 0
wenn 11 - E | >_ T
und E > T_
Ei
und I < T1
War demnach das in der Entscheidungsstelle XRJ enthaltene Bit ein schwarzes, so wird es zu einem weißen konvertiert, um den Zeichenrand zusammenlaufen zu lassen. War das Bit X ursprünglich ein weißes, so wird es beibehalten.
c) x'kj ~ xkj
wenn Il - e|< T
Dies bedeutet, daß die Daten zur Entscheidungsfindung nicht ausreichend sind.
d) wenn I - TI und E > T„,
dann X 'kj ** 1
wenn . I > E
und X 1 =s
KJ
0
wenn E > I
Die beschriebene Technik zur Bestimmung des gewünschten Status einer jeden Elementarfläche aufgrund von Wahrscheinlichkeiten wird durch einen entsprechend programmierten Universalrechner in Verbindung mit einer konventionellen Abtastvorrichtung und einem zweidimensionalen Matrix-Schieberegister implementiert. Die Programmierung eines solchen Rechners bereitet für den betreffenden Durchschnittsfachmann keine Schwierigkeiten. In Fig. 4 ist das Verfahren gemäß der Erfindung als Ablaufplan dargestellt.
Unter Steuerung des Rechners wird eine Elementarfläche abgetastet
RÜ97ÜO26 309814/0936
und der "Inhalt' dieser Elementarfläche als schwarzes oder weißes Bit dargestellt. Dieses wird in das beschriebene Register eingegeben und gleichzeitig der vorherige Registerinhalt um ein Feld verschoben. Danach werden die in der Maskenfläche befindlichen Bits gelesen und das Entscheidungsbit der Stelle X„j bestimmt. Wird festgestellt, daß es sich um ein Randbit handelt, so werden die Wahrscheinlichkeitsmaße I und E bestimmt. Unter der Voraussetzung, daß E + I > 0 ist, wobei die entgegengesetzte Bedingung einen Trivialfall definieren würde, werden die Kontrastmessungen zur Bestimmung von T und T durchgeführt. Wenn |E - l| kleiner festgestellt wird als T = |τ_ - TxI, ist die Information für die Entscheidungsfindung nicht ausreichend, und das Bit ΧΎ.Ύ wird als
KJ
Entscheidung ΧνΎ angenommen. Wenn die Bedingung I> T und E > T beide erfüllt sind, wird der gemessene Wert von I mit E verglichen. Wenn I größer ist als E, wird X' T - 1 gesetzt. Eine detailliertere Schilderung der genannten Regeln findet sich in Zusammenhang mit der Beschreibung der Schaltungen zur Bestimmung der einzelnen Größen.
des Grundmerkmalsatzes zur Wahrschelnlichkeitsbe-
s_timmung
In Fig. 3 ist der Block 14 dargestellt, durch den die Konvergenz- und Divergenzmessungen vorgenommen werden, bei denen für jedes neue an die Stelle X1.T gelangende Bit festgestellt wird, ob es
KJ
sich um ein Randbit (Block 16) oder um ein Merkmalbit, d.h. um ein einen Teil eines definierten Grundmerkmals bildendes Bit handelt (Block 17). Auf der Basis dieser Entscheidungen wird eine Berechnung der Divergenzwahrscheinlichkeit E und der Konvergenzwahrscheinlichkeit I vorgenommen.
Die erste im Block 16 vorgenommene Bestimmung betrifft die Feststellung, ob der Inhalt der Speicherstelle Xv- ein Randbit ist.
KJ
Als Randbit soll hier ein solches Bit verstanden werden, das eine Randbedingung erster Ordnung erfüllt. Selbstverständlich ist es möglich, die Definition eines Randbits auch von der Erfüllung von
ro 970026 3098U/093S
_ 1 ο _
Randbedingungen höherer Ordnung abhängig zu machen. Zur Erläuterung der Randbedingungen wird auf Fig. 5 verwiesen» Diese Figur zeigt das Maskenfeld 12 im Register 10. Wenn das in der Position XT.T befindliche Bit zumindest einem weißen Bit benachbart KJ
ist, wird es als Randbit erster Ordnung definiert. Dies bedeutet, daß, wenn eine der Positionen H, P, T, U, V, Q, M oder I ein weißes Bit enthält, das in der Position XKJ befindliche Bit als Randbit erster Ordnung bezeichnet wird. Ein Randbit zweiter Ordnung an der Stelle Xj v/ürde vorliegen, wenn zumindest ein weißes Bit an einer der Stellen G, 0, S/ X, Y, 2, α, β, W, R, M, Ff E, D, C oder B vorhanden wäre, unter der Voraussetzung, daß im vorgenannten inneren Bereich sich kein zweites Bit befindet. Randuntersuchungen zweiter oder höherer Ordnung sind dann von Interesse, wenn es um die Beschleunigung der Konvergenz oder Divergenz eines Musters geht. Zur Erläuterung der Arbeitsweise der Erfindung ist jedoch eine Beschränkung auf die Randbedingungen erster Ordnung ausreichend.
unter Bezug auf Fig. 5 kann die Randbedingung erster Ordnung ausgedrückt werden durch den Booleschen Ausdruck
BD1 = (T+ü+V+Q+M+T+H+P)
Dieser Ausdruck stellt in mathematisch klarer Form die oben bereits beschriebene Bedingung dar, daß das Bit XKJ ein Randbit erster Ordnung darstellt, wenn eine oder mehrere der Stellen T, ü, V, Q, M, I, H oder P innerhalb des Maskenfeldes 12 mit einem weißen Bit belegt sind. Wenn beispielsweise eine logische 0 ein weißes Bit repräsentieren soll, wird der Schritt der Randbit-Feststellung durch Auslesen des Speicherinhalts in den obengenannten Feldern bewerkstelligt und die Präsenz einer logischen 0 in mindestens einer der Speicherstellen festgestellt.
Der nächste Schritt besteht darin, festzustellen, ob das an der Stelle .X befindliche Bit Teil eines vorherbestimmten Grundmerl· malsatzes ist. In der hier vorgeschlagenen Ausführungsform, die
RO 970 026
30981 A/0935
sich als vorteilhaft erwiesen hat, werden insgesamt vier Grundmerkmale ausgewählt. Selbstverständlich ist weder Anzahl noch Art der Grundmerkmale auf die vier hier genannten beschränkt. Die vier verwendeten Grundmerkmale sind:
eine horizontale Linie (H)
eine vertikale Linie (V)
eine Diagonale unter 45° mit positiver Steigung (+D)
eine Diagonale unter 45° mit negativer Steigung (-D).
Im nachfolgenden sojLlen die Kriterien beschrieben werden, nach denen bestimmt wird, ob ein Mustervektor Teil eines Grundmerkmales darstellt. Es soll nochmals darauf hingewiesen werden, daß eine weitere Untersuchung des an der Stelle X„_ befindli-
KJ
chen Bits nur dann vorgenommen wird, wenn es sich dabei um ein Randbit handelt. Demnach muß jedes Merkmal bezogen werden auf üie der Entscheidungsstelle benachbarten Elementarflächen. Dies bedeutet, daß das horizontale Merkmal relativ zu den oberen und unteren Seiten, das vertikale Merkmal relativ zu den rechten und linken Seiten und die diagonalen Merkmale unter Berücksichtigung der gesamten Umgebung definiert werden.
Diese Kriterien werden am deutlichsten verständlich unter Bezugnahme auf Fig. 6 und die in Fig. 5 benutzten Bezeichnungen der Elementarflächen. In Fig. 6 soll die Markierung X ein schwarzes Bit und die Markierung 0 ein weißes Bit kennzeichnen. Die ebenfalls anzutreffende Kennzeichnung mit einem horizontalen oder vertikalen Strich bedeutet, daß- die an dieser Stelle zu treffenden Entscheidung unabhängig vom Inhalt der mit dem Strich bezeichneten Elementarfläche erfolgt. Die Lage des Bezugsfeldes X wird durch
KJ
ein Θ bezeichnet.
Benutzt man die in Fig. 5 angewandten Bezeichnungen der einzelnen Felder, so können die Grundmerkmale, die eine vorgewählte Strich stärke von zwei Feldern entsprechend 2 Bits aufweisen, folgendermaßen definiert werden:
Rü 970026 3098U/093B
STH = (PTUVQZ)
8BH = (PQHIMD)
8RV = (IUTPHÖ)
8LV = (IUVQMR)
8T (+D) = (MQUTYZ")
SB(+D) = (TPIMED)
8T(-D) = (HPUV3Z)
SB(-D) = (CHIQVD)
Diese Merkmale wurden ausgewählt, da, wie festgestellt wurde, die Zeichenmaskierungen größtenteils in diesen Formen erscheinen.
Die Gruppierungen der Grundmerkmale in eine Kategorie S kann ausgedrückt werden durch;
8H + 8V + S+D + 8-D
hierin bedeuten:
8H = 8TH + 8BH' 8V m SRV + 8LV Und S°
Wenn immer die Bedingung S erfüllt ist, wird das Bit X definiert als schwarzes Bit, das Teil eines Grundmerkmals mit vorherbestimmter Strichstärke ist. Auf diese Weise wird der gewählte Wert des Bits in Position X- wie folgt ausgewählt:
X' , = 1; wenn (BDn χ S) + BD1 = 1
KJ 1 _ 1
Χ'ντ = 0, wenn (BD, χ S) = 1
KJ 1
darin bedeuten:
X' , = 1 die Auswahl eines schwarzen Bits Js. J
X' , = 0 die Auswahl eines weißen Bits
Ku
RO970026 anaBU/0936
In einer vorteilhaften Ausgestaltung der Erfindung können variable Wahrscheinlichkeitswerte I und E dann entwickelt werden, wenn BD als Maß für die Anzahl der das Entscheidungsfeld umgebenden weißen Bits benutzt wird. Durch Bestimmung der Anzahl weißer und schwarzer Bits in der Gruppe der benachbarten Elementarflächen können die Maße I und E als Zahlen zwischen 0 und 1 abhängig von dem Verhältnis der Belegung mit schwarzen bzw. weißen Bits bezogen auf das am nächsten kommende Grundmerkmal bestimmt werden.
Der bevorzugte Algorithmus zur Definition der variablen Wahrscheinlichkeit ist:
1 - (BV Smax maj + 55I
Unter der Voraussetzung, daß es sich um eine Grenze erster Ordnung handelt, bedeuten darin:
Anzahl der das am nächsten kommende Grundmerkmalmuster (f.) erfüllenden Bits
max maj Gesamtzahl der f. definierenden Bits und
E = I-I
Dieser Algorithmus kann auch als Funktion der Wahrscheinlichkeit E ausgedrückt werden:
E - (BV smax maj
Auch hier wird wieder vorausgesetzt, daß es sich um Randbedingungen erster Ordnung handelt.
Es bedeuten:
RO 9 70 026
3098U/0936
Anzahl der das am nächsten kommende Grundmerkmalmuster (f.) nicht erfüllenden Bits
i X 1 ^
max maj ~ Gesamtzahl der f^ definierenden Bits
So berechnet bewegen sich die Werte der Größen I und E zwischen 0 und 1. Selbstverständlich können verschiedene andere Algorithmen zur Bestimmung der Werte I und E benutzt werden. So ist es beispielsweise möglich, folgenden Booleschen Ausdruck zur Bestimmung zu benutzen:
I = BD S +
Hierin bedeuten:
I=O oder 1
E=I-I
S = 5H+ 8V+ S(+D)
Die obige Beschreibung setzt ein vorherbestimmtes Maskenfeld voraus; nachfolgend soll die Bestimmung der Größe dieses Feldes beschrieben werden.
Die Größe des Maskenfeldes ist von erheblicher Bedeutung sowohl für die Randkonvergenz- und Randdivergenz-Messungen als auch für die Kontrastbestimmungen. Eine der Grundvoraussetzung für die Bestimmung der Maskengröße ist die, daß es ausreichend groß sein muß, um beide Begrenzungen der größten definierten Strichstärke auch dann enthalten muß, wenn einer der Ränder sich in Position X„_ befindet. Zum zweiten sollte der maskierte Bereich aus Wirt-' schaftlichkeitsgründen nicht größer als notwendig gewählt werden. Im folgenden wird Maskengröße bezogen auf die Strichstärke des ausgedehntesten definierten Grundmerkmalsatzes, wie er im Maskenfeld erscheint.
RO 970 026
309814/0935
Die Größe des Maskenfeldes sei LxA.
(A-I)
Unter der Voraussetzung, daß L = A ist Jζ—- = SW. Darin ist SW die größte Strichbreite, die definiert wurde. Daraus ergibt sich, daß A = 2 (SW) + 1.
Nimmt man beispielsweise für SW den Wert 3 an, so ergibt sich L = A » 7.
Nun kann man natürlich die maximale Strichbreite in vertikaler Richtung unterschiedlich zu der in horizontaler Richtung wählen. Unter dieser Bedingung ist L / A, wobei L in gleicher Weise definiert wird wie A.
h^. λ m cw
2 faWV
Darin bedeutet SWV die maximale vertikale Strichbreite. Es ergibt sich
L - 2SWV + 1,
so daß bei SW = 2 sich L = 5 ergibt.
Nachfolgend sei nochmals das Arbeitsprinzip zusammengefaßt. Sobald ein neues Bit in der Entscheidungsposition X erscheint,
JVÜ
wird bestimmt, ob es sich um ein Randbit handelt oder nicht. Ist dem so, erfolgt die Bestimmung eines Wertes, der die Wahrscheinlichkeit dafür angibt, daß der Mustervektor aus den die Entscheidungsposition X umgebenden Speicherplätzen einen Teil definierter Grundmerkmale darstellt.
Wie vorher bereits erläutert, stellen die berechneten Wahrscheinlichkeitswerte E und I Maße für den Vertrauenspegel dar, daß das Muster aus schwarzen Bits um die Entscheidungsposition X herum zu einem Grundmerkmal gehört. Die Wahrscheinlichkeit, daß dieses Muster außerdem Teil eines Zeichenmerkmals ist, beruht auf Kontras tmessungen.
RO 970 026
3098U/0935
22A79A2
C. Kontrastmessung
In diesem Teil wird die Messung des Randkontrastes, der zur quantitativen Bestimmung der durchschnittlichen Strichbreite ebenso wie zur Kontrastbeziehung zwischen undeutlichen Zeichenmustern und dem Hintergrund benutzt wird, beschrieben. Weiterhin können diese· Messungen als qualitative Kriterien für die Trennung nach Qualitäts-Parametern, also zur Unterscheidung von Fehlmarkierungen, Schatten und Schwärzungsvariationen von guten Zeichen dienen.
Fig. 7 zeigt das Schieberegister 10, wobei besondere Rücksicht auf die Darstellung der für die Kontrastmessung bedeutsamen Positionen genommen wurde. Insgesamt werden vier Kontrastmessungen durchgeführt, die im einzelnen weiter unten behandelt werden. Die erste Kontrastmessung B__ ist ein Maß für den lokalen Kontrast
KJ
um die Position X„T und wird bestimmt durch die Zählung der
KJ
schwarzen Bits innerhalb des maskierten Feldes. Das Maß S„_ ist
KJ
der durchschnittliche begrenzte Flächenkontrast innerhalb einer Abtastbahn um die Entscheidungsstelle Xx,,. Genauer gesagt ist es
kj
die durchschnittliche Summe der ΒνΎ, die von der Verarbeitung der
kj
vorhergehenden benachbarten Abtastbahn J + 1 herrührt. Für jedes der m Bits, die die Position Xx, _ erreichen, wird während der
KJ
Abtastung der Bahn J + 1 der lokale Kontrast BRJ bestimmt und zusammen mit dem durchschnittlichen Wert von B,.T über diese m
KJ
Bits gespeichert. Der Wert Ax._. ist die durchschnittliche Summe
KJ
der SKJ aus der vorhergehenden Verarbeitung einer vorgewählten Anzahl von Abtastbahnen. In der vorteilhaften Ausfuhrungsform der Erfindung wird der durchschnittliche Zeichenflächenkontrast über die Abtastbahnen J + 1 bis J + N genommen, wobei eine Untersuchung der Spalten 1 bis L + 11 eingeschlossen werden kann. Die vierte Kontrastmessung ist schließlich die Bestimmung ΔΒ Jf wobei es sich um ein Maß für die Kontraständerung aus dem Vergleich der B1,- handelt. Diese Messung, die den lokalen Kontrast um Xv-,
KJ KJ
vergleicht mit dem lokalen Kontrast um ein um ein vertikales RO 970 Ο26
3098U/0935
Inkrement verschobenes Flächenelement, wird benutzt, um eine mögliche iterative Arbeitsweise der gesamten Anordnung einzuleiten.
Mathematisch können diese Messungen mittels der folgenden Gleichungen ausgedrückt werden:
Bx,.,. = Σ Σ Α. μ .
KJ a=0 1=0 ia(b)
c
SKJ
L+l m
Σ Σ (B )
a=+l 1=0 *Jla
L+ll m
Σ Σ (S-._ )
A . a=+l 1=0 KJla
KJ (L+11)-(J+1)
L A+D
ÄBKJ - BK+A,J - BKJ - ^0 I^ xia(b)> " BKJ
Darin bedeuten:
Bx,T: den lokalen Kontrast definiert als die Anzahl der
IS. J
schwarzen Bits innerhalb des Maskenfeldes 12, Sx. _: durchschnittliche Summe der B„_, die aus der Ver-
arbeitung der vorhergehenden benachbarten Abtastbahn (J+l) herrühren, als begrenzter Flächenkontrast bezeichnet,
A„_: durchschnittliche Summe der S„T, die aus der Ver-
i\ü &J
arbeitung der letzten (L+ll)-(J+l) Abtastbahnen herrühren, als Zeichenflächenkontrast bezeichnet,
Y. die Anzahl der in der Abtastbahn J+l enthaltenen Bits, die in E + I > 0 resultierten,
Xia(b): e*n scnwarzes Bit innerhalb der Maskenfläche 12,
R0 97° O26 3098U/0935
L; die Anzahl der Spalten innerhalb der Maskenfläche, M; die Anzahl der Zeilen pro Spalte, die der Anzahl der
pro Abtastbahn erzeugten Bits entspricht, A; die Anzahl der Zeilen innerhalb der Maskenfläche.
Diese vier Messungen beziehen den lokalen Kontrast und seine differentielle Änderung an der Merkmalkante innerhalb der Maskenfläche auf den Kontrast der unmittelbaren begrenzten Flächennachbarschaft und auf den Kontrast der unmittelbaren Zeichenflächennachbarschaft. Diese Messungen werden benutzt, um die Schwellenwerte Tx und T„ zu bestimmen.
J. Ci
Die Kontrastkrxterien können auch in normalisierter Form benutzt werden. Dabei ergibt sich,
Anzahl der schwarzen Bits B " (normalisiert) = i* Maskenfläche
■#vfh Ap \ AAX^«!***! *Ael» iJU t& *■· v^«A> <■* / ν ^t
Es wird vorausgesetzt, daß die am häufigsten auftretenden Merkmale die oben definierten Grundmerkmale sind. Unter dieser Voraus setzung kann der normalisierte Wert für B„_ für eine Strichstärke
Ku
von 2 oder 3 Bit Breite definiert werden als
BVT (normalisiert) = ψ f
KJ . LA L
hierin bedeuten:
Unter der Voraussetzung L = A = 7
für SW =2: B^T (normalisiert) = % = 0,29 für SW = 3: ΒνΎ (normalisiert) = |- = 0.43.
Daher bewegt sich der gewünschte lokale Kontrast B' (normalisiert)
i\j
für ein Grundmerkmal innerhalb einer Maske von 7x7 Elementarflächen bei einer Strichbreite von 2 bis 3 Bit innerhalb eines Bereiches von 0,29 bis 0,43. Dies bedeutet, daß die Anzahl der
RO 970 026
3098U/0935
schwarzen Bits im Zeichenmuster, das innerhalb der Maske zu sehen ist, zwischen 14 und 21 liegen sollte. Da S„T und ΑνΎ zu B„,
KJ KJ KJ
lineare Beziehungen besitzen, repräsentiert jede dieser Kontrastmessungen die durchschnittliche Strichstärke.
Die Beziehung zwischen den Werten B1,,, A1.T und S„T und den Schwell*
KJ KJ KJ
werten werden im nachfolgenden diskutiert. Die relativen Beziehungen zwischen den Kontrastmessungen sind ebenso bedeutsam wie die absoluten Werte jeder Messung. Die absolute Höhe jeder der Messungen indiziert den durchschnittlichen Schwarz/Weiß-Strichkontrast, während ihre Beziehung untereinander zur Definition von Fehlmarkierungen, Schatten oder sonstigen Unregelmäßigkeiten innerhalb oder zwischen Zeichen dienen können. Diese Kontrastmessungen werden benutzt, um die Schwellwerte T„ und T_ festzulegen. Die
r. X
beiden letztgenannten Schwellwerte dienen sodann zur Definition der als Minimum akzeptierbaren Wahrscheinlichkeitswerte E und I und ihrer absoluten Minimaldifferenz, die benötigt wird, um eine Entscheidung über das in der Position X befindliche Bit zu treffen.
Die in den Fign. 6 und 9 dargestellten Kurven beziehen die Schwellwerte T und T auf die Kontrastmessungen. Der Verlauf dieser Kurven wurde empirisch bestimmt. Die verschiedensten Zeichentypen, z.B. aus Maschinenausdrucken, von manuellen oder elektrischen Schreibmaschinen hergestellte und handgeschriebene Zeichen wurden analysiert und gewünschten Qualitätsbedingungen gegenübergestellt. Für jeden der drei Werte Bv-, S„_ und A„T
KJ KJ KJ
sowie für ihre Kombinationen wurde eine Vielzahl von Schwellwerten untersucht, bis die gewünschte Qualität erreicht war. Das Resultat dieser Bestimmungen für die Maske aus 7x7 Feldern ist in den Kurven T , T__, T_. und T„_ in Fign. 8 und
XX X/ £>X ti/
9 dargestellt. Die Werte von T und T wurden entsprechend dem oben beschriebenen Algorithmus entwickelt. Diese Werte werden für andere Algorithmen sich verändern, jedoch wird ihre Beziehung untereinander ähnlich bleiben. In gleicher Weise, wie eine Normalisierung des Wertes B T erfolgt, können die absoluten Größen
JKU
RO 970 026 , , . ΛΛ - F
3098U/0935
von A.,T und ST,_. zvir Erzielung einer generellen Beziehung für die Ku KJ
Kontrastregeln benutzt werden.
Die folgenden Regeln für die Kontrastbeziehung sind experimentell entwickelt worden unter Benutzung der Kontrastmessungen ARJf STJ._ und B^, zur Erzielung einer Entscheidung, die auf den Schwell-
KJ KJ
funktionen T und T1 basiert. Der Aufbau der Regel kann am besten unter Zugrundelegung eines speziellen Falles verstanden werden, bei dem der gewünschte lokale Kontrast für das Grundmerkmal innerhalb des maskierten Feldes aus 7x7 Feldern zwischen 14 und 21 rangiert. Normalisiert man diesen Wert, so muß der gewünschte Kontrast im Bereich zwischen O,29 und 0,43 liegen. Als erstes sei die Bestimmung von AxJ betrachtet. Dieser Wert wird benutzt, um die Zeichenmuster in zwei Kontrastklassen zu separieren, in solche, die eine größere als die gewünschte Strichbreite aufweisen und in solche, deren Strichbreite gleich oder kleiner als die gewünschte Stärke ist. Wenn demzufolge der Wert A > 22 ist,
KJ —*
wodurch eine größere als die gewünschte Strichstärke angezeigt wird, werden die Werte T_ und T_ als konstant behandelt. Dies
Ei JL
bedeutet, daß T =K , während Tg-K5, ist. In diesem speziellen Beispiel ergibt sich für T =0,1 und T =0,4. Wenn der Wert AT,, <
£> X KJ —
ist, werden die Muster in zwei weitere getrennte Kategorien eingeteilt. Hierzu dient der Wert B _, der die Muster unterteilt in
KJ
solche, die einen größeren lokalen Kontrast als den gewünschten aufweisen, und solche, deren Wert ΒνΎ < 22 ist. Für Muster, die
KJ
einen größeren als den gewünschten lokalen Konstrast aufweisen d.h., daß BKJ <_ 22 ist - werden die Kurven aus Fig. 8 benutzt. Da dies anzeigt, daß die Nachbarschaft des Entscheidungsfeldes dunkel ist, d.h. also starken Kontrast aufweist, wird durch die Kurven in Fig. 8 der Schwellwert T„ wesentlich niedriger als der Schwellwert T angesetzt. Dadurch wird die Extraktion höher gewichtet als die Einsetzung.
Sobald festgestellt wird, daß der lokale Kontrast B_, < 22 ist -
KJ
in diesem speziellen Fall wird N2=22 gesetzt - wird die Beziehung zwischen S , A und B .. zur Bestimmung der Schwellwertauswahl
HO 97Ο 026
30 98H/0935
benutzt. Bei gleichmäßigem Druck, d.h., wenn S„- = A„, = B1,T oder
Ku KJ JxJ
wenn das in der Entscheidungsposition X1. _ befindliche Bit sich
KJ
am Anfang oder Ende des Musters befindet, so daß S-,- 7* A„T,
KJ KJ
werden die Kurven aus Fig. 9 zur Bestimmung der Schwellwerte T und T benutzt. Für jedes die Bedingung erfüllende Muster, wobei sowohl ΆνΎ und B1.T jeweils < 22 und weiterhin S1,_ φ A1,_ f
KJ KJ KJ KJ
Bx, _, wodurch angezeigt wird, daß der Druck nicht gleichmäßig ist,
werden die Kurven aus Fig. 8 nur im Bereich B < 22 benutzt. Die Beziehung zwischen den drei Kontrastmessungen sind in der Tafel auf Fig. 10 zusammengestellt.
Die Methoden zur Bestimmung der Wahrscheinlichkeiten I und E sind ebenso dargestellt worden wie die Festlegung der Schwellwerte T£ und T-. Die Entscheidung, das an der Stelle XRJ befindliche Bit schwarz oder weiß zu machen, erfolgt, sobald diese genannten Werte bestimmt sind, gemäß nachfolgenden Regeln.
a) x'kj β x
Wenn |I -Ej >T * |Tg-T1 j
und I > T_ sowie E < T_.
— JL Ci
Unter der Voraussetzung, daß das in Position X„_ befindliche Bit
KiJ
ursprünglich schwarz war, wird dieses schwarze Bit als ein Teil des existierenden Randes beibehalten. War jedoch das in der Entscheidungsposition befindliche Bit ursprünglich weiß, so wird zur Glättung des Randbereichs an dieser Stelle ein schwarzes Bit eingesetzt.
b) x-KJ - 0
Wenn j I -Ej ^ T
und E > T„ sowie I < TT.
ti X
Wenn in diesem Fall die Stelle X„, ein schwarzes Bit enthielt,
KJ
RO 970 026
3098U/0935
wird dieses schwarzes Bit extrahiert und dadurch die Kante geglättet bzw. konvergiert. Enthielt die Entscheidungsstelle ursprünglich ein weißes Bit, so wird dieses Bit beibehalten.
c) X'kJ = XKJ
zeigt an, daß keine Änderung vorgenommen werden kann, da für die Entscheidungsfxndung ausreichende Daten nicht zur Verfügung stehen. Dies tritt ein, wenn |E -Ij < T.
Wie oben bereits erwähnt, ist, unter der Voraussetzung |l - Ej > T sowohl I > T_ und E > T„, I verglichen wird mit E und die
— — I ■ — iu
Steuerung durch den größeren der beiden Werte erfolgt.
Die Benutzung der Messung ΔΒ soll nicht beschrieben werden. Dieses Maß wird benutzt, um die Iterativsteuerschaltung 30 selektiv zu triggern. Die Schaltung 30 kann betrachtet werden als ein Schalter zur Verbindung des Ausgangsschieberegisters 32 mit der Entscheidungslogik und nicht mit dem Eingangsregister 10. Dies ist schematisch in Fig. 3 durch die Schalter 34 und 36 dargestellt. In Wirklichkeit wird der Inhalt des Ausgangsregisters nicht in das Eingangsregister geschoben, sondern ausgewählte Bereiche des Registers 32 werden gelesen und in die Entscheidungslogik und nicht in das Register 10 übertragen.
Wie anhand von Fig. 7 deutlich wird, werden die Werte ΒνΎ und ΒΚ+Δ J ^**r Jet*es Bit, das an die Position XRJ gelangt, berechnet. Der Wert B„ j wird bestimmt durch das konzeptgemäße Bewegen der Maskenfläche auf den Mittelpunkt in Xr+a j und durch Zählung der schwarzen Bits in diesem Bereich.
Erweist sich ΔΒντ als positiv und B„T > 36, so ist der lokale Kontrast um XRJ zu dunkel um ein wertvolles Merkmal abzugeben, und auch der unmittelbare zukünftige Kontrast wird dunkler. Es ist daher wünschenswert, ein verdeutlichtes Videosignal zu benutzen, d.h. die Elementarflächen, wie sie im Ausgangsregister
3098U/0935
gespeichert sind, durch die Bereiche, die durch starken Kontrast verborgen sind, hindurchzuführen. Die Entscheidungen werden auf der Basis des Inhalts der Spalten J+l, J+2 und J+3 im Ausgangsregister 32 getroffen und nicht aufgrund des Inhalts dieser
Spalten im Eingangsregister 10.
Die Erfindung wurde hier im einzelnen beschrieben am Beispiel
einer vorteilhaften Ausführungsform. Das Wesen der Erfindung
macht jedoch nicht diese Ausführungsform, sondern das dahinterstehende allgemeine Prinzip aus.
RO 970 026
3098U/0935

Claims (6)

  1. PATENTANSPRÜCHE
    Verfahren der automatischen Zeichenerkennung, bei dem ein Bereich eines Aufzeichnungsträgers abgetastet und sein Informationsgehalt binär digitalisiert einem Speicher, vorzugsweise einem Schieberegister, zugeführt wird, zur Verbesserung der Erkennbarkeit von gestörten Zeichen, dadurch gekennzeichnet,
    daß eine Reihe von Grundmerkmalen definiert wird, aus denen sich alle zu erkennenden Zeichen zusammensetzen, daß eine Zelle des Speichers als Entseheidungsstelle Χχ,τ* die einen Bezugspunkt definiert, festgelegt wird, für deren Umgebung die Wahrscheinlichkeit I (Konvergenzwahrscheinlichkeit) , daß nämlich die der Entscheidungsstelle X^_ benachbarten Speicherzelleninhalte ein Grundmerkmal erfüllen, und die Wahrscheinlichkeit E (Divergenzwahrscheinlichkeit), daß nämlich die der Entscheidungsstelle X^ benachbarten Speicherzelleninhalte kein Grundmerkmal erfüllen, bestimmt wird, wobei im ersten Fall vorausgesetzt wird, daß die Entscheidungsstelle 2L.J ein Zeichenteil enthält, während im zweiten Fall angenommen wird, die Entseheidungsstelle selbst enthalte kein Zeichenelement, daß in Abhängigkeit vom in der Umgebung der Entscheidungsstelle XxJ herrschenden Kontrast Schwellwerte T und T für die Wahrscheinlichkeiten I und E bestimmt werden, und daß abhängig von dem Verhältnis der Wahrscheinlichkeiten I bzw. E zu ihren entsprechenden Schwellwerten T_ bzw. T„ der Speicherinhalt der Ents cheidungs stelle X^ belassen oder verändert wird.
  2. 2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß bei Verwendung eines matrixartig in Serie geschalteten Schieberegisters die den Bezugspunkt definierende Entscheidungsstelle Χ.., den Mittelpunkt eines vorzugsweise quadratischen Feldes (Maskenfeld 12) bildet, und daß nur der Inhalt innerhalb dieses Maskenfeldes (12)
    RO 970 026
    3098U/0935
    liegender Speicherzellen zur Bestimmung der Wahrscheinlichkeiten I und E und der Schwellwerte Tx und T_ dient.
  3. 3. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß zur Bestimmung der Wahrscheinlichkeiten I und E nur der Inhalt eines innerhalb des Maskenfeldes (12) befindlichen, die Ents ehe i dungs s teile XT, T einschließenden inneren Feldes
    KJ
    dient, dessen Lage und Größe von dem zu vergleichenden Grundmerkmal abhängt,
    und daß zur Bestimmung der Schwellwerte Tx und T_ der Inhalt des gesamten Maskenfeldes (12) ausgewertet wird,
  4. 4. Verfahren nach Anspruch 2, dadurch gekennzeichnet, daß zur Bestimmung der Schwellwerte T und T_ das Maskenfeld (12) um mindestens eine Spalte und/oder Zeile verschoben werden kann.
  5. 5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die Grundmerkmale nach Richtung und Strichstärke definiert werden.
  6. 6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß insgesamt vier Grundmerkmale, nämlich horizontale, vertikale, und unter einem Winkel von +45° oder -45° gegenüber der Vertikalen geneigte Linien vorgegebener Strichstärke definiert werden.
    RO 9 70 026 , , ΛΛΛ1-
    3098U/0935
DE19722247942 1971-09-30 1972-09-29 Zeichenerkennungsverfahren zur verbesserung der erkennbarkeit gestoerter zeichen Withdrawn DE2247942A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US18521471A 1971-09-30 1971-09-30

Publications (1)

Publication Number Publication Date
DE2247942A1 true DE2247942A1 (de) 1973-04-05

Family

ID=22680075

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19722247942 Withdrawn DE2247942A1 (de) 1971-09-30 1972-09-29 Zeichenerkennungsverfahren zur verbesserung der erkennbarkeit gestoerter zeichen

Country Status (5)

Country Link
US (1) US3737855A (de)
JP (1) JPS5627910B2 (de)
DE (1) DE2247942A1 (de)
FR (1) FR2154532B1 (de)
GB (1) GB1381970A (de)

Families Citing this family (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS604505B2 (ja) * 1972-07-10 1985-02-04 スキヤン − オプテイクス インコ−ポレ−テツド マルチ・フオント光学式文字認識装置
FR2262834B1 (de) * 1973-04-09 1977-10-21 Calspan Corp
JPS527349A (en) * 1975-07-08 1977-01-20 Toyo Netsuki Kk Method of surface treating to form metal coating and products thereby
JPS5218132A (en) * 1975-08-01 1977-02-10 Hitachi Ltd Binary circuit
IT1055651B (it) * 1975-11-03 1982-01-11 Elsag Sistema elettronico per la lettura di simboli
US4162481A (en) * 1976-12-22 1979-07-24 Recognition Equipment Incorporated Adaptive correlator for video processing
US4119947A (en) * 1977-07-20 1978-10-10 Howard Noyes Leighton Optical signal processor
JPS5451733A (en) * 1977-10-03 1979-04-23 Toshiba Corp Character reading system
JPS5537092A (en) * 1978-09-05 1980-03-14 Ibm Mode switch for setting threshold value
US4491964A (en) * 1979-04-23 1985-01-01 Recognition Equipment Incorporated Image processing integrated circuit
US4414685A (en) * 1979-09-10 1983-11-08 Sternberg Stanley R Method and apparatus for pattern recognition and detection
US4298858A (en) * 1980-03-27 1981-11-03 The United States Of America As Represented By The Secretary Of The Air Force Method and apparatus for augmenting binary patterns
US4408343A (en) * 1981-02-27 1983-10-04 Burroughs Corporation Image enhancement for optical character readers
US4672186A (en) * 1981-10-01 1987-06-09 Banctec Inc. Digital document scanning system
US4468809A (en) * 1981-12-23 1984-08-28 Ncr Corporation Multiple font OCR reader
US4625330A (en) * 1983-12-19 1986-11-25 Ncr Corporation Video enhancement system
US4541116A (en) * 1984-02-27 1985-09-10 Environmental Research Institute Of Mi Neighborhood image processing stage for implementing filtering operations
US4577235A (en) * 1984-08-20 1986-03-18 The Mead Corporation Text/continuous tone image decision processor
JPS6164370A (ja) * 1984-09-07 1986-04-02 Hitachi Cable Ltd 金属管材の内面処理方法
US4698843A (en) * 1985-08-19 1987-10-06 Rca Corporation Method for compensating for void-defects in images
US4742557A (en) * 1985-11-08 1988-05-03 Ncr Corporation Adaptive character extraction method and system
US4764971A (en) * 1985-11-25 1988-08-16 Eastman Kodak Company Image processing method including image segmentation
US4797806A (en) * 1987-02-19 1989-01-10 Gtx Corporation High speed serial pixel neighborhood processor and method
US4982294A (en) * 1987-07-24 1991-01-01 Eastman Kodak Company Apparatus for enhancing and thresholding scanned microfilm images and methods for use therein
US4853795A (en) * 1987-07-24 1989-08-01 Eastman Kodak Company Forward look ahead techniques for tracking background and noise levels in scanned video images
US4868670A (en) * 1987-07-24 1989-09-19 Eastman Kodak Company Apparatus and method for improving the compressibility of an enhanced image through use of a momentarily varying threshold level
US4969202A (en) * 1988-03-31 1990-11-06 Honeywell Inc. Image recognition edge detection method and system
JPH01292487A (ja) * 1988-05-19 1989-11-24 Sony Corp 文字認識装置
US5224179A (en) * 1988-12-20 1993-06-29 At&T Bell Laboratories Image skeletonization method
US7382929B2 (en) 1989-05-22 2008-06-03 Pixel Instruments Corporation Spatial scan replication circuit
US6529637B1 (en) 1989-05-22 2003-03-04 Pixel Instruments Corporation Spatial scan replication circuit
US5060284A (en) * 1990-03-23 1991-10-22 Eastman Kodak Company Adaptive error diffusion thresholding for document images
FR2661061B1 (fr) * 1990-04-11 1992-08-07 Multi Media Tech Procede et dispositif de modification de zone d'images.
EP0526295B1 (de) * 1991-07-10 2000-09-27 Fujitsu Limited Bilderzeugungsgerät
ATE181631T1 (de) * 1991-07-19 1999-07-15 Princeton Video Image Inc Fernsehanzeigen mit ausgewählten eingeblendeten zeichen
EP0539854B1 (de) * 1991-11-01 1999-03-17 Eastman Kodak Company Verfahren und Gerät zur Detektion von Text in Punktmatrixdruck zur Verbesserung von optischer Zeichenerkennung
US5357581A (en) * 1991-11-01 1994-10-18 Eastman Kodak Company Method and apparatus for the selective filtering of dot-matrix printed characters so as to improve optical character recognition
CA2081406C (en) * 1991-12-23 1997-09-16 Chinmoy Bhusan Bose Method and apparatus for connected and degraded text recognition
US5212741A (en) * 1992-01-21 1993-05-18 Eastman Kodak Company Preprocessing of dot-matrix/ink-jet printed text for Optical Character Recognition
US6469741B2 (en) 1993-07-26 2002-10-22 Pixel Instruments Corp. Apparatus and method for processing television signals
US5778105A (en) * 1994-01-14 1998-07-07 R.R. Donnelley & Sons Company Method of and apparatus for removing artifacts from a reproduction
JPH0951489A (ja) * 1995-08-04 1997-02-18 Sony Corp データ符号化/復号化方法および装置
US6983083B2 (en) * 2001-02-13 2006-01-03 Eastman Kodak Company Image specific perceived overall contrast prediction
JP3982817B2 (ja) * 2003-03-07 2007-09-26 株式会社東芝 画像処理装置および画像処理方法
US8787660B1 (en) * 2005-11-23 2014-07-22 Matrox Electronic Systems, Ltd. System and method for performing automatic font definition
EP2320390A1 (de) * 2009-11-10 2011-05-11 Icar Vision Systems, SL Verfahren und System zum Lesen und Validieren von Identitätsdokumenten

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE1250166B (de) * 1962-05-21 1967-09-14 International Business Machines Corporation Armonk, NY (V St A) Vorrichtung zur maschinellen Zeichen erkennung
US3588818A (en) * 1967-07-07 1971-06-28 Ncr Co Character recognition system employing continuity detection and registration means
FR1599243A (de) * 1968-12-12 1970-07-15

Also Published As

Publication number Publication date
JPS5627910B2 (de) 1981-06-27
FR2154532B1 (de) 1973-12-07
FR2154532A1 (de) 1973-05-11
US3737855A (en) 1973-06-05
GB1381970A (en) 1975-01-29
JPS4843542A (de) 1973-06-23

Similar Documents

Publication Publication Date Title
DE2247942A1 (de) Zeichenerkennungsverfahren zur verbesserung der erkennbarkeit gestoerter zeichen
DE1549930C3 (de) Einrichtung zum Erkennen vorzugsweise handgeschriebener Schriftzeichen
DE3633743C2 (de)
DE2238715C2 (de) Verfahren zum Aufbereiten eines beim Abtasten einer Vorlage gewonnenen Videosignales zum Auszählen und/oder Ausmessen von Bildeinzelheiten und Schaltungsanordnung zum Durchführen dieses Verfahrens
DE2909153C2 (de) Einrichtung zur digitalen Analyse von Bild- oder Zeichenmustern
DE2801536C2 (de) Zeichenformkodiervorrichtung
DE3408337C2 (de)
DE3320691C2 (de)
EP0096084A1 (de) Verfahren zur Vermeidung von Bildfehlern beim Mehrfarbendruck, die durch fehlerhaften Übereinanderdruck der Farbauszüge entstehen
DE4427992C2 (de) Verfahren zum Erzeugen einer Dokumenten-Darstellung aus einem Bitmap-Bild eines Dokuments
DE2939457A1 (de) Verfahren zur hervorhebung eines bildbereiches innerhalb eines bildes, das auf einem bildschirm dargestellt wird
DE3615906A1 (de) Bildinformationserkennungsgeraet
EP0048941A2 (de) Verfahren zum Verkleinern von grafischen Mustern
DE3241673C2 (de) Verfahren zum Verdichten von Daten Zwei-wertiger Bilddarstellungen
EP0301384B1 (de) Schaltungsanordnung zur Aufbereitung von schrägstehenden, insbesondere handgeschriebenen Zeichen
DE1774672A1 (de) Zeichenerkennungsvorrichtung
WO1992010056A1 (de) Verfahren zur generierung und speicherung von digitalisierten dichte-schwellwerten zur rasterung einer halbton-bildvorlage
DE1549764B2 (de) Zeichenerkennungsgerat mit einer Zeichentrennschaltung
DE2254913A1 (de) Verfahren zur erzeugung graphischer darstellungen aus parametrischen daten
DE3341371A1 (de) Verfahren und einrichtung zum erzeugen eines kombinierten bildsignals
DE2928378A1 (de) Verfahren und einrichtung zur elektronischen erzeugung einer halbton- nachbildung eines originalbildes
DE1524416A1 (de) Anordnung zur Auswahl von Datenreferenzen zum Quervergleich mit einem unbekannten Datensatz
WO1991016783A1 (de) Verfahren zur digitalisierten rasterung einer halbton-bildvorlage
DE3830990C2 (de)
DE1549860C3 (de) Verfahren zur Herstellung eines korrigierten Textes und Vorrichtung zur Durchführung dieses Verfahrens

Legal Events

Date Code Title Description
OD Request for examination
8139 Disposal/non-payment of the annual fee