DE19536170A1 - Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen - Google Patents

Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen

Info

Publication number
DE19536170A1
DE19536170A1 DE19536170A DE19536170A DE19536170A1 DE 19536170 A1 DE19536170 A1 DE 19536170A1 DE 19536170 A DE19536170 A DE 19536170A DE 19536170 A DE19536170 A DE 19536170A DE 19536170 A1 DE19536170 A1 DE 19536170A1
Authority
DE
Germany
Prior art keywords
image
template
threshold value
image properties
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE19536170A
Other languages
English (en)
Inventor
Winfried Bruegmann
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to DE19536170A priority Critical patent/DE19536170A1/de
Publication of DE19536170A1 publication Critical patent/DE19536170A1/de
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Description

Gebiet der Erfindung
Die Erfindung betrifft die Ermittlung von Schwellwerten bei der Digitalisierung von Bildern.
Stand der Technik
Um eine Bild- oder Zeichenerkennung (Optical Character Recognition) in einem elektronisch abgetasteten und digitalisierten Dokument durchführen zu können, müssen häufig in einem ersten Vorverarbeitungsschritt (image preprocessing), die Informationen des Vordergrundes von den Informationen des Hintergrundes getrennt werden. Dabei stellen die Informationen des Vordergrundes oftmals die eigentlichen, für die Zeichenerkennung zu betrachtenden (wichtigen) Bilddaten dar, während die Informationen des Hintergrundes vielfach störend wirken und zu Fehlinterpretationen der Vordergrundinformationen führen können. Auch tragen die Daten des Hintergrund des Bildes häufig zu einer Herabsetzung der Erkennungsleistung der Vordergrundinformation bei einer durchzuführenden Zeichenerkennung bei. Die Informationen des Hintergrundes sollten daher möglichst vor der Bild- oder Zeichenerkennung entfernt werden.
Die Hintergrunddaten in einem Bild setzen sich zumeist aus Störungen bei der Digitalisierung (wie Rauschen) und optisch nicht herausfilterbare Bestandteile des digitalisierten Dokumentes (z. B. Verschmutzungen, Schriftteile, Stempel, usw.) zusammen. Um eine optimale Erkennungsrate in einer anschließenden Bildverarbeitung erreichbar zu machen, sollten die Bilddaten nach einer Bildaufbereitung idealerweise nur noch die Daten enthalten, die später durch die Zeichenerkennung verarbeitet werden sollen. Je besser die Bildaufbereitung vor der Erkennung ist, desto günstiger sind auch die Erkennungsergebnisse zu erwarten.
Viele Bildverarbeitungseinheiten erwarten als Eingangsinformation ein in den Graustufen reduziertes Bild, z. B. ein binarisiertes Schwarz/Weiß Bild. Zur Erzeugung eines elektronisch abgetasteten Bildes von einer Vorlage werden vielfach Lesegeräte (Scanner) herangezogen, die mit einer vorgegebenen Abtastfrequenz (z. B. 200 bis 300 Bildpunkte pro Quadratzoll) Bilder mit einer Vielzahl von Graustufen (z. B. 16 oder 256 Graustufen) liefern.
Bedingt durch eine Reihe von Fehlermöglichkeiten beim elektronischen Einlesen einer Vorlage, wie beispielsweise Scannertoleranzen oder einen mangelhaften Abgleich einzelner Lese-Elemente eines Scanners, können bereits hier eine Reihe von Einflußgrößen auftreten, die eine Bilderkennung nachteilig beeinträchtigen können. Bei dem Vorgang der elektronischen Umsetzung der Vorlage in ein elektronisches Bild werden Bildstörungen insbesondere durch unzureichende Justierungen der Einlesevorrichtung hervorgerufenen. Wird beispielsweise eine Vorlage in horizontaler Richtung eingelesenen, so kann das elektronische Grauwert-Bild der Vorlage horizontale Streifen aufweisen, wenn die Lesezellen der Einlesevorrichtung in vertikaler Richtung angeordnet sind und diese unterschiedlich justiert wurden. Die horizontalen Streifen werden durch die unterschiedlichen Empfindlichkeiten bzw. Justagen der einzelnen Lesezellen bedingt.
Auch Art und Qualität der Vorlage selbst können die Bilderkennung entscheidend prägen. So gehen bei einer Wandlung eines Farbbildes in ein Graubild eventuell vorhandene Farbkontraste verloren. Bei handschriftlichen, aber auch bei maschinellen Eintragungen auf einer Vorlage hängt die Les- und Erkennbarkeit auch insbesondere von deren Kontrastierung, bedingt beispielsweise durch mehr oder minder starkes Andrücken beim Schreiben, ab.
Für eine Reihe von Anwendungen besteht die Anforderung, zusätzlich zu der Erzeugung eines Bildes für eine Zeichenerkennung - das sogenannte Netto-Bild - ein Bild für eine Archivierung - das sogenannte Brutto-Bild - zu erzeugen. Es müssen also zwei elektronische Bilder erzeugt werden, was aus Zeitgründen nach Möglichkeit ohne Durchsatzverlust durchgeführt werden sollte. Von den momentan verfügbaren Anwendungen werden hierfür Schwarz/Weiß Bilder, sowohl für die Erkennungseinheit als auch für Archivierungszwecke, verwendet, da Graustufenbilder rechenintensiv komprimiert und dekomprimiert werden müssen und dennoch einen höheren Speicherbedarf als Schwarz/Weiß Bilder haben.
Durch eine elektronische Abtastung einer Vorlage erhält man ein elektronisches Bild der Vorlage, worin jedem Bildpunkt (Pixel) ein Bildwert, beispielsweise ein Grauwert, ein Schwarz- oder Weißwert oder ein Farbwert, zugeordnet ist. Durch die Verwendung von Filtern lassen sich diese Zuordnungen beeinflussen. Bei Anwendung eines Schwellwert-Filters lassen sich beispielsweise die Bildwerte ober- bzw. unterhalb eines vorgegebenen Schwellwertes aus dem elektronischen Bild herausfiltern. So lassen sich z. B. die für eine Bildverarbeitung nicht gewünschten Hintergrundinformationen oder Störeffekte eliminieren.
Die herausgefilterten Bildwerte stehen jedoch danach weder für ein Archivbild noch für eine Bilderkennung zur Verfügung. Eventuell unbeabsichtigt ausgefilterte Vordergrundinformationen können so das Ergebnis einer anschließenden Bilderkennung verfälschen. Je nach Wert des Schwellwertes gehen mehr oder minder viele Informationen verloren. Der Wahl des Schwellwertes kommt so eine eminente Bedeutung für die Qualität der Bilderkennung zu.
Zur Erzeugung von Binärbildern aus Graustufenbildern werden vielfach statische oder dynamische Konvertierungsalgorithmen verwendet. Aus dem Buch von Peter Haberäcker, "Digitale Bildverarbeitung", Carl Hanser Verlag München Wien, ISBN 3-446- 14442-0, 1985, sind eine Reihe von Verfahren zur Bildverarbeitung bekannt, die auch für eine Bildvorverarbeitung angewandt werden können. Es werden dort insbesondere als Operationen im Ortsbereich (Kap. 8) Verfahren zur Glättung der Grauwerte (Kap. 8.1) und die Anwendung von Differenzenoperatoren (Kap. 8.2), sowie Verfahren zur dynamischen Schwellwertbestimmung (Kap. 12.3) vorgestellt.
Eine Übersicht über die bekanntesten Verfahren zur Ermittlung eines Schwellwertes ist in P.K.Sahoo, S.Soltani and A.K.C.Wong "A Survey of Thresholding Techniques", Computer Vision, Graphics and Image Processing 41, 233-260, 1988 zu finden. Es wird dort zwischen Histogramm-Transformations-Methoden, die zur Ermittlung des Schwellwertes die Form eines Histogramms einer Grauwertverteilung verändern und Algorithmen zur Schwellwertberechnung unterschieden.
Aus US-A-4,590,606 und US-A-5,038,381 sind weitere Verfahren zur Bildverarbeitung, wie z. B. Vordergrundfilter durch Laufzeitverhalten, bekannt.
EP-A-0.505.729 beschreibt ein System zur Binarisierung von Bildern, das ein Lesen von Dokumenten mit einer normalen Printqualität ermöglicht.
Allen Verfahren mit einer Ausfilterung von Informationen aus einer elektronischen Vorlage ist jedoch gemein, daß durch das Filtern auch eventuell solche Informationen, die für eine Bilderkennung notwendig sind, verlorengehen können.
Zusammenfassung der Erfindung
Es ist Aufgabe der Erfindung, den Prozeß der Vorbereitung von Bildern für eine Bilderkennung zu verbessern, um so eine erhöhte Erkennbarkeit der gewonnenen Bilder zu gewährleisten. Die Aufgabe wird durch die unabhängigen Ansprüche gelöst.
Erfindungsgemäß erfolgt eine Ermittlung eines Schwellwertes für die Erzeugung eines elektronischen Bildes aus einer Vorlage unter Berücksichtigung der jeweiligen Bildeigenschaften der Vorlage. Die Bildeigenschaften werden dabei insbesondere durch den Bildinhalt, also die eigentlichen Bilddaten, und Bildstörungen, also ungewollte Veränderungen des Bildinhaltes, geprägt. Bei den Bildstörungen ist zu unterscheiden zwischen solchen, die durch den Vorgang der elektronischen Umsetzung der Vorlage in ein elektronisches Bild hervorgerufen werden und solchen, die bereits in der Vorlage vorhanden sind.
In einem ersten Schritt erfolgt eine erste Erfassung der Bildeigenschaften der Vorlage, z. B. durch ein Einscannen der Vorlage mit einem vorgewählten Schwellwert oder durch eine beliebige andere Erfassungsweise. Vorzugsweise wird für die Erfassung bereits mindestens ein Schwellwert z. B. aufgrund von Erfahrungen oder als Mittelwert vorgewählt. Insbesondere eignet sich auch die Erzeugung eines Schwarz-/Weißbildes oder eines Grauwertbildes aus der Vorlage zur Erfassung der Bildeigenschaften.
In einem zweiten Schritt erfolgt eine Analyse der Bildeigenschaften der Vorlage. Zu diesen vorlagenbedingten Bildeigenschaften gehören beispielsweise die eigentlichen Bilddaten, der Bildinhalt aber auch Bildstörungen. Die Analyse der Bildeigenschaften der Vorlage kann entweder selektiv für einzelne Bereiche der Vorlage oder integral für die gesamte Vorlage durchgeführt werden.
In einem dritten Schritt wird dann mindestens ein Schwellwert aus dem Ergebnis bzw. den Ergebnissen der Analyse der vorlagenbedingten Bildeigenschaften ermittelt. Entsprechend der durchgeführten Analyse der Bildeigenschaften der Vorlage kann entweder jeweils mindestens ein Schwellwert selektiv für die einzelnen Bereiche der Vorlage oder ein Schwellwert integral für die gesamte Vorlage ermittelt werden.
Wurde in dem ersten Schritt bereits ein Schwellwert vorgegeben, so kann dieser vorgegebene Schwellwert aufgrund der Analyse der Bildeigenschaften der Vorlage an die ermittelten Bildeigenschaften angepaßt werden. Der vorgegebene Schwellwert wird dann entsprechend der Ergebnisse der Analyse der Bildeigenschaften der Vorlage verändert, bzw. auch gleich gelassen falls eine Änderung nicht notwendig ist.
Die Ermittlung des Schwellwertes aus den vorlagenbedingten Bildeigenschaften erfolgt durch eine Analyse der räumlichen bzw.
örtlichen Verteilung der Bildeigenschaften, die auch als lokale Bildfrequenzen bezeichnet werden. Aus der Verteilungsanalyse läßt sich wiederum auf einen möglichen, zu erwartenden Bildinhalt zurückschließen. Wird beispielsweise bei einem Schwarz-/Weißbild eine Verteilungsdichte der schwarzen Bildpunkte in einem Bereich oberhalb eines vorgebbaren Grenzwertes der Verteilungsdichte ermittelt, so liegt voraussichtlich in diesem Bereich eine wesentliche Bildinformation, wie z. B. eine Schrift, ein Bild oder jeweils Teile davon, vor. Der Schwellwert kann für diesen Bereich nun so verändert werden, daß durch die Schwellwertfilterung weniger Informationen verloren gehen. Wird in einem anderem Bereich in diesem Schwarz-/Weißbild eine Verteilungsdichte der schwarzen Bildpunkte unterhalb des vorgegebenen Grenzwertes ermittelt, so liegt in diesem Bereich voraussichtlich keine wesentliche Bildinformation oder nur eine Bildstörung vor. Der Schwellwert kann für diesen Bereich nun so verändert werden, daß durch die Schwellwertfilterung mehr Informationen eliminiert werden.
Die Verteilungsanalyse erfolgt vorzugsweise durch eine Ermittlung der örtlichen Variation der Grau- bzw. Farbwerte, z. B. entlang einer Zeile. Bei einem erzeugten Schwarz-/Weißbild der Vorlage lassen sich so beispielsweise die Anzahl der Schwarzwerte entlang einer Zeile - oder eines Zeilenausschnittes - ermitteln. Bei einem erzeugten Grauwertbild der Vorlage kann beispielsweise die Anzahl der Änderungen der Grauwerte entlang einer Zeile oder eines Zeilenausschnittes ermittelt werden.
Die örtliche Variation der Grau- bzw. Farbwerte, also beispielsweise die ermittelte Anzahl oder Dichte der Schwarzwerte oder der Anzahl der Änderungen der Grauwerte, ist vielfach ein Maß für den Informationsgehalt des betrachteten Bereiches in der Vorlage. Die ermittelte örtliche Variation der Grau- bzw. Farbwerte kann nun mit vorgebbaren Werten verglichen werden, die so einen Rückschluß auf den wahrscheinlichen Inhalt des Bereiches zulassen, also beispielsweise, ob der Bereich voraussichtlich ein Bild oder eine Schrift enthält. Wird so ein Bereich der voraussichtlich ein Bild oder eine Schrift beinhaltet erkannt, kann der Schwellwert für diesen Bereich so angepaßt werden, daß die Gefahr eines Informationsverlusts durch die Schwellwertfilterung reduziert wird. Analog dazu kann der Schwellwert in Bereichen, in denen keine wesentliche Bildinformation oder nur eine Bildstörung vermutet wird, so angepaßt werden, daß durch die Schwellwertfilterung mehr Informationen herausgefiltert werden.
Ist beispielsweise in einem Schwarz-/Weißbild eine ermittelte Anzahl der Schwarzwerte pro Längen- oder Flächeneinheit, bzw. in einem Graubild die Anzahl der Änderungen der Grauwerte pro Längen- oder Flächeneinheit größer als ein vorgegebener Wert, deutet dies auf eine Schrift oder ein Bild in diesem Bereich hin. Entsprechend deutet eine ermittelte Anzahl der Schwarzwerte bzw. die Anzahl der Änderungen der Grauwerte pro Längen- oder Flächeneinheit kleiner als ein vorgegebener Wert auf eine Bildstörung oder zumindest auf eine unwesentliche Bildinformation in diesem Bereich hin.
Aus der Verteilungsanalyse lassen sich also insbesondere die für eine Bilderkennung interessante Bereiche, wie eine Schrift oder ein Bild, erkennen. Weiterhin ermöglicht die Verteilungsanalyse eine Hintergrunderkennung bei einem regelmäßigen Hintergrund. Besteht die Vorlage nun aus Bildteilen mit ausschließlicher Vorder- und/oder Hintergrundinformation, lassen sich die einzelnen Bereiche mit unterschiedlichen Schwellwerten bearbeiten. Hintergrundbereiche können so bereinigt werden, während die für die Bilderkennung interessanten Bereiche sicherer, im Sinne der Gefahr von Informationsverlusten, verarbeitet werden.
Der oder die Schwellwerte können weiterhin an die systembedingten Bildeigenschaften durch eine geeignete Wahl der Bereiche für eine Untersuchung lokaler Bildeigenschaften angepaßt werden. Zu den systembedingten Bildeigenschaften gehören u. a. die durch den Einlesevorgang hervorgerufenen Bildstörungen oder die Vorlagentyp-spezifischen Bildeigenschaften, die von Vorlage zu Vorlage eines Vorlagentyps gleich bleiben. Die vorlagentyp-spezifischen Bildeigenschaften werden insbesondere durch den Bildaufbau und die Bildeinteilung des jeweiligen Vorlagentyps geprägt. Bei einer Vorlage, die in horizontaler Richtung eingelesen wird, werden die Untersuchungsbereiche vorzugsweise horizontal länglich (z. B. zeilenweise) - entsprechend der horizontalen Einleseweise - angenommen. Entsprechend werden bei Vorlagen, bei denen die Informationen überwiegend zeilenweise (oder vertikal) auftreten, die Bereiche ebenfalls zeilenhaft (oder vertikal) ausgeprägt.
Die Erfindung findet Anwendung bei der (Vor-)verarbeitung von Dokumenten für eine Bilderkennung und/oder für eine Archivierung der Dokumente.
Weitere, vorteilhafte Ausführungen der Erfindung finden sich in den Unteransprüchen.
Beschreibung der Zeichnungen
Zur näheren Erläuterung der Erfindung sind im folgenden Ausführungsbeispiele mit Bezugnahme auf die Zeichnungen beschrieben. Funktionsgleiche Elemente sollen gleiche Bezugszeichen tragen.
Fig. 1 zeigt eine Vorlage mit einer Schrift und einer zufälligen Bildstörung,
Fig. 2 zeigt ein elektronisches Grauwertbild der Vorlage, aus Fig. 1, das mit einem einheitlichen, mittleren Schwellwert aus der Vorlage gewonnen wurde,
Fig. 3 zeigt die Grauwertverteilung in horizontaler Richtung für 3 exemplarisch ausgewählte Zeilenbereiche A, B und C mit einer Länge L in dem Grauwertbild aus Fig. 2,
Fig. 4 zeigt ein gemäß der Erfindung aus der Vorlage in Fig. 1 gewonnenes Bild,
Fig. 5 erläutern die Erfindung an einem Beispiel eines Scanners, der eine 4-Bit-Wandlung durchführt.
Detaillierte Beschreibung der Erfindung
Fig. 1 zeigt eine Vorlage 10 mit einer Schrift 20 und einer zufälligen Bildstörung 30. Fig. 2 zeigt ein elektronisches Grauwertbild 40 der Vorlage 10, das mit einem einheitlichen, mittleren Schwellwert SWmittel aus der Vorlage 10 gewonnen wurde. Der mittlere Schwellwert SWmittel kann beispielsweise aus einer Mittelung der Grauwertverteilung der Vorlage oder eines Bereiches davon stammen oder als Erfahrungswert einfach vorgegeben werden. Das Grauwertbild 40 weist ein Bild 20′ der Schrift 20 und ein Bild 30′ der zufälligen Bildstörung 30 auf. Wie aus Fig. 2 zu entnehmen ist, sind durch die Schwellwertfilterung Informationen verloren gegangen, die im ungünstigsten Fall eine Erkennbarkeit der Schrift 20 erschweren können.
Fig. 3 zeigt die Grauwertverteilung in horizontaler Richtung für 3 exemplarisch ausgewählte Zeilenbereiche A, B und C mit einer Länge L in dem Grauwertbild 40. Innerhalb des Zeilenbereiches A werden 8 Peaks oberhalb und 1 Peak unterhalb eines vorgegebenen Grauwertes G ermittelt. Innerhalb des Zeilenbereiches B wird kein Peak oberhalb und es werden 2 Peaks unterhalb des Grauwertes G gefunden. Innerhalb des Zeilenbereiches C werden 2 Peaks oberhalb und 1 Peak unterhalb des Grauwertes G ermittelt.
Als Grenzwert für die Erkennung bild-relevanter Bereiche innerhalb der Vorlage 10 sei eine Anzahl von 4 Peaks oberhalb des vorgegebenen Grauwertes G für einen Zeilenbereich der Länge L gegeben. Dementsprechend wird nur der Zeilenbereich A als ein Bild-relevanter Bereich erkannt. Für diesen Zeilenbereich A wird für einen zweiten Einlesevorgang ein Schwellwert SWinformation, der gegenüber dem mittleren Schwellwert SWmittel weiter in Richtung "weiß" verschoben ist, also weniger Informationen herausfiltern wird, eingestellt. Die Zeilenbereiche B und C hingegen werden als nicht-bild-relevante Bereiche eingestuft und es wird für einen zweiten Einlesevorgang ein Schwellwert SWhinergrund, der gegenüber dem mittleren Schwellwert SWmittel weiter in Richtung "schwarz" verschoben ist, also mehr Informationen herausfiltern wird, eingestellt.
Der oben dargestellte Vorgang zur Erkennung bild-relevanter Bereiche wird entsprechend zeilenweise für das gesamte Bild 40 durchgeführt, die Schwellwerte der einzelnen Bereiche werden an die erkannten Bereiche angepaßt und ein neues Bild 50 mit Hilfe der neu angepaßten Schwellwerte erzeugt. Fig. 4 zeigt das neue Bild 50. Die Schrift 20 der Vorlage 10 wurde als bild-relevanter Bereich erkannt und in dem Bild 50 als Schrift 20′′ abgebildet. Die zufällige Bildstörung 30 aus der Vorlage 10 konnte durch diesen Prozeß vollständig eliminiert werden.
Die Erfindung soll an einem weiteren Beispiel eines Scanners, der eine 4-Bit-Wandlung durchführt, erläutert. Eine 4-Bit- Wandlung bedeutet, daß als Vorlage ein Graubild mit 16 Graustufen vorliegt, das in ein Schwarz-Weiß-Bild gewandelt werden soll. Der Grauwert 15 soll in diesem Beispiel der Graustufe "weiß" entsprechen und der Grauwert 0 der Graustufe "schwarz".
Fig. 5a zeigt einen Bildausschnitt eines ersten eingescannten Testbildes einer (hier nicht gezeigten) Vorlage. Fig. 5b stellt die Verteilung der Bilddaten (Grauwert-Histogramm) für einen Bereich des Testbildes dar. Aus diesem Histogramm ergibt sich ein mittlerer Grauwert von 11,23. Wird als Schwellwert für die Wandlung der Vorlage in ein Schwarz-Weiß-Bild dieser mittlere Grauwert, oder durch die Abrundung auf gerade Werte (Integer) ein entsprechender Schwellwert von 11, verwendet, werden nicht ausreichend Bildinformationen der Vorlage in dem gezeigten Bildausschnitt in schwarze Bildpunkte umgewandelt werden. Die Schwellwertfilterung bewirkt, daß Werte, die kleiner als der vorgegebene Schwellwert sind, in signifikante, schwarze Bildpunkte umgewandelt werden. Störinformation (Rauschen, Digitalisierungsfehler), aber auch tatsächliche Bildinformationen mit Grauwerten größer als der Schwellwert werden als weiße Bildpunkte dargestellt.
Aus dem Histoprogramm in Fig. 5b ist nicht ersichtlich, ob es sich bei den Bildpunkten um verwertbare Informationen oder um Rauschen handelt. Daher ist hier eine Schwarz-Weiß-Wandlung immer mit dem Risiko des Auslöschens von Informationen behaftet.
Erfindungsgemäß wird nun eine Verteilungsanalyse durchgeführt, d. h. es wird die "Frequenz" der vorliegenden Bilddaten in horizontaler Richtung untersucht. Die horizontale Bildrichtung bietet sich insbesondere dann an, wenn Schriften in horizontaler Richtung erwartet werden. Fig. 5c zeigt einen Verlauf 100 der Grauwerte für einen Bereich in horizontaler Richtung innerhalb der Schrift "Konto-Nr" in Fig. 5a, wobei diese in der Vorlage rot gedruckt wurde. Der Verlauf 100 der Grauwerte wird mathematisch differenziert und führt zu einem Verlauf 110 der Ableitung. Durch Aufsummieren der vorkommenden Wendepunkte oder Maxima in der Ableitung 110, bezogen auf die Längeneinheit, ergibt sich eine "Frequenz" für diesen Bereich. Die so ermittelte "Frequenz" wird mit einem vorgegebenen Grenzwert verglichen. Dabei wurde der Grenzwert aufgrund vorangegangener Bilduntersuchungen so eingestellt, daß signifikante Textbereiche erkannt werden können.
In dem Beispiel in Fig. 5c liegt die ermittelte "Frequenz" oberhalb des vorgegebenen Grenzwertes, so daß ein signifikanter Textbereich angenommen wird. Der Schwellwert für die Schwarz-Weiß-Wandlung wird entsprechend angepaßt und in diesem Beispiel um eine Graustufe (also von 11 auf 12) nach oben festgelegt. Fig. 5d zeigt das Ergebnis der durchgeführten Schwarz-Weiß-Wandlung mit dem angepaßten Schwellwert.
Der Einfachheit halber wurde in Fig. 5d die Schwarz-Weiß-Wandlung für den ganzen in Fig. 5a gezeigten Bereich mit dem angepaßten Schwellwert durchgeführt. Entsprechend könnte jedoch auch eine Schwarz-Weiß-Wandlung mit einer Vielzahl von an einzelne Bereiche angepaßten Schwellwerten durchgeführt werden.

Claims (17)

1. Verfahren zur Ermittlung eines Schwellwertes für die Erzeugung eines elektronischen Bildes (50) von einer Vorlage (10), mit:
einem ersten Schritt der Erfassung der Bildeigenschaften der Vorlage (10);
einem zweiten Schritt der Analyse der räumlichen und/oder örtlichen Verteilung der Bildeigenschaften der Vorlage (10); und
einem dritten Schritt des Ermittelns eines Schwellwertes aus der Verteilungsanalyse der Bildeigenschaften der Vorlage (10).
2. Verfahren nach Anspruch 1, worin die Verteilungsanalyse der Bildeigenschaften durch eine Ermittlung der räumlichen und/oder örtlichen Variation der Grau- bzw. Farbwerte erfolgt.
3. Verfahren nach Anspruch 2, worin die Verteilungsanalyse der Bildeigenschaften zeilenweise erfolgt.
4. Verfahren nach Anspruch 2 oder 3, worin die ermittelte örtliche Variation der Grau- bzw. Farbwerte mit einem vorgegebenen Wert verglichen wird.
5. Verfahren nach Anspruch 4, worin der vorgegebene Wert so gewählt wird, daß ein Rückschluß auf den wahrscheinlichen Bildinhalt ermöglicht wird, vorzugsweise, ob die Vorlage (10) voraussichtlich ein Bild und/oder eine Schrift enthält.
6. Verfahren nach einem der vorstehenden Ansprüche, worin der erste Schritt der Erfassung der Bildeigenschaften der Vorlage (10) ein Einlesen der Vorlage (10) mit einem vorgewählten Schwellwert beinhaltet, und der vorgewählte Schwellwert in dem dritten Schritt angepaßt wird.
7. Verfahren nach Anspruch 6, worin der vorgewählte Schwellwert so verändert wird, daß, wenn aufgrund der Verteilungsanalyse der Bildeigenschaften in der Vorlage (10) relevante Informationen vermutet werden, durch die Schwellwertfilterung weniger Informationen verloren gehen, oder wenn in der Vorlage (10) keine relevante Informationen vermutet werden, durch die Schwellwertfilterung mehr Informationen verloren gehen.
8. Verfahren nach Anspruch 7, worin eine relevante Informationen dann vermutet wird, wenn eine Verteilungsdichte von zu betrachtenden Bildpunkten einen vorgegebenen Grenzwert der Verteilungsdichte überschreiten.
9. Verfahren entsprechend einem der vorstehenden Ansprüche, worin die Ermittlung des Schwellwertes entweder selektiv für einzelne Bereiche der Vorlage (10) oder integral für die gesamte Vorlage (10) durchgeführt wird.
10. Verfahren entsprechend einem der vorstehenden Ansprüche, worin die Verteilungsanalyse der Bildeigenschaften für lokale Bereiche innerhalb der Vorlage durchgeführt wird.
11. Verfahren nach Anspruch 10, mit einem Schritt der Anpassung der lokalen Bereiche an systembedingte Bildeigenschaften.
12. Verfahren nach Anspruch 11, worin die lokalen Bereiche entsprechend der Einleseweise der Vorlage (10) und/oder einer bestimmten Auftretensform der Informationen in der Vorlage (10) angepaßt werden.
13. Verwendung des Verfahrens entsprechend einem der vorstehenden Ansprüche für eine Vorverarbeitung der Vorlage (10) vor einer nachfolgenden Bildverarbeitung.
14. Verwendung des Verfahrens entsprechend einem der vorstehenden Ansprüche für eine Bilderkennung und/oder für eine Archivierung von Dokumenten.
15. Verwendung des Verfahrens entsprechend einem der vorstehenden Ansprüche in einem Programm für eine elektronische Datenverarbeitung.
16. Verwendung des Verfahrens entsprechend einem der vorstehenden Ansprüche für eine Erkennung von Bereichen, die eine Schrift und/oder ein Bild und/oder einen regelmäßigen Hintergrund aufweisen.
17. Vorrichtung zur Ermittlung eines Schwellwertes für die Erzeugung eines elektronischen Bildes (50) von einer Vorlage (10), mit:
einem Mittel zur Erfassung der Bildeigenschaften der Vorlage (10);
einem Mittel zur Analyse der räumlichen und/oder örtlichen Verteilung der Bildeigenschaften der Vorlage (10); und
einem Mittel zur Ermittlung des Schwellwertes aus der Verteilungsanalyse der Bildeigenschaften der Vorlage (10), wobei das Mittel zur Ermittlung des Schwellwertes ein Mittel zur Auswertung und Bewertung der Analyse der räumlichen Verteilung der Bildeigenschaften aufweist.
DE19536170A 1995-09-29 1995-09-29 Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen Ceased DE19536170A1 (de)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19536170A DE19536170A1 (de) 1995-09-29 1995-09-29 Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19536170A DE19536170A1 (de) 1995-09-29 1995-09-29 Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen

Publications (1)

Publication Number Publication Date
DE19536170A1 true DE19536170A1 (de) 1997-04-03

Family

ID=7773481

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19536170A Ceased DE19536170A1 (de) 1995-09-29 1995-09-29 Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen

Country Status (1)

Country Link
DE (1) DE19536170A1 (de)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10054185A1 (de) * 2000-11-02 2002-05-29 Infineon Technologies Ag Verfahren zur Optimierung eines elektronisch erzeugten Bildes
EP1330111A2 (de) * 2002-01-16 2003-07-23 Eastman Kodak Company Technik zur automatischen Bildqualitätsbewertung und -korrektion
DE10010621B4 (de) * 1999-03-12 2006-08-24 International Business Machines Corp. Schnelles Lokalisieren von Adressblöcken in Graustufenbildern
US7499569B2 (en) 2004-02-26 2009-03-03 Mitsubishi Fuso Truck And Bus Corporation Hand pattern switching apparatus
US8194941B2 (en) 2007-03-12 2012-06-05 Nec Corporation Character noise eliminating apparatus, character noise eliminating method, and character noise eliminating program
CN106529518B (zh) * 2016-09-08 2018-12-14 广东德诚科教有限公司 一种答题卡识别的方法及装置
DE112006003272B4 (de) 2005-11-30 2022-08-18 Adobe Inc. Verfahren und Vorrichtung zum Entfernen von Rauschen aus einem digitalen Bild

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4590606A (en) * 1982-12-13 1986-05-20 International Business Machines Corporation Multi-function image processing system
DE2757456C2 (de) * 1976-12-22 1988-04-14 Recognition Equipment Inc., Dallas, Tex., Us
DE3433493C2 (de) * 1983-09-12 1988-07-21 Ricoh Co., Ltd., Tokio/Tokyo, Jp
US4878248A (en) * 1988-04-18 1989-10-31 Industrial Technology Research Institute Method and apparatus for automatically recognizing license plate characters
US5038381A (en) * 1988-07-11 1991-08-06 New Dest Corporation Image/text filtering system and method
EP0505729A2 (de) * 1991-03-29 1992-09-30 EASTMAN KODAK COMPANY (a New Jersey corporation) Bildbinarisierungssystem
DE4411248C1 (de) * 1994-03-31 1995-10-26 Licentia Gmbh Verfahren und Vorrichtung zum Binarisieren von Pixel-Daten
DE4445386C1 (de) * 1994-12-20 1996-05-02 Ibm Verfahren und Vorrichtung zur Trennung einer Vordergrundinformation von einer Hintergrundinformation in einer Vorlage

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2757456C2 (de) * 1976-12-22 1988-04-14 Recognition Equipment Inc., Dallas, Tex., Us
US4590606A (en) * 1982-12-13 1986-05-20 International Business Machines Corporation Multi-function image processing system
DE3433493C2 (de) * 1983-09-12 1988-07-21 Ricoh Co., Ltd., Tokio/Tokyo, Jp
US4878248A (en) * 1988-04-18 1989-10-31 Industrial Technology Research Institute Method and apparatus for automatically recognizing license plate characters
US5038381A (en) * 1988-07-11 1991-08-06 New Dest Corporation Image/text filtering system and method
EP0505729A2 (de) * 1991-03-29 1992-09-30 EASTMAN KODAK COMPANY (a New Jersey corporation) Bildbinarisierungssystem
DE4411248C1 (de) * 1994-03-31 1995-10-26 Licentia Gmbh Verfahren und Vorrichtung zum Binarisieren von Pixel-Daten
DE4445386C1 (de) * 1994-12-20 1996-05-02 Ibm Verfahren und Vorrichtung zur Trennung einer Vordergrundinformation von einer Hintergrundinformation in einer Vorlage

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
OHYA, SHIO, AKAMATSU: "Recognition characters in scane images" IEEE Transactions on pattern analysis and machine intelligence, Vol. PAMI-16, N. 2, 1994, S. 214-220 *
SAHOO, et al: "A Survey of Thresholding Techni- ques" Computer Vision, Graphics and Image Pro- cessing 41, 1988, S. 233-260 *
WHITE/ROHRER: "Image Thresholding for Optical Character Recognition and other Application Reguiring Character Image Extraction" IBM J.Res. Develop., Vol. 27, Nr. 4, July 1983, pp. 400-411 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10010621B4 (de) * 1999-03-12 2006-08-24 International Business Machines Corp. Schnelles Lokalisieren von Adressblöcken in Graustufenbildern
DE10054185A1 (de) * 2000-11-02 2002-05-29 Infineon Technologies Ag Verfahren zur Optimierung eines elektronisch erzeugten Bildes
EP1330111A2 (de) * 2002-01-16 2003-07-23 Eastman Kodak Company Technik zur automatischen Bildqualitätsbewertung und -korrektion
EP1330111A3 (de) * 2002-01-16 2004-12-08 Eastman Kodak Company Technik zur automatischen Bildqualitätsbewertung und -korrektion
US6970606B2 (en) 2002-01-16 2005-11-29 Eastman Kodak Company Automatic image quality evaluation and correction technique for digitized and thresholded document images
US7499569B2 (en) 2004-02-26 2009-03-03 Mitsubishi Fuso Truck And Bus Corporation Hand pattern switching apparatus
DE112006003272B4 (de) 2005-11-30 2022-08-18 Adobe Inc. Verfahren und Vorrichtung zum Entfernen von Rauschen aus einem digitalen Bild
US8194941B2 (en) 2007-03-12 2012-06-05 Nec Corporation Character noise eliminating apparatus, character noise eliminating method, and character noise eliminating program
CN106529518B (zh) * 2016-09-08 2018-12-14 广东德诚科教有限公司 一种答题卡识别的方法及装置

Similar Documents

Publication Publication Date Title
DE4445386C1 (de) Verfahren und Vorrichtung zur Trennung einer Vordergrundinformation von einer Hintergrundinformation in einer Vorlage
DE60308739T2 (de) Automatisches Bildqualitäts-Bewertungsverfahren und Korrekturtechnik
DE69533054T2 (de) Mehrfenstertechnik zur Schwellenwertverarbeitung eines Bildes unter Verwendung lokaler Bildeigenschaften
DE69728127T2 (de) Vorrichtung und Verfahren zur Extraktion eines Objekts in einem Bild
DE69925354T2 (de) Bildverarbeitungssystem um vertikale Muster auf abgetasteten Bildern zu reduzieren
DE3545951C2 (de)
DE69828909T2 (de) Neue perzeptive lokale gradientenbasierte gratbestimmung
DE19956158A1 (de) Bild-Binärisierungsverfahren auf Bereichsbasis
DE3633743C2 (de)
DE4103229C2 (de)
DE60132315T2 (de) Verbessertes verfahren zur bildbinarisierung
DE69926205T2 (de) Artefaktentfernungstechnik für schiefenkorrigierte bilder
EP0925682B1 (de) Verfahren zur detektion von kanten in einem bildsignal
DE69728724T2 (de) Bildbereichs-Erkennungsverfahren und Bildverarbeitungsvorrichtung
DE112010005721B4 (de) Bildverarbeitungsvorrichtung
DE102008013789A1 (de) Vorrichtung, Verfahren und Programm zum Eliminieren von Zeichenstörungen
DE102007013971A1 (de) Verfahren und Vorrichtung zur Ermittlung einer Zellkontur einer Zelle
EP0402868A2 (de) Verfahren zur Erkennung von vorab lokalisierten, in digitalen Grauwertbildern vorliegenden Zeichen, insbesondere zum Erkennen von in Metalloberflächen eingeschlagenen Zeichen
DE10303724B4 (de) Dynamisches Zweipegel-Schwellwertverfahren digitaler Bilder
DE60024535T2 (de) Verfahren zur Zeichentrennung
DE19536170A1 (de) Ermittlung von Schwellwerten bei der Digitalisierung von Bildern durch eine Verteilungsanalyse der Informationen
DE69728469T2 (de) Gerät und Verfahren zur Ermittlung der Zeichenlinie mittels vereinfachter Projektionsinformation; Zeichenerkennungsgerät und Verfahren
EP3123393B1 (de) Verfahren zur optischen erkennung von zeichen
EP0753231B1 (de) Verfahren und vorrichtung zum binarisieren von pixel-daten
DE19754909A1 (de) Verfahren und Vorrichtung zur Erfassung und Bearbeitung von Abbildungen biologischen Gewebes

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8128 New person/name/address of the agent

Representative=s name: RACH, W., DR., PAT.-ASS., 70569 STUTTGART

8131 Rejection