DE19536170A1 - Image thresholding for optical character recognition - Google Patents

Image thresholding for optical character recognition

Info

Publication number
DE19536170A1
DE19536170A1 DE19536170A DE19536170A DE19536170A1 DE 19536170 A1 DE19536170 A1 DE 19536170A1 DE 19536170 A DE19536170 A DE 19536170A DE 19536170 A DE19536170 A DE 19536170A DE 19536170 A1 DE19536170 A1 DE 19536170A1
Authority
DE
Germany
Prior art keywords
image
template
threshold value
image properties
distribution
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
DE19536170A
Other languages
German (de)
Inventor
Winfried Bruegmann
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to DE19536170A priority Critical patent/DE19536170A1/en
Publication of DE19536170A1 publication Critical patent/DE19536170A1/en
Ceased legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

The thresholding involves processing the image qualities of the sheet. The image is scanned with a preselected threshold value or a black/white or gray scale image is formed. The image characteristics are analysed, the image data, image content and image distortions, selective for specific areas of the image or for the entire image. The spatial and local spread of the image characteristics are analysed. A threshold value from the results of the analysis is transmitted. The threshold value is selected on the basis that the required image has a more pronounced amplitude and distribution characteristic. The area scanned yield signals ABC that relate to the required signature signal A, background B and image distortion effects C.

Description

Gebiet der ErfindungField of the Invention

Die Erfindung betrifft die Ermittlung von Schwellwerten bei der Digitalisierung von Bildern.The invention relates to the determination of threshold values in the Digitization of images.

Stand der TechnikState of the art

Um eine Bild- oder Zeichenerkennung (Optical Character Recognition) in einem elektronisch abgetasteten und digitalisierten Dokument durchführen zu können, müssen häufig in einem ersten Vorverarbeitungsschritt (image preprocessing), die Informationen des Vordergrundes von den Informationen des Hintergrundes getrennt werden. Dabei stellen die Informationen des Vordergrundes oftmals die eigentlichen, für die Zeichenerkennung zu betrachtenden (wichtigen) Bilddaten dar, während die Informationen des Hintergrundes vielfach störend wirken und zu Fehlinterpretationen der Vordergrundinformationen führen können. Auch tragen die Daten des Hintergrund des Bildes häufig zu einer Herabsetzung der Erkennungsleistung der Vordergrundinformation bei einer durchzuführenden Zeichenerkennung bei. Die Informationen des Hintergrundes sollten daher möglichst vor der Bild- oder Zeichenerkennung entfernt werden.For image or character recognition (Optical Character Recognition) in an electronically scanned and To be able to carry out digitized documents often has to a first preprocessing step, the Information of the foreground from the information of the Background. In doing so, provide the information of the foreground often the actual ones for which Character recognition to be considered (important) image data, while the background information is often distracting act and misinterpret the foreground information being able to lead. Also carry the data of the background of the picture often reduce the recognition performance of the Foreground information for a to be carried out Character recognition at. The information of the background Therefore, if possible, before image or character recognition be removed.

Die Hintergrunddaten in einem Bild setzen sich zumeist aus Störungen bei der Digitalisierung (wie Rauschen) und optisch nicht herausfilterbare Bestandteile des digitalisierten Dokumentes (z. B. Verschmutzungen, Schriftteile, Stempel, usw.) zusammen. Um eine optimale Erkennungsrate in einer anschließenden Bildverarbeitung erreichbar zu machen, sollten die Bilddaten nach einer Bildaufbereitung idealerweise nur noch die Daten enthalten, die später durch die Zeichenerkennung verarbeitet werden sollen. Je besser die Bildaufbereitung vor der Erkennung ist, desto günstiger sind auch die Erkennungsergebnisse zu erwarten. The background data in an image is usually exposed Interference with digitization (such as noise) and optical not filterable components of the digitized Document (e.g. dirt, writing, stamps, etc.) together. To get an optimal detection rate in one subsequent image processing should be accessible ideally, the image data after image processing only which contain data later through character recognition should be processed. The better the image preparation before the detection, the cheaper they are Detection results expected.  

Viele Bildverarbeitungseinheiten erwarten als Eingangsinformation ein in den Graustufen reduziertes Bild, z. B. ein binarisiertes Schwarz/Weiß Bild. Zur Erzeugung eines elektronisch abgetasteten Bildes von einer Vorlage werden vielfach Lesegeräte (Scanner) herangezogen, die mit einer vorgegebenen Abtastfrequenz (z. B. 200 bis 300 Bildpunkte pro Quadratzoll) Bilder mit einer Vielzahl von Graustufen (z. B. 16 oder 256 Graustufen) liefern.Many image processing units expect as Input information an image reduced in grayscale, e.g. B. a binarized black and white image. To generate a electronically scanned image from a template often readers (scanners) used with a predetermined sampling frequency (e.g. 200 to 300 pixels per Square inches) Images with a variety of grayscale (e.g. 16 or 256 shades of gray).

Bedingt durch eine Reihe von Fehlermöglichkeiten beim elektronischen Einlesen einer Vorlage, wie beispielsweise Scannertoleranzen oder einen mangelhaften Abgleich einzelner Lese-Elemente eines Scanners, können bereits hier eine Reihe von Einflußgrößen auftreten, die eine Bilderkennung nachteilig beeinträchtigen können. Bei dem Vorgang der elektronischen Umsetzung der Vorlage in ein elektronisches Bild werden Bildstörungen insbesondere durch unzureichende Justierungen der Einlesevorrichtung hervorgerufenen. Wird beispielsweise eine Vorlage in horizontaler Richtung eingelesenen, so kann das elektronische Grauwert-Bild der Vorlage horizontale Streifen aufweisen, wenn die Lesezellen der Einlesevorrichtung in vertikaler Richtung angeordnet sind und diese unterschiedlich justiert wurden. Die horizontalen Streifen werden durch die unterschiedlichen Empfindlichkeiten bzw. Justagen der einzelnen Lesezellen bedingt.Due to a number of possible errors in the electronic reading of a template, such as Scanner tolerances or poor matching of individual Reading elements of a scanner can already be a number of Influencing factors occur that adversely affect image recognition can affect. In the process of electronic Implementation of the template in an electronic image Image disturbances, in particular due to insufficient adjustments of the Reading device evoked. For example, if Original in the horizontal direction, so it can electronic grayscale image of template horizontal stripes if the reading cells of the reading device in are arranged vertically and these differ were adjusted. The horizontal stripes are represented by the different sensitivities or adjustments of the individual Read cells conditional.

Auch Art und Qualität der Vorlage selbst können die Bilderkennung entscheidend prägen. So gehen bei einer Wandlung eines Farbbildes in ein Graubild eventuell vorhandene Farbkontraste verloren. Bei handschriftlichen, aber auch bei maschinellen Eintragungen auf einer Vorlage hängt die Les- und Erkennbarkeit auch insbesondere von deren Kontrastierung, bedingt beispielsweise durch mehr oder minder starkes Andrücken beim Schreiben, ab.The type and quality of the template itself can also Shape image recognition decisively. So go for a change of a color image in a gray image possibly existing Color contrasts lost. With handwritten, but also with machine entries on a template depends on the reading and Recognizability especially of their contrasting, for example due to more or less strong pressure when writing, from.

Für eine Reihe von Anwendungen besteht die Anforderung, zusätzlich zu der Erzeugung eines Bildes für eine Zeichenerkennung - das sogenannte Netto-Bild - ein Bild für eine Archivierung - das sogenannte Brutto-Bild - zu erzeugen. Es müssen also zwei elektronische Bilder erzeugt werden, was aus Zeitgründen nach Möglichkeit ohne Durchsatzverlust durchgeführt werden sollte. Von den momentan verfügbaren Anwendungen werden hierfür Schwarz/Weiß Bilder, sowohl für die Erkennungseinheit als auch für Archivierungszwecke, verwendet, da Graustufenbilder rechenintensiv komprimiert und dekomprimiert werden müssen und dennoch einen höheren Speicherbedarf als Schwarz/Weiß Bilder haben.For a number of applications, there is a requirement in addition to creating an image for one Character recognition - the so-called net image - one image for one Archiving - the so-called gross image - to generate. It  So two electronic images have to be created, what from Time constraints performed without loss of throughput if possible should be. Of the applications currently available for this black and white pictures, both for the recognition unit as well as for archiving purposes, because grayscale images have to be computationally compressed and decompressed and still requires more memory than black and white images to have.

Durch eine elektronische Abtastung einer Vorlage erhält man ein elektronisches Bild der Vorlage, worin jedem Bildpunkt (Pixel) ein Bildwert, beispielsweise ein Grauwert, ein Schwarz- oder Weißwert oder ein Farbwert, zugeordnet ist. Durch die Verwendung von Filtern lassen sich diese Zuordnungen beeinflussen. Bei Anwendung eines Schwellwert-Filters lassen sich beispielsweise die Bildwerte ober- bzw. unterhalb eines vorgegebenen Schwellwertes aus dem elektronischen Bild herausfiltern. So lassen sich z. B. die für eine Bildverarbeitung nicht gewünschten Hintergrundinformationen oder Störeffekte eliminieren.By electronically scanning a template, one obtains a electronic image of the template, in which each pixel an image value, for example a gray value, a black or White value or a color value, is assigned. By using it these assignments can be influenced by filters. At For example, a threshold filter can be applied the image values above or below a given Filter out threshold values from the electronic image. So can z. B. those not desired for image processing Eliminate background information or interference.

Die herausgefilterten Bildwerte stehen jedoch danach weder für ein Archivbild noch für eine Bilderkennung zur Verfügung. Eventuell unbeabsichtigt ausgefilterte Vordergrundinformationen können so das Ergebnis einer anschließenden Bilderkennung verfälschen. Je nach Wert des Schwellwertes gehen mehr oder minder viele Informationen verloren. Der Wahl des Schwellwertes kommt so eine eminente Bedeutung für die Qualität der Bilderkennung zu.However, the filtered out image values do not stand for an archive image is still available for image recognition. Possibly unintentionally filtered out foreground information can be the result of a subsequent image recognition distort. Depending on the value of the threshold, more or go less information lost. The choice of the threshold such an eminent importance for the quality of the Image recognition too.

Zur Erzeugung von Binärbildern aus Graustufenbildern werden vielfach statische oder dynamische Konvertierungsalgorithmen verwendet. Aus dem Buch von Peter Haberäcker, "Digitale Bildverarbeitung", Carl Hanser Verlag München Wien, ISBN 3-446- 14442-0, 1985, sind eine Reihe von Verfahren zur Bildverarbeitung bekannt, die auch für eine Bildvorverarbeitung angewandt werden können. Es werden dort insbesondere als Operationen im Ortsbereich (Kap. 8) Verfahren zur Glättung der Grauwerte (Kap. 8.1) und die Anwendung von Differenzenoperatoren (Kap. 8.2), sowie Verfahren zur dynamischen Schwellwertbestimmung (Kap. 12.3) vorgestellt.To generate binary images from grayscale images often static or dynamic conversion algorithms used. From the book by Peter Haberäcker, "Digitale Image processing ", Carl Hanser Verlag Munich Vienna, ISBN 3-446- 14442-0, 1985, are a number of methods for Image processing known, also for image preprocessing can be applied. There are especially as Operations in the local area (Chapter 8) Methods for smoothing the Gray values (chap.8.1) and the use of difference operators  (Chap. 8.2), as well as procedures for dynamic Threshold determination (Section 12.3) presented.

Eine Übersicht über die bekanntesten Verfahren zur Ermittlung eines Schwellwertes ist in P.K.Sahoo, S.Soltani and A.K.C.Wong "A Survey of Thresholding Techniques", Computer Vision, Graphics and Image Processing 41, 233-260, 1988 zu finden. Es wird dort zwischen Histogramm-Transformations-Methoden, die zur Ermittlung des Schwellwertes die Form eines Histogramms einer Grauwertverteilung verändern und Algorithmen zur Schwellwertberechnung unterschieden.An overview of the best-known methods for determining a threshold is in P.K.Sahoo, S.Soltani and A.K.C.Wong "A Survey of Thresholding Techniques", Computer Vision, Graphics and Image Processing 41, 233-260, 1988. It will be there between histogram transformation methods used to determine of the threshold value the shape of a histogram Change gray value distribution and algorithms for Differentiated threshold value calculation.

Aus US-A-4,590,606 und US-A-5,038,381 sind weitere Verfahren zur Bildverarbeitung, wie z. B. Vordergrundfilter durch Laufzeitverhalten, bekannt.Further processes are known from US-A-4,590,606 and US-A-5,038,381 Image processing, such as B. foreground filter Runtime behavior, known.

EP-A-0.505.729 beschreibt ein System zur Binarisierung von Bildern, das ein Lesen von Dokumenten mit einer normalen Printqualität ermöglicht.EP-A-0.505.729 describes a system for binarizing Images that are reading documents with a normal Print quality enables.

Allen Verfahren mit einer Ausfilterung von Informationen aus einer elektronischen Vorlage ist jedoch gemein, daß durch das Filtern auch eventuell solche Informationen, die für eine Bilderkennung notwendig sind, verlorengehen können.All procedures with a filtering out of information However, an electronic template has in common that Can also filter information that is relevant for a Image recognition are necessary, can be lost.

Zusammenfassung der ErfindungSummary of the invention

Es ist Aufgabe der Erfindung, den Prozeß der Vorbereitung von Bildern für eine Bilderkennung zu verbessern, um so eine erhöhte Erkennbarkeit der gewonnenen Bilder zu gewährleisten. Die Aufgabe wird durch die unabhängigen Ansprüche gelöst.It is an object of the invention, the process of preparing Enhance images for image recognition so as to increase To ensure recognizability of the images obtained. The The task is solved by the independent claims.

Erfindungsgemäß erfolgt eine Ermittlung eines Schwellwertes für die Erzeugung eines elektronischen Bildes aus einer Vorlage unter Berücksichtigung der jeweiligen Bildeigenschaften der Vorlage. Die Bildeigenschaften werden dabei insbesondere durch den Bildinhalt, also die eigentlichen Bilddaten, und Bildstörungen, also ungewollte Veränderungen des Bildinhaltes, geprägt. Bei den Bildstörungen ist zu unterscheiden zwischen solchen, die durch den Vorgang der elektronischen Umsetzung der Vorlage in ein elektronisches Bild hervorgerufen werden und solchen, die bereits in der Vorlage vorhanden sind.According to the invention, a threshold value for is determined creating an electronic image from a template taking into account the respective image properties of the Template. The image properties are particularly characterized by the image content, ie the actual image data, and Image disturbances, i.e. unwanted changes in the image content, embossed. A distinction must be made between image disturbances those that are caused by the process of electronic implementation of the  Template can be evoked in an electronic image and those that already exist in the template.

In einem ersten Schritt erfolgt eine erste Erfassung der Bildeigenschaften der Vorlage, z. B. durch ein Einscannen der Vorlage mit einem vorgewählten Schwellwert oder durch eine beliebige andere Erfassungsweise. Vorzugsweise wird für die Erfassung bereits mindestens ein Schwellwert z. B. aufgrund von Erfahrungen oder als Mittelwert vorgewählt. Insbesondere eignet sich auch die Erzeugung eines Schwarz-/Weißbildes oder eines Grauwertbildes aus der Vorlage zur Erfassung der Bildeigenschaften.In a first step, the Image properties of the template, e.g. B. by scanning the Template with a pre-selected threshold or through a any other way of recording. Preferably for the Detection of at least one threshold z. B. due to Experiences or selected as mean. Particularly suitable the creation of a black / white image or one Grayscale image from the template for capturing the Image properties.

In einem zweiten Schritt erfolgt eine Analyse der Bildeigenschaften der Vorlage. Zu diesen vorlagenbedingten Bildeigenschaften gehören beispielsweise die eigentlichen Bilddaten, der Bildinhalt aber auch Bildstörungen. Die Analyse der Bildeigenschaften der Vorlage kann entweder selektiv für einzelne Bereiche der Vorlage oder integral für die gesamte Vorlage durchgeführt werden.In a second step, the Image properties of the template. About these template-related Image properties include, for example, the actual ones Image data, the image content but also image disturbances. The analysis the image properties of the template can either be selective for individual areas of the template or integral for the whole Template.

In einem dritten Schritt wird dann mindestens ein Schwellwert aus dem Ergebnis bzw. den Ergebnissen der Analyse der vorlagenbedingten Bildeigenschaften ermittelt. Entsprechend der durchgeführten Analyse der Bildeigenschaften der Vorlage kann entweder jeweils mindestens ein Schwellwert selektiv für die einzelnen Bereiche der Vorlage oder ein Schwellwert integral für die gesamte Vorlage ermittelt werden.In a third step, at least one threshold is then set from the result or the results of the analysis of the template-related image properties determined. According to the carried out analysis of the image properties of the template can either at least one threshold value selective for each individual areas of the template or a threshold integral for the entire template can be determined.

Wurde in dem ersten Schritt bereits ein Schwellwert vorgegeben, so kann dieser vorgegebene Schwellwert aufgrund der Analyse der Bildeigenschaften der Vorlage an die ermittelten Bildeigenschaften angepaßt werden. Der vorgegebene Schwellwert wird dann entsprechend der Ergebnisse der Analyse der Bildeigenschaften der Vorlage verändert, bzw. auch gleich gelassen falls eine Änderung nicht notwendig ist.If a threshold was already specified in the first step, this predetermined threshold value can be determined on the basis of the analysis of the Image properties of the template to the determined Image properties can be adjusted. The specified threshold is then calculated according to the results of the analysis of the Image properties of the template changed, or the same left if a change is not necessary.

Die Ermittlung des Schwellwertes aus den vorlagenbedingten Bildeigenschaften erfolgt durch eine Analyse der räumlichen bzw. The determination of the threshold value from the template-related Image properties are achieved through an analysis of the spatial or  

örtlichen Verteilung der Bildeigenschaften, die auch als lokale Bildfrequenzen bezeichnet werden. Aus der Verteilungsanalyse läßt sich wiederum auf einen möglichen, zu erwartenden Bildinhalt zurückschließen. Wird beispielsweise bei einem Schwarz-/Weißbild eine Verteilungsdichte der schwarzen Bildpunkte in einem Bereich oberhalb eines vorgebbaren Grenzwertes der Verteilungsdichte ermittelt, so liegt voraussichtlich in diesem Bereich eine wesentliche Bildinformation, wie z. B. eine Schrift, ein Bild oder jeweils Teile davon, vor. Der Schwellwert kann für diesen Bereich nun so verändert werden, daß durch die Schwellwertfilterung weniger Informationen verloren gehen. Wird in einem anderem Bereich in diesem Schwarz-/Weißbild eine Verteilungsdichte der schwarzen Bildpunkte unterhalb des vorgegebenen Grenzwertes ermittelt, so liegt in diesem Bereich voraussichtlich keine wesentliche Bildinformation oder nur eine Bildstörung vor. Der Schwellwert kann für diesen Bereich nun so verändert werden, daß durch die Schwellwertfilterung mehr Informationen eliminiert werden.local distribution of image properties, also called local Frame rates are called. From the distribution analysis can in turn be based on a possible, to be expected Close image content. For example, with a Black / white image a distribution density of the black Pixels in an area above a specifiable Limit value of the distribution density is determined probably an essential one in this area Image information such as B. a font, a picture or each Parts of it, before. The threshold value can now be so for this area be changed that less by the threshold filtering Information is lost. Will be in another area a distribution density of the black Pixels determined below the specified limit, see above there is probably no significant one in this area Image information or just an image disturbance. The threshold can now be changed for this area so that the Threshold filtering more information can be eliminated.

Die Verteilungsanalyse erfolgt vorzugsweise durch eine Ermittlung der örtlichen Variation der Grau- bzw. Farbwerte, z. B. entlang einer Zeile. Bei einem erzeugten Schwarz-/Weißbild der Vorlage lassen sich so beispielsweise die Anzahl der Schwarzwerte entlang einer Zeile - oder eines Zeilenausschnittes - ermitteln. Bei einem erzeugten Grauwertbild der Vorlage kann beispielsweise die Anzahl der Änderungen der Grauwerte entlang einer Zeile oder eines Zeilenausschnittes ermittelt werden.The distribution analysis is preferably carried out by a Determination of the local variation of the gray or color values, e.g. B. along a line. With a black and white image For example, the number of Black levels along a line - or a line section - determine. With a generated gray-scale image of the template can for example the number of changes in the gray values along a line or a line segment.

Die örtliche Variation der Grau- bzw. Farbwerte, also beispielsweise die ermittelte Anzahl oder Dichte der Schwarzwerte oder der Anzahl der Änderungen der Grauwerte, ist vielfach ein Maß für den Informationsgehalt des betrachteten Bereiches in der Vorlage. Die ermittelte örtliche Variation der Grau- bzw. Farbwerte kann nun mit vorgebbaren Werten verglichen werden, die so einen Rückschluß auf den wahrscheinlichen Inhalt des Bereiches zulassen, also beispielsweise, ob der Bereich voraussichtlich ein Bild oder eine Schrift enthält. Wird so ein Bereich der voraussichtlich ein Bild oder eine Schrift beinhaltet erkannt, kann der Schwellwert für diesen Bereich so angepaßt werden, daß die Gefahr eines Informationsverlusts durch die Schwellwertfilterung reduziert wird. Analog dazu kann der Schwellwert in Bereichen, in denen keine wesentliche Bildinformation oder nur eine Bildstörung vermutet wird, so angepaßt werden, daß durch die Schwellwertfilterung mehr Informationen herausgefiltert werden.The local variation of the gray or color values, that is for example the determined number or density of Black values or the number of changes in the gray values often a measure of the information content of the considered Area in the template. The determined local variation of the Gray or color values can now be compared with specifiable values be so a conclusion on the likely content of the area, for example whether the area Presumably contains an image or a font. Will be one Area likely to be a picture or font includes detected, the threshold for this area can be so  be adapted to the risk of loss of information through the threshold filtering is reduced. Similarly, the Threshold in areas where no significant Image information or only an image disturbance is suspected, so be adjusted that by threshold filtering more Information is filtered out.

Ist beispielsweise in einem Schwarz-/Weißbild eine ermittelte Anzahl der Schwarzwerte pro Längen- oder Flächeneinheit, bzw. in einem Graubild die Anzahl der Änderungen der Grauwerte pro Längen- oder Flächeneinheit größer als ein vorgegebener Wert, deutet dies auf eine Schrift oder ein Bild in diesem Bereich hin. Entsprechend deutet eine ermittelte Anzahl der Schwarzwerte bzw. die Anzahl der Änderungen der Grauwerte pro Längen- oder Flächeneinheit kleiner als ein vorgegebener Wert auf eine Bildstörung oder zumindest auf eine unwesentliche Bildinformation in diesem Bereich hin.Is, for example, a determined in a black and white image Number of black values per unit of length or area, or in the number of changes in the gray values per Unit of length or area greater than a predetermined value, this indicates a font or picture in this area there. A determined number of black values points accordingly or the number of changes in the gray values per length or Area unit smaller than a predetermined value on a Image disturbance or at least an insignificant one Image information in this area.

Aus der Verteilungsanalyse lassen sich also insbesondere die für eine Bilderkennung interessante Bereiche, wie eine Schrift oder ein Bild, erkennen. Weiterhin ermöglicht die Verteilungsanalyse eine Hintergrunderkennung bei einem regelmäßigen Hintergrund. Besteht die Vorlage nun aus Bildteilen mit ausschließlicher Vorder- und/oder Hintergrundinformation, lassen sich die einzelnen Bereiche mit unterschiedlichen Schwellwerten bearbeiten. Hintergrundbereiche können so bereinigt werden, während die für die Bilderkennung interessanten Bereiche sicherer, im Sinne der Gefahr von Informationsverlusten, verarbeitet werden.The distribution analysis in particular can be used for areas of interest such as writing or recognize a picture. The distribution analysis also enables background detection for a regular background. If the template now consists of parts of the picture with exclusive Foreground and / or background information, the individual areas with different threshold values to edit. Background areas can be cleaned up while the areas of interest for image recognition safer, in the sense of risk of loss of information, are processed.

Der oder die Schwellwerte können weiterhin an die systembedingten Bildeigenschaften durch eine geeignete Wahl der Bereiche für eine Untersuchung lokaler Bildeigenschaften angepaßt werden. Zu den systembedingten Bildeigenschaften gehören u. a. die durch den Einlesevorgang hervorgerufenen Bildstörungen oder die Vorlagentyp-spezifischen Bildeigenschaften, die von Vorlage zu Vorlage eines Vorlagentyps gleich bleiben. Die vorlagentyp-spezifischen Bildeigenschaften werden insbesondere durch den Bildaufbau und die Bildeinteilung des jeweiligen Vorlagentyps geprägt. Bei einer Vorlage, die in horizontaler Richtung eingelesen wird, werden die Untersuchungsbereiche vorzugsweise horizontal länglich (z. B. zeilenweise) - entsprechend der horizontalen Einleseweise - angenommen. Entsprechend werden bei Vorlagen, bei denen die Informationen überwiegend zeilenweise (oder vertikal) auftreten, die Bereiche ebenfalls zeilenhaft (oder vertikal) ausgeprägt.The threshold value (s) can still be sent to the system-related image properties through a suitable choice of Areas for examining local image properties be adjusted. The system-related image properties belong u. a. those caused by the import process Image disturbances or the original type-specific Image properties, from template to template of a template type stay the same. The image type-specific image properties are particularly due to the image structure and the image division  of the respective template type. For a template that is in is read in the horizontal direction, the Examination areas preferably horizontally elongated (e.g. line by line) - according to the horizontal import method - accepted. Correspondingly, for templates in which the Information occurs predominantly line by line (or vertical), the areas are also line-like (or vertical).

Die Erfindung findet Anwendung bei der (Vor-)verarbeitung von Dokumenten für eine Bilderkennung und/oder für eine Archivierung der Dokumente.The invention finds application in the (pre) processing of Documents for image recognition and / or archiving of the documents.

Weitere, vorteilhafte Ausführungen der Erfindung finden sich in den Unteransprüchen.Further advantageous embodiments of the invention can be found in the subclaims.

Beschreibung der ZeichnungenDescription of the drawings

Zur näheren Erläuterung der Erfindung sind im folgenden Ausführungsbeispiele mit Bezugnahme auf die Zeichnungen beschrieben. Funktionsgleiche Elemente sollen gleiche Bezugszeichen tragen.To explain the invention in more detail, the following are Embodiments with reference to the drawings described. Functionally identical elements should be the same Wear reference numbers.

Fig. 1 zeigt eine Vorlage mit einer Schrift und einer zufälligen Bildstörung, Fig. 1 shows a template with a signature and a random image disturbance,

Fig. 2 zeigt ein elektronisches Grauwertbild der Vorlage, aus Fig. 1, das mit einem einheitlichen, mittleren Schwellwert aus der Vorlage gewonnen wurde, FIG. 2 shows an electronic gray scale image of the template from FIG. 1, which was obtained from the template with a uniform, average threshold value,

Fig. 3 zeigt die Grauwertverteilung in horizontaler Richtung für 3 exemplarisch ausgewählte Zeilenbereiche A, B und C mit einer Länge L in dem Grauwertbild aus Fig. 2, Fig. 3 shows the gray value distribution in the horizontal direction for 3 exemplarily selected row areas A, B and C having a length L in the gray scale image of FIG. 2,

Fig. 4 zeigt ein gemäß der Erfindung aus der Vorlage in Fig. 1 gewonnenes Bild, Fig. 4 shows a product obtained according to the invention from the template in Fig. 1 image,

Fig. 5 erläutern die Erfindung an einem Beispiel eines Scanners, der eine 4-Bit-Wandlung durchführt. Fig. 5 illustrate the invention using an example of a scanner that performs 4-bit conversion.

Detaillierte Beschreibung der ErfindungDetailed description of the invention

Fig. 1 zeigt eine Vorlage 10 mit einer Schrift 20 und einer zufälligen Bildstörung 30. Fig. 2 zeigt ein elektronisches Grauwertbild 40 der Vorlage 10, das mit einem einheitlichen, mittleren Schwellwert SWmittel aus der Vorlage 10 gewonnen wurde. Der mittlere Schwellwert SWmittel kann beispielsweise aus einer Mittelung der Grauwertverteilung der Vorlage oder eines Bereiches davon stammen oder als Erfahrungswert einfach vorgegeben werden. Das Grauwertbild 40 weist ein Bild 20′ der Schrift 20 und ein Bild 30′ der zufälligen Bildstörung 30 auf. Wie aus Fig. 2 zu entnehmen ist, sind durch die Schwellwertfilterung Informationen verloren gegangen, die im ungünstigsten Fall eine Erkennbarkeit der Schrift 20 erschweren können. Fig. 1 shows a template 10 with a magazine 20 and a random image disturbance 30th Fig. 2 shows an electronic gray scale image 40 of the original 10 which has been obtained with a uniform, medium threshold value SW medium from the template 10. The mean threshold value SW medium can, for example, come from averaging the gray value distribution of the original or a region thereof, or can simply be specified as an empirical value. The gray scale image 40 has an image 20 'of the font 20 and an image 30 ' of the random image disturbance 30 . As can be seen from FIG. 2, information has been lost due to the threshold value filtering, which in the worst case can make it difficult to recognize the font 20 .

Fig. 3 zeigt die Grauwertverteilung in horizontaler Richtung für 3 exemplarisch ausgewählte Zeilenbereiche A, B und C mit einer Länge L in dem Grauwertbild 40. Innerhalb des Zeilenbereiches A werden 8 Peaks oberhalb und 1 Peak unterhalb eines vorgegebenen Grauwertes G ermittelt. Innerhalb des Zeilenbereiches B wird kein Peak oberhalb und es werden 2 Peaks unterhalb des Grauwertes G gefunden. Innerhalb des Zeilenbereiches C werden 2 Peaks oberhalb und 1 Peak unterhalb des Grauwertes G ermittelt. FIG. 3 shows the gray value distribution in the horizontal direction for 3 line areas A, B and C with a length L in the gray value image 40 selected as examples. Within the line area A, 8 peaks above and 1 peak below a predetermined gray value G are determined. No peak above is found within line area B and 2 peaks below gray value G are found. Within the line area C, 2 peaks above and 1 peak below the gray value G are determined.

Als Grenzwert für die Erkennung bild-relevanter Bereiche innerhalb der Vorlage 10 sei eine Anzahl von 4 Peaks oberhalb des vorgegebenen Grauwertes G für einen Zeilenbereich der Länge L gegeben. Dementsprechend wird nur der Zeilenbereich A als ein Bild-relevanter Bereich erkannt. Für diesen Zeilenbereich A wird für einen zweiten Einlesevorgang ein Schwellwert SWinformation, der gegenüber dem mittleren Schwellwert SWmittel weiter in Richtung "weiß" verschoben ist, also weniger Informationen herausfiltern wird, eingestellt. Die Zeilenbereiche B und C hingegen werden als nicht-bild-relevante Bereiche eingestuft und es wird für einen zweiten Einlesevorgang ein Schwellwert SWhinergrund, der gegenüber dem mittleren Schwellwert SWmittel weiter in Richtung "schwarz" verschoben ist, also mehr Informationen herausfiltern wird, eingestellt. As a limit for the recognition of image-relevant areas within template 10 , a number of 4 peaks above the given gray value G for a line area of length L is given. Accordingly, only the line area A is recognized as an image-relevant area. For this range of rows A, a threshold value SW information, which compared with the average threshold value SW medium in the direction of "white" is for a second reading process is shifted, is thus filtered out less information set. The line areas B and C, however, are classified as non-image-related areas and there is a threshold value SW Hinergrund for a second reading process, which compared to the average threshold value SW medium in the direction of "black" is shifted, will therefore filter out more information set .

Der oben dargestellte Vorgang zur Erkennung bild-relevanter Bereiche wird entsprechend zeilenweise für das gesamte Bild 40 durchgeführt, die Schwellwerte der einzelnen Bereiche werden an die erkannten Bereiche angepaßt und ein neues Bild 50 mit Hilfe der neu angepaßten Schwellwerte erzeugt. Fig. 4 zeigt das neue Bild 50. Die Schrift 20 der Vorlage 10 wurde als bild-relevanter Bereich erkannt und in dem Bild 50 als Schrift 20′′ abgebildet. Die zufällige Bildstörung 30 aus der Vorlage 10 konnte durch diesen Prozeß vollständig eliminiert werden.The above-described process for recognizing image-relevant areas is carried out correspondingly line by line for the entire image 40 , the threshold values of the individual areas are adapted to the recognized regions and a new image 50 is generated with the aid of the newly adapted threshold values. Fig. 4 shows the new Figure 50. The font 20 of the template 10 was recognized as an image-relevant area and shown in the image 50 as font 20 ''. The random image disturbance 30 from the original 10 could be completely eliminated by this process.

Die Erfindung soll an einem weiteren Beispiel eines Scanners, der eine 4-Bit-Wandlung durchführt, erläutert. Eine 4-Bit- Wandlung bedeutet, daß als Vorlage ein Graubild mit 16 Graustufen vorliegt, das in ein Schwarz-Weiß-Bild gewandelt werden soll. Der Grauwert 15 soll in diesem Beispiel der Graustufe "weiß" entsprechen und der Grauwert 0 der Graustufe "schwarz".The invention is to be explained using a further example of a scanner which carries out a 4-bit conversion. A 4-bit conversion means that a gray image with 16 gray levels is available as a template, which is to be converted into a black and white image. In this example, the gray value 15 should correspond to the gray level "white" and the gray value 0 to the gray level "black".

Fig. 5a zeigt einen Bildausschnitt eines ersten eingescannten Testbildes einer (hier nicht gezeigten) Vorlage. Fig. 5b stellt die Verteilung der Bilddaten (Grauwert-Histogramm) für einen Bereich des Testbildes dar. Aus diesem Histogramm ergibt sich ein mittlerer Grauwert von 11,23. Wird als Schwellwert für die Wandlung der Vorlage in ein Schwarz-Weiß-Bild dieser mittlere Grauwert, oder durch die Abrundung auf gerade Werte (Integer) ein entsprechender Schwellwert von 11, verwendet, werden nicht ausreichend Bildinformationen der Vorlage in dem gezeigten Bildausschnitt in schwarze Bildpunkte umgewandelt werden. Die Schwellwertfilterung bewirkt, daß Werte, die kleiner als der vorgegebene Schwellwert sind, in signifikante, schwarze Bildpunkte umgewandelt werden. Störinformation (Rauschen, Digitalisierungsfehler), aber auch tatsächliche Bildinformationen mit Grauwerten größer als der Schwellwert werden als weiße Bildpunkte dargestellt. Fig. 5a shows a detail of a first image scanned test image of an original (not shown here). Fig. 5b represents the distribution of the image data (gray level histogram) is for a region of the test image. From this histogram results in a mean gray value of 11.23. If this mean gray value is used as the threshold value for the conversion of the original into a black and white image, or a corresponding threshold value of 11 due to the rounding down to even values (integer), insufficient image information of the original in the image section shown is turned into black pixels being transformed. The threshold value filtering has the effect that values which are smaller than the predetermined threshold value are converted into significant black pixels. Interference information (noise, digitization errors), but also actual image information with gray values greater than the threshold value are shown as white pixels.

Aus dem Histoprogramm in Fig. 5b ist nicht ersichtlich, ob es sich bei den Bildpunkten um verwertbare Informationen oder um Rauschen handelt. Daher ist hier eine Schwarz-Weiß-Wandlung immer mit dem Risiko des Auslöschens von Informationen behaftet. It is not apparent from the histoprogram in FIG. 5b whether the pixels are usable information or noise. Therefore, black-and-white conversion always involves the risk of information being erased.

Erfindungsgemäß wird nun eine Verteilungsanalyse durchgeführt, d. h. es wird die "Frequenz" der vorliegenden Bilddaten in horizontaler Richtung untersucht. Die horizontale Bildrichtung bietet sich insbesondere dann an, wenn Schriften in horizontaler Richtung erwartet werden. Fig. 5c zeigt einen Verlauf 100 der Grauwerte für einen Bereich in horizontaler Richtung innerhalb der Schrift "Konto-Nr" in Fig. 5a, wobei diese in der Vorlage rot gedruckt wurde. Der Verlauf 100 der Grauwerte wird mathematisch differenziert und führt zu einem Verlauf 110 der Ableitung. Durch Aufsummieren der vorkommenden Wendepunkte oder Maxima in der Ableitung 110, bezogen auf die Längeneinheit, ergibt sich eine "Frequenz" für diesen Bereich. Die so ermittelte "Frequenz" wird mit einem vorgegebenen Grenzwert verglichen. Dabei wurde der Grenzwert aufgrund vorangegangener Bilduntersuchungen so eingestellt, daß signifikante Textbereiche erkannt werden können.According to the invention, a distribution analysis is now carried out, ie the "frequency" of the available image data is examined in the horizontal direction. The horizontal direction of the image is particularly useful when fonts are expected in the horizontal direction. FIG. 5c shows a course 100 of the gray values for an area in the horizontal direction within the font "account number" in FIG. 5a, this being printed in red in the template. The course 100 of the gray values is mathematically differentiated and leads to a course 110 of the derivation. Adding up the occurring turning points or maxima in the derivation 110 , based on the unit of length, results in a "frequency" for this area. The "frequency" determined in this way is compared with a predetermined limit value. The limit was set based on previous image examinations so that significant text areas can be recognized.

In dem Beispiel in Fig. 5c liegt die ermittelte "Frequenz" oberhalb des vorgegebenen Grenzwertes, so daß ein signifikanter Textbereich angenommen wird. Der Schwellwert für die Schwarz-Weiß-Wandlung wird entsprechend angepaßt und in diesem Beispiel um eine Graustufe (also von 11 auf 12) nach oben festgelegt. Fig. 5d zeigt das Ergebnis der durchgeführten Schwarz-Weiß-Wandlung mit dem angepaßten Schwellwert.In the example in FIG. 5c, the "frequency" determined is above the predetermined limit value, so that a significant text area is assumed. The threshold value for the black-and-white conversion is adjusted accordingly and in this example is increased by one gray level (that is from 11 to 12). Fig. 5d shows the result of performing monochrome conversion with the adjusted threshold value.

Der Einfachheit halber wurde in Fig. 5d die Schwarz-Weiß-Wandlung für den ganzen in Fig. 5a gezeigten Bereich mit dem angepaßten Schwellwert durchgeführt. Entsprechend könnte jedoch auch eine Schwarz-Weiß-Wandlung mit einer Vielzahl von an einzelne Bereiche angepaßten Schwellwerten durchgeführt werden.For the sake of simplicity, the black-and-white conversion was carried out in FIG. 5d for the entire region shown in FIG. 5a with the adjusted threshold value. Correspondingly, however, a black-and-white conversion could also be carried out with a large number of threshold values adapted to individual areas.

Claims (17)

1. Verfahren zur Ermittlung eines Schwellwertes für die Erzeugung eines elektronischen Bildes (50) von einer Vorlage (10), mit:
einem ersten Schritt der Erfassung der Bildeigenschaften der Vorlage (10);
einem zweiten Schritt der Analyse der räumlichen und/oder örtlichen Verteilung der Bildeigenschaften der Vorlage (10); und
einem dritten Schritt des Ermittelns eines Schwellwertes aus der Verteilungsanalyse der Bildeigenschaften der Vorlage (10).
1. A method for determining a threshold value for the generation of an electronic image ( 50 ) from a template ( 10 ), with:
a first step of capturing the image properties of the original ( 10 );
a second step of analyzing the spatial and / or local distribution of the image properties of the template ( 10 ); and
a third step of determining a threshold value from the distribution analysis of the image properties of the template ( 10 ).
2. Verfahren nach Anspruch 1, worin die Verteilungsanalyse der Bildeigenschaften durch eine Ermittlung der räumlichen und/oder örtlichen Variation der Grau- bzw. Farbwerte erfolgt.2. The method of claim 1, wherein the distribution analysis the image properties by determining the spatial and / or local variation of the gray or color values he follows. 3. Verfahren nach Anspruch 2, worin die Verteilungsanalyse der Bildeigenschaften zeilenweise erfolgt.3. The method of claim 2, wherein the distribution analysis the image properties are done line by line. 4. Verfahren nach Anspruch 2 oder 3, worin die ermittelte örtliche Variation der Grau- bzw. Farbwerte mit einem vorgegebenen Wert verglichen wird.4. The method of claim 2 or 3, wherein the determined local variation of the gray or color values with a predetermined value is compared. 5. Verfahren nach Anspruch 4, worin der vorgegebene Wert so gewählt wird, daß ein Rückschluß auf den wahrscheinlichen Bildinhalt ermöglicht wird, vorzugsweise, ob die Vorlage (10) voraussichtlich ein Bild und/oder eine Schrift enthält.5. The method of claim 4, wherein the predetermined value is selected so that a conclusion on the likely image content is possible, preferably whether the template ( 10 ) is likely to contain an image and / or a font. 6. Verfahren nach einem der vorstehenden Ansprüche, worin der erste Schritt der Erfassung der Bildeigenschaften der Vorlage (10) ein Einlesen der Vorlage (10) mit einem vorgewählten Schwellwert beinhaltet, und der vorgewählte Schwellwert in dem dritten Schritt angepaßt wird.6. The method according to any one of the preceding claims, wherein the first step of detecting the image properties of the template ( 10 ) includes reading the template ( 10 ) with a preselected threshold value, and the preselected threshold value is adapted in the third step. 7. Verfahren nach Anspruch 6, worin der vorgewählte Schwellwert so verändert wird, daß, wenn aufgrund der Verteilungsanalyse der Bildeigenschaften in der Vorlage (10) relevante Informationen vermutet werden, durch die Schwellwertfilterung weniger Informationen verloren gehen, oder wenn in der Vorlage (10) keine relevante Informationen vermutet werden, durch die Schwellwertfilterung mehr Informationen verloren gehen.7. The method according to claim 6, wherein the preselected threshold value is changed such that if relevant information is suspected on the basis of the distribution analysis of the image properties in the template ( 10 ), less information is lost due to the threshold value filtering, or if in the template ( 10 ) No relevant information is suspected, as a result of which threshold value filtering more information is lost. 8. Verfahren nach Anspruch 7, worin eine relevante Informationen dann vermutet wird, wenn eine Verteilungsdichte von zu betrachtenden Bildpunkten einen vorgegebenen Grenzwert der Verteilungsdichte überschreiten.8. The method of claim 7, wherein a relevant Information is suspected if one Distribution density of pixels to be considered one predetermined limit of the distribution density exceed. 9. Verfahren entsprechend einem der vorstehenden Ansprüche, worin die Ermittlung des Schwellwertes entweder selektiv für einzelne Bereiche der Vorlage (10) oder integral für die gesamte Vorlage (10) durchgeführt wird.9. The method according to any one of the preceding claims, wherein the determination of the threshold value is carried out either selectively for individual areas of the template ( 10 ) or integrally for the entire template ( 10 ). 10. Verfahren entsprechend einem der vorstehenden Ansprüche, worin die Verteilungsanalyse der Bildeigenschaften für lokale Bereiche innerhalb der Vorlage durchgeführt wird.10. The method according to any one of the preceding claims, where the distribution analysis of the image properties for local areas within the template is performed. 11. Verfahren nach Anspruch 10, mit einem Schritt der Anpassung der lokalen Bereiche an systembedingte Bildeigenschaften.11. The method according to claim 10, with a step of Adaptation of the local areas to system-related ones Image properties. 12. Verfahren nach Anspruch 11, worin die lokalen Bereiche entsprechend der Einleseweise der Vorlage (10) und/oder einer bestimmten Auftretensform der Informationen in der Vorlage (10) angepaßt werden.12. The method according to claim 11, wherein the local areas are adapted in accordance with the manner in which the template ( 10 ) is imported and / or a specific form of appearance of the information in the template ( 10 ). 13. Verwendung des Verfahrens entsprechend einem der vorstehenden Ansprüche für eine Vorverarbeitung der Vorlage (10) vor einer nachfolgenden Bildverarbeitung. 13. Use of the method according to one of the preceding claims for preprocessing the template ( 10 ) before subsequent image processing. 14. Verwendung des Verfahrens entsprechend einem der vorstehenden Ansprüche für eine Bilderkennung und/oder für eine Archivierung von Dokumenten.14. Use of the method according to one of the above claims for image recognition and / or for an archiving of documents. 15. Verwendung des Verfahrens entsprechend einem der vorstehenden Ansprüche in einem Programm für eine elektronische Datenverarbeitung.15. Use of the method according to one of the preceding claims in a program for a electronic data processing. 16. Verwendung des Verfahrens entsprechend einem der vorstehenden Ansprüche für eine Erkennung von Bereichen, die eine Schrift und/oder ein Bild und/oder einen regelmäßigen Hintergrund aufweisen.16. Use of the method according to one of the above claims for a detection of areas, which a writing and / or a picture and / or one have a regular background. 17. Vorrichtung zur Ermittlung eines Schwellwertes für die Erzeugung eines elektronischen Bildes (50) von einer Vorlage (10), mit:
einem Mittel zur Erfassung der Bildeigenschaften der Vorlage (10);
einem Mittel zur Analyse der räumlichen und/oder örtlichen Verteilung der Bildeigenschaften der Vorlage (10); und
einem Mittel zur Ermittlung des Schwellwertes aus der Verteilungsanalyse der Bildeigenschaften der Vorlage (10), wobei das Mittel zur Ermittlung des Schwellwertes ein Mittel zur Auswertung und Bewertung der Analyse der räumlichen Verteilung der Bildeigenschaften aufweist.
17. Device for determining a threshold value for generating an electronic image ( 50 ) from a template ( 10 ), with:
means for detecting the image properties of the original ( 10 );
a means for analyzing the spatial and / or spatial distribution of the image properties of the original ( 10 ); and
a means for determining the threshold value from the distribution analysis of the image properties of the template ( 10 ), the means for determining the threshold value having a means for evaluating and evaluating the analysis of the spatial distribution of the image properties.
DE19536170A 1995-09-29 1995-09-29 Image thresholding for optical character recognition Ceased DE19536170A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
DE19536170A DE19536170A1 (en) 1995-09-29 1995-09-29 Image thresholding for optical character recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19536170A DE19536170A1 (en) 1995-09-29 1995-09-29 Image thresholding for optical character recognition

Publications (1)

Publication Number Publication Date
DE19536170A1 true DE19536170A1 (en) 1997-04-03

Family

ID=7773481

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19536170A Ceased DE19536170A1 (en) 1995-09-29 1995-09-29 Image thresholding for optical character recognition

Country Status (1)

Country Link
DE (1) DE19536170A1 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10054185A1 (en) * 2000-11-02 2002-05-29 Infineon Technologies Ag Process for optimizing an electronically generated image
EP1330111A2 (en) * 2002-01-16 2003-07-23 Eastman Kodak Company Automatic image quality evaluation and correction technique
DE10010621B4 (en) * 1999-03-12 2006-08-24 International Business Machines Corp. Quickly locate address blocks in grayscale images
US7499569B2 (en) 2004-02-26 2009-03-03 Mitsubishi Fuso Truck And Bus Corporation Hand pattern switching apparatus
US8194941B2 (en) 2007-03-12 2012-06-05 Nec Corporation Character noise eliminating apparatus, character noise eliminating method, and character noise eliminating program
CN106529518B (en) * 2016-09-08 2018-12-14 广东德诚科教有限公司 A kind of method and device of answering card identification
DE112006003272B4 (en) 2005-11-30 2022-08-18 Adobe Inc. Method and device for removing noise from a digital image

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4590606A (en) * 1982-12-13 1986-05-20 International Business Machines Corporation Multi-function image processing system
DE2757456C2 (en) * 1976-12-22 1988-04-14 Recognition Equipment Inc., Dallas, Tex., Us
DE3433493C2 (en) * 1983-09-12 1988-07-21 Ricoh Co., Ltd., Tokio/Tokyo, Jp
US4878248A (en) * 1988-04-18 1989-10-31 Industrial Technology Research Institute Method and apparatus for automatically recognizing license plate characters
US5038381A (en) * 1988-07-11 1991-08-06 New Dest Corporation Image/text filtering system and method
EP0505729A2 (en) * 1991-03-29 1992-09-30 EASTMAN KODAK COMPANY (a New Jersey corporation) Image binarization system
DE4411248C1 (en) * 1994-03-31 1995-10-26 Licentia Gmbh Method and device for binarizing pixel data
DE4445386C1 (en) * 1994-12-20 1996-05-02 Ibm Separation of foreground and background information on document

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2757456C2 (en) * 1976-12-22 1988-04-14 Recognition Equipment Inc., Dallas, Tex., Us
US4590606A (en) * 1982-12-13 1986-05-20 International Business Machines Corporation Multi-function image processing system
DE3433493C2 (en) * 1983-09-12 1988-07-21 Ricoh Co., Ltd., Tokio/Tokyo, Jp
US4878248A (en) * 1988-04-18 1989-10-31 Industrial Technology Research Institute Method and apparatus for automatically recognizing license plate characters
US5038381A (en) * 1988-07-11 1991-08-06 New Dest Corporation Image/text filtering system and method
EP0505729A2 (en) * 1991-03-29 1992-09-30 EASTMAN KODAK COMPANY (a New Jersey corporation) Image binarization system
DE4411248C1 (en) * 1994-03-31 1995-10-26 Licentia Gmbh Method and device for binarizing pixel data
DE4445386C1 (en) * 1994-12-20 1996-05-02 Ibm Separation of foreground and background information on document

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
OHYA, SHIO, AKAMATSU: "Recognition characters in scane images" IEEE Transactions on pattern analysis and machine intelligence, Vol. PAMI-16, N. 2, 1994, S. 214-220 *
SAHOO, et al: "A Survey of Thresholding Techni- ques" Computer Vision, Graphics and Image Pro- cessing 41, 1988, S. 233-260 *
WHITE/ROHRER: "Image Thresholding for Optical Character Recognition and other Application Reguiring Character Image Extraction" IBM J.Res. Develop., Vol. 27, Nr. 4, July 1983, pp. 400-411 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10010621B4 (en) * 1999-03-12 2006-08-24 International Business Machines Corp. Quickly locate address blocks in grayscale images
DE10054185A1 (en) * 2000-11-02 2002-05-29 Infineon Technologies Ag Process for optimizing an electronically generated image
EP1330111A2 (en) * 2002-01-16 2003-07-23 Eastman Kodak Company Automatic image quality evaluation and correction technique
EP1330111A3 (en) * 2002-01-16 2004-12-08 Eastman Kodak Company Automatic image quality evaluation and correction technique
US6970606B2 (en) 2002-01-16 2005-11-29 Eastman Kodak Company Automatic image quality evaluation and correction technique for digitized and thresholded document images
US7499569B2 (en) 2004-02-26 2009-03-03 Mitsubishi Fuso Truck And Bus Corporation Hand pattern switching apparatus
DE112006003272B4 (en) 2005-11-30 2022-08-18 Adobe Inc. Method and device for removing noise from a digital image
US8194941B2 (en) 2007-03-12 2012-06-05 Nec Corporation Character noise eliminating apparatus, character noise eliminating method, and character noise eliminating program
CN106529518B (en) * 2016-09-08 2018-12-14 广东德诚科教有限公司 A kind of method and device of answering card identification

Similar Documents

Publication Publication Date Title
DE4445386C1 (en) Separation of foreground and background information on document
DE60308739T2 (en) Automatic image quality evaluation method and correction technique
DE69533054T2 (en) Multi-windowing technique for thresholding an image using local image properties
DE69728127T2 (en) Apparatus and method for extracting an object in an image
DE69925354T2 (en) Image processing system to reduce vertical patterns on scanned images
DE3545951C2 (en)
DE69828909T2 (en) NEW PERCEPTIVE LOCAL GRADIENT-BASED GRATING
DE19956158A1 (en) Image binarisation method for scanned greytone images e.g. newspaper article, uses 2 different conversion methods for providing 2 binary images from scanned greytone image, combined to provide output binary image
DE3633743C2 (en)
DE4103229C2 (en)
DE60132315T2 (en) IMPROVED PROCESS FOR IMAGE BINARIZATION
DE69926205T2 (en) ARTIFICIAL REMOVAL TECHNOLOGY FOR SLOW CORRECTED IMAGES
DE60020038T2 (en) Method for processing a numerical image
EP0925682B1 (en) Process for detecting edges in an image signal
DE69728724T2 (en) Image area recognition method and image processing apparatus
DE112010005721B4 (en) Image processing device
DE102007013971A1 (en) Method and device for determining a cell contour of a cell
DE102008013789A1 (en) Apparatus, method and program for eliminating character disturbances
DE112019005143T5 (en) SYSTEM FOR CO-REGISTRATION OF MEDICAL IMAGES USING A CLASSIFICATOR
EP0402868A2 (en) Method for recognizing previously located character represented as digital grey-value images, in particular of character stamped into metal surfaces
DE10303724B4 (en) Dynamic two-level thresholding of digital images
DE60024535T2 (en) Method for character separation
DE19536170A1 (en) Image thresholding for optical character recognition
DE69728469T2 (en) Apparatus and method for determining the character line using simplified projection information; Character recognition device and method
EP3123393B1 (en) Method for the optical detection of symbols

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8128 New person/name/address of the agent

Representative=s name: RACH, W., DR., PAT.-ASS., 70569 STUTTGART

8131 Rejection