DE19536170A1 - Image thresholding for optical character recognition - Google Patents
Image thresholding for optical character recognitionInfo
- Publication number
- DE19536170A1 DE19536170A1 DE19536170A DE19536170A DE19536170A1 DE 19536170 A1 DE19536170 A1 DE 19536170A1 DE 19536170 A DE19536170 A DE 19536170A DE 19536170 A DE19536170 A DE 19536170A DE 19536170 A1 DE19536170 A1 DE 19536170A1
- Authority
- DE
- Germany
- Prior art keywords
- image
- template
- threshold value
- image properties
- distribution
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/16—Image preprocessing
- G06V30/162—Quantising the image signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
Description
Die Erfindung betrifft die Ermittlung von Schwellwerten bei der Digitalisierung von Bildern.The invention relates to the determination of threshold values in the Digitization of images.
Um eine Bild- oder Zeichenerkennung (Optical Character Recognition) in einem elektronisch abgetasteten und digitalisierten Dokument durchführen zu können, müssen häufig in einem ersten Vorverarbeitungsschritt (image preprocessing), die Informationen des Vordergrundes von den Informationen des Hintergrundes getrennt werden. Dabei stellen die Informationen des Vordergrundes oftmals die eigentlichen, für die Zeichenerkennung zu betrachtenden (wichtigen) Bilddaten dar, während die Informationen des Hintergrundes vielfach störend wirken und zu Fehlinterpretationen der Vordergrundinformationen führen können. Auch tragen die Daten des Hintergrund des Bildes häufig zu einer Herabsetzung der Erkennungsleistung der Vordergrundinformation bei einer durchzuführenden Zeichenerkennung bei. Die Informationen des Hintergrundes sollten daher möglichst vor der Bild- oder Zeichenerkennung entfernt werden.For image or character recognition (Optical Character Recognition) in an electronically scanned and To be able to carry out digitized documents often has to a first preprocessing step, the Information of the foreground from the information of the Background. In doing so, provide the information of the foreground often the actual ones for which Character recognition to be considered (important) image data, while the background information is often distracting act and misinterpret the foreground information being able to lead. Also carry the data of the background of the picture often reduce the recognition performance of the Foreground information for a to be carried out Character recognition at. The information of the background Therefore, if possible, before image or character recognition be removed.
Die Hintergrunddaten in einem Bild setzen sich zumeist aus Störungen bei der Digitalisierung (wie Rauschen) und optisch nicht herausfilterbare Bestandteile des digitalisierten Dokumentes (z. B. Verschmutzungen, Schriftteile, Stempel, usw.) zusammen. Um eine optimale Erkennungsrate in einer anschließenden Bildverarbeitung erreichbar zu machen, sollten die Bilddaten nach einer Bildaufbereitung idealerweise nur noch die Daten enthalten, die später durch die Zeichenerkennung verarbeitet werden sollen. Je besser die Bildaufbereitung vor der Erkennung ist, desto günstiger sind auch die Erkennungsergebnisse zu erwarten. The background data in an image is usually exposed Interference with digitization (such as noise) and optical not filterable components of the digitized Document (e.g. dirt, writing, stamps, etc.) together. To get an optimal detection rate in one subsequent image processing should be accessible ideally, the image data after image processing only which contain data later through character recognition should be processed. The better the image preparation before the detection, the cheaper they are Detection results expected.
Viele Bildverarbeitungseinheiten erwarten als Eingangsinformation ein in den Graustufen reduziertes Bild, z. B. ein binarisiertes Schwarz/Weiß Bild. Zur Erzeugung eines elektronisch abgetasteten Bildes von einer Vorlage werden vielfach Lesegeräte (Scanner) herangezogen, die mit einer vorgegebenen Abtastfrequenz (z. B. 200 bis 300 Bildpunkte pro Quadratzoll) Bilder mit einer Vielzahl von Graustufen (z. B. 16 oder 256 Graustufen) liefern.Many image processing units expect as Input information an image reduced in grayscale, e.g. B. a binarized black and white image. To generate a electronically scanned image from a template often readers (scanners) used with a predetermined sampling frequency (e.g. 200 to 300 pixels per Square inches) Images with a variety of grayscale (e.g. 16 or 256 shades of gray).
Bedingt durch eine Reihe von Fehlermöglichkeiten beim elektronischen Einlesen einer Vorlage, wie beispielsweise Scannertoleranzen oder einen mangelhaften Abgleich einzelner Lese-Elemente eines Scanners, können bereits hier eine Reihe von Einflußgrößen auftreten, die eine Bilderkennung nachteilig beeinträchtigen können. Bei dem Vorgang der elektronischen Umsetzung der Vorlage in ein elektronisches Bild werden Bildstörungen insbesondere durch unzureichende Justierungen der Einlesevorrichtung hervorgerufenen. Wird beispielsweise eine Vorlage in horizontaler Richtung eingelesenen, so kann das elektronische Grauwert-Bild der Vorlage horizontale Streifen aufweisen, wenn die Lesezellen der Einlesevorrichtung in vertikaler Richtung angeordnet sind und diese unterschiedlich justiert wurden. Die horizontalen Streifen werden durch die unterschiedlichen Empfindlichkeiten bzw. Justagen der einzelnen Lesezellen bedingt.Due to a number of possible errors in the electronic reading of a template, such as Scanner tolerances or poor matching of individual Reading elements of a scanner can already be a number of Influencing factors occur that adversely affect image recognition can affect. In the process of electronic Implementation of the template in an electronic image Image disturbances, in particular due to insufficient adjustments of the Reading device evoked. For example, if Original in the horizontal direction, so it can electronic grayscale image of template horizontal stripes if the reading cells of the reading device in are arranged vertically and these differ were adjusted. The horizontal stripes are represented by the different sensitivities or adjustments of the individual Read cells conditional.
Auch Art und Qualität der Vorlage selbst können die Bilderkennung entscheidend prägen. So gehen bei einer Wandlung eines Farbbildes in ein Graubild eventuell vorhandene Farbkontraste verloren. Bei handschriftlichen, aber auch bei maschinellen Eintragungen auf einer Vorlage hängt die Les- und Erkennbarkeit auch insbesondere von deren Kontrastierung, bedingt beispielsweise durch mehr oder minder starkes Andrücken beim Schreiben, ab.The type and quality of the template itself can also Shape image recognition decisively. So go for a change of a color image in a gray image possibly existing Color contrasts lost. With handwritten, but also with machine entries on a template depends on the reading and Recognizability especially of their contrasting, for example due to more or less strong pressure when writing, from.
Für eine Reihe von Anwendungen besteht die Anforderung, zusätzlich zu der Erzeugung eines Bildes für eine Zeichenerkennung - das sogenannte Netto-Bild - ein Bild für eine Archivierung - das sogenannte Brutto-Bild - zu erzeugen. Es müssen also zwei elektronische Bilder erzeugt werden, was aus Zeitgründen nach Möglichkeit ohne Durchsatzverlust durchgeführt werden sollte. Von den momentan verfügbaren Anwendungen werden hierfür Schwarz/Weiß Bilder, sowohl für die Erkennungseinheit als auch für Archivierungszwecke, verwendet, da Graustufenbilder rechenintensiv komprimiert und dekomprimiert werden müssen und dennoch einen höheren Speicherbedarf als Schwarz/Weiß Bilder haben.For a number of applications, there is a requirement in addition to creating an image for one Character recognition - the so-called net image - one image for one Archiving - the so-called gross image - to generate. It So two electronic images have to be created, what from Time constraints performed without loss of throughput if possible should be. Of the applications currently available for this black and white pictures, both for the recognition unit as well as for archiving purposes, because grayscale images have to be computationally compressed and decompressed and still requires more memory than black and white images to have.
Durch eine elektronische Abtastung einer Vorlage erhält man ein elektronisches Bild der Vorlage, worin jedem Bildpunkt (Pixel) ein Bildwert, beispielsweise ein Grauwert, ein Schwarz- oder Weißwert oder ein Farbwert, zugeordnet ist. Durch die Verwendung von Filtern lassen sich diese Zuordnungen beeinflussen. Bei Anwendung eines Schwellwert-Filters lassen sich beispielsweise die Bildwerte ober- bzw. unterhalb eines vorgegebenen Schwellwertes aus dem elektronischen Bild herausfiltern. So lassen sich z. B. die für eine Bildverarbeitung nicht gewünschten Hintergrundinformationen oder Störeffekte eliminieren.By electronically scanning a template, one obtains a electronic image of the template, in which each pixel an image value, for example a gray value, a black or White value or a color value, is assigned. By using it these assignments can be influenced by filters. At For example, a threshold filter can be applied the image values above or below a given Filter out threshold values from the electronic image. So can z. B. those not desired for image processing Eliminate background information or interference.
Die herausgefilterten Bildwerte stehen jedoch danach weder für ein Archivbild noch für eine Bilderkennung zur Verfügung. Eventuell unbeabsichtigt ausgefilterte Vordergrundinformationen können so das Ergebnis einer anschließenden Bilderkennung verfälschen. Je nach Wert des Schwellwertes gehen mehr oder minder viele Informationen verloren. Der Wahl des Schwellwertes kommt so eine eminente Bedeutung für die Qualität der Bilderkennung zu.However, the filtered out image values do not stand for an archive image is still available for image recognition. Possibly unintentionally filtered out foreground information can be the result of a subsequent image recognition distort. Depending on the value of the threshold, more or go less information lost. The choice of the threshold such an eminent importance for the quality of the Image recognition too.
Zur Erzeugung von Binärbildern aus Graustufenbildern werden vielfach statische oder dynamische Konvertierungsalgorithmen verwendet. Aus dem Buch von Peter Haberäcker, "Digitale Bildverarbeitung", Carl Hanser Verlag München Wien, ISBN 3-446- 14442-0, 1985, sind eine Reihe von Verfahren zur Bildverarbeitung bekannt, die auch für eine Bildvorverarbeitung angewandt werden können. Es werden dort insbesondere als Operationen im Ortsbereich (Kap. 8) Verfahren zur Glättung der Grauwerte (Kap. 8.1) und die Anwendung von Differenzenoperatoren (Kap. 8.2), sowie Verfahren zur dynamischen Schwellwertbestimmung (Kap. 12.3) vorgestellt.To generate binary images from grayscale images often static or dynamic conversion algorithms used. From the book by Peter Haberäcker, "Digitale Image processing ", Carl Hanser Verlag Munich Vienna, ISBN 3-446- 14442-0, 1985, are a number of methods for Image processing known, also for image preprocessing can be applied. There are especially as Operations in the local area (Chapter 8) Methods for smoothing the Gray values (chap.8.1) and the use of difference operators (Chap. 8.2), as well as procedures for dynamic Threshold determination (Section 12.3) presented.
Eine Übersicht über die bekanntesten Verfahren zur Ermittlung eines Schwellwertes ist in P.K.Sahoo, S.Soltani and A.K.C.Wong "A Survey of Thresholding Techniques", Computer Vision, Graphics and Image Processing 41, 233-260, 1988 zu finden. Es wird dort zwischen Histogramm-Transformations-Methoden, die zur Ermittlung des Schwellwertes die Form eines Histogramms einer Grauwertverteilung verändern und Algorithmen zur Schwellwertberechnung unterschieden.An overview of the best-known methods for determining a threshold is in P.K.Sahoo, S.Soltani and A.K.C.Wong "A Survey of Thresholding Techniques", Computer Vision, Graphics and Image Processing 41, 233-260, 1988. It will be there between histogram transformation methods used to determine of the threshold value the shape of a histogram Change gray value distribution and algorithms for Differentiated threshold value calculation.
Aus US-A-4,590,606 und US-A-5,038,381 sind weitere Verfahren zur Bildverarbeitung, wie z. B. Vordergrundfilter durch Laufzeitverhalten, bekannt.Further processes are known from US-A-4,590,606 and US-A-5,038,381 Image processing, such as B. foreground filter Runtime behavior, known.
EP-A-0.505.729 beschreibt ein System zur Binarisierung von Bildern, das ein Lesen von Dokumenten mit einer normalen Printqualität ermöglicht.EP-A-0.505.729 describes a system for binarizing Images that are reading documents with a normal Print quality enables.
Allen Verfahren mit einer Ausfilterung von Informationen aus einer elektronischen Vorlage ist jedoch gemein, daß durch das Filtern auch eventuell solche Informationen, die für eine Bilderkennung notwendig sind, verlorengehen können.All procedures with a filtering out of information However, an electronic template has in common that Can also filter information that is relevant for a Image recognition are necessary, can be lost.
Es ist Aufgabe der Erfindung, den Prozeß der Vorbereitung von Bildern für eine Bilderkennung zu verbessern, um so eine erhöhte Erkennbarkeit der gewonnenen Bilder zu gewährleisten. Die Aufgabe wird durch die unabhängigen Ansprüche gelöst.It is an object of the invention, the process of preparing Enhance images for image recognition so as to increase To ensure recognizability of the images obtained. The The task is solved by the independent claims.
Erfindungsgemäß erfolgt eine Ermittlung eines Schwellwertes für die Erzeugung eines elektronischen Bildes aus einer Vorlage unter Berücksichtigung der jeweiligen Bildeigenschaften der Vorlage. Die Bildeigenschaften werden dabei insbesondere durch den Bildinhalt, also die eigentlichen Bilddaten, und Bildstörungen, also ungewollte Veränderungen des Bildinhaltes, geprägt. Bei den Bildstörungen ist zu unterscheiden zwischen solchen, die durch den Vorgang der elektronischen Umsetzung der Vorlage in ein elektronisches Bild hervorgerufen werden und solchen, die bereits in der Vorlage vorhanden sind.According to the invention, a threshold value for is determined creating an electronic image from a template taking into account the respective image properties of the Template. The image properties are particularly characterized by the image content, ie the actual image data, and Image disturbances, i.e. unwanted changes in the image content, embossed. A distinction must be made between image disturbances those that are caused by the process of electronic implementation of the Template can be evoked in an electronic image and those that already exist in the template.
In einem ersten Schritt erfolgt eine erste Erfassung der Bildeigenschaften der Vorlage, z. B. durch ein Einscannen der Vorlage mit einem vorgewählten Schwellwert oder durch eine beliebige andere Erfassungsweise. Vorzugsweise wird für die Erfassung bereits mindestens ein Schwellwert z. B. aufgrund von Erfahrungen oder als Mittelwert vorgewählt. Insbesondere eignet sich auch die Erzeugung eines Schwarz-/Weißbildes oder eines Grauwertbildes aus der Vorlage zur Erfassung der Bildeigenschaften.In a first step, the Image properties of the template, e.g. B. by scanning the Template with a pre-selected threshold or through a any other way of recording. Preferably for the Detection of at least one threshold z. B. due to Experiences or selected as mean. Particularly suitable the creation of a black / white image or one Grayscale image from the template for capturing the Image properties.
In einem zweiten Schritt erfolgt eine Analyse der Bildeigenschaften der Vorlage. Zu diesen vorlagenbedingten Bildeigenschaften gehören beispielsweise die eigentlichen Bilddaten, der Bildinhalt aber auch Bildstörungen. Die Analyse der Bildeigenschaften der Vorlage kann entweder selektiv für einzelne Bereiche der Vorlage oder integral für die gesamte Vorlage durchgeführt werden.In a second step, the Image properties of the template. About these template-related Image properties include, for example, the actual ones Image data, the image content but also image disturbances. The analysis the image properties of the template can either be selective for individual areas of the template or integral for the whole Template.
In einem dritten Schritt wird dann mindestens ein Schwellwert aus dem Ergebnis bzw. den Ergebnissen der Analyse der vorlagenbedingten Bildeigenschaften ermittelt. Entsprechend der durchgeführten Analyse der Bildeigenschaften der Vorlage kann entweder jeweils mindestens ein Schwellwert selektiv für die einzelnen Bereiche der Vorlage oder ein Schwellwert integral für die gesamte Vorlage ermittelt werden.In a third step, at least one threshold is then set from the result or the results of the analysis of the template-related image properties determined. According to the carried out analysis of the image properties of the template can either at least one threshold value selective for each individual areas of the template or a threshold integral for the entire template can be determined.
Wurde in dem ersten Schritt bereits ein Schwellwert vorgegeben, so kann dieser vorgegebene Schwellwert aufgrund der Analyse der Bildeigenschaften der Vorlage an die ermittelten Bildeigenschaften angepaßt werden. Der vorgegebene Schwellwert wird dann entsprechend der Ergebnisse der Analyse der Bildeigenschaften der Vorlage verändert, bzw. auch gleich gelassen falls eine Änderung nicht notwendig ist.If a threshold was already specified in the first step, this predetermined threshold value can be determined on the basis of the analysis of the Image properties of the template to the determined Image properties can be adjusted. The specified threshold is then calculated according to the results of the analysis of the Image properties of the template changed, or the same left if a change is not necessary.
Die Ermittlung des Schwellwertes aus den vorlagenbedingten Bildeigenschaften erfolgt durch eine Analyse der räumlichen bzw. The determination of the threshold value from the template-related Image properties are achieved through an analysis of the spatial or
örtlichen Verteilung der Bildeigenschaften, die auch als lokale Bildfrequenzen bezeichnet werden. Aus der Verteilungsanalyse läßt sich wiederum auf einen möglichen, zu erwartenden Bildinhalt zurückschließen. Wird beispielsweise bei einem Schwarz-/Weißbild eine Verteilungsdichte der schwarzen Bildpunkte in einem Bereich oberhalb eines vorgebbaren Grenzwertes der Verteilungsdichte ermittelt, so liegt voraussichtlich in diesem Bereich eine wesentliche Bildinformation, wie z. B. eine Schrift, ein Bild oder jeweils Teile davon, vor. Der Schwellwert kann für diesen Bereich nun so verändert werden, daß durch die Schwellwertfilterung weniger Informationen verloren gehen. Wird in einem anderem Bereich in diesem Schwarz-/Weißbild eine Verteilungsdichte der schwarzen Bildpunkte unterhalb des vorgegebenen Grenzwertes ermittelt, so liegt in diesem Bereich voraussichtlich keine wesentliche Bildinformation oder nur eine Bildstörung vor. Der Schwellwert kann für diesen Bereich nun so verändert werden, daß durch die Schwellwertfilterung mehr Informationen eliminiert werden.local distribution of image properties, also called local Frame rates are called. From the distribution analysis can in turn be based on a possible, to be expected Close image content. For example, with a Black / white image a distribution density of the black Pixels in an area above a specifiable Limit value of the distribution density is determined probably an essential one in this area Image information such as B. a font, a picture or each Parts of it, before. The threshold value can now be so for this area be changed that less by the threshold filtering Information is lost. Will be in another area a distribution density of the black Pixels determined below the specified limit, see above there is probably no significant one in this area Image information or just an image disturbance. The threshold can now be changed for this area so that the Threshold filtering more information can be eliminated.
Die Verteilungsanalyse erfolgt vorzugsweise durch eine Ermittlung der örtlichen Variation der Grau- bzw. Farbwerte, z. B. entlang einer Zeile. Bei einem erzeugten Schwarz-/Weißbild der Vorlage lassen sich so beispielsweise die Anzahl der Schwarzwerte entlang einer Zeile - oder eines Zeilenausschnittes - ermitteln. Bei einem erzeugten Grauwertbild der Vorlage kann beispielsweise die Anzahl der Änderungen der Grauwerte entlang einer Zeile oder eines Zeilenausschnittes ermittelt werden.The distribution analysis is preferably carried out by a Determination of the local variation of the gray or color values, e.g. B. along a line. With a black and white image For example, the number of Black levels along a line - or a line section - determine. With a generated gray-scale image of the template can for example the number of changes in the gray values along a line or a line segment.
Die örtliche Variation der Grau- bzw. Farbwerte, also beispielsweise die ermittelte Anzahl oder Dichte der Schwarzwerte oder der Anzahl der Änderungen der Grauwerte, ist vielfach ein Maß für den Informationsgehalt des betrachteten Bereiches in der Vorlage. Die ermittelte örtliche Variation der Grau- bzw. Farbwerte kann nun mit vorgebbaren Werten verglichen werden, die so einen Rückschluß auf den wahrscheinlichen Inhalt des Bereiches zulassen, also beispielsweise, ob der Bereich voraussichtlich ein Bild oder eine Schrift enthält. Wird so ein Bereich der voraussichtlich ein Bild oder eine Schrift beinhaltet erkannt, kann der Schwellwert für diesen Bereich so angepaßt werden, daß die Gefahr eines Informationsverlusts durch die Schwellwertfilterung reduziert wird. Analog dazu kann der Schwellwert in Bereichen, in denen keine wesentliche Bildinformation oder nur eine Bildstörung vermutet wird, so angepaßt werden, daß durch die Schwellwertfilterung mehr Informationen herausgefiltert werden.The local variation of the gray or color values, that is for example the determined number or density of Black values or the number of changes in the gray values often a measure of the information content of the considered Area in the template. The determined local variation of the Gray or color values can now be compared with specifiable values be so a conclusion on the likely content of the area, for example whether the area Presumably contains an image or a font. Will be one Area likely to be a picture or font includes detected, the threshold for this area can be so be adapted to the risk of loss of information through the threshold filtering is reduced. Similarly, the Threshold in areas where no significant Image information or only an image disturbance is suspected, so be adjusted that by threshold filtering more Information is filtered out.
Ist beispielsweise in einem Schwarz-/Weißbild eine ermittelte Anzahl der Schwarzwerte pro Längen- oder Flächeneinheit, bzw. in einem Graubild die Anzahl der Änderungen der Grauwerte pro Längen- oder Flächeneinheit größer als ein vorgegebener Wert, deutet dies auf eine Schrift oder ein Bild in diesem Bereich hin. Entsprechend deutet eine ermittelte Anzahl der Schwarzwerte bzw. die Anzahl der Änderungen der Grauwerte pro Längen- oder Flächeneinheit kleiner als ein vorgegebener Wert auf eine Bildstörung oder zumindest auf eine unwesentliche Bildinformation in diesem Bereich hin.Is, for example, a determined in a black and white image Number of black values per unit of length or area, or in the number of changes in the gray values per Unit of length or area greater than a predetermined value, this indicates a font or picture in this area there. A determined number of black values points accordingly or the number of changes in the gray values per length or Area unit smaller than a predetermined value on a Image disturbance or at least an insignificant one Image information in this area.
Aus der Verteilungsanalyse lassen sich also insbesondere die für eine Bilderkennung interessante Bereiche, wie eine Schrift oder ein Bild, erkennen. Weiterhin ermöglicht die Verteilungsanalyse eine Hintergrunderkennung bei einem regelmäßigen Hintergrund. Besteht die Vorlage nun aus Bildteilen mit ausschließlicher Vorder- und/oder Hintergrundinformation, lassen sich die einzelnen Bereiche mit unterschiedlichen Schwellwerten bearbeiten. Hintergrundbereiche können so bereinigt werden, während die für die Bilderkennung interessanten Bereiche sicherer, im Sinne der Gefahr von Informationsverlusten, verarbeitet werden.The distribution analysis in particular can be used for areas of interest such as writing or recognize a picture. The distribution analysis also enables background detection for a regular background. If the template now consists of parts of the picture with exclusive Foreground and / or background information, the individual areas with different threshold values to edit. Background areas can be cleaned up while the areas of interest for image recognition safer, in the sense of risk of loss of information, are processed.
Der oder die Schwellwerte können weiterhin an die systembedingten Bildeigenschaften durch eine geeignete Wahl der Bereiche für eine Untersuchung lokaler Bildeigenschaften angepaßt werden. Zu den systembedingten Bildeigenschaften gehören u. a. die durch den Einlesevorgang hervorgerufenen Bildstörungen oder die Vorlagentyp-spezifischen Bildeigenschaften, die von Vorlage zu Vorlage eines Vorlagentyps gleich bleiben. Die vorlagentyp-spezifischen Bildeigenschaften werden insbesondere durch den Bildaufbau und die Bildeinteilung des jeweiligen Vorlagentyps geprägt. Bei einer Vorlage, die in horizontaler Richtung eingelesen wird, werden die Untersuchungsbereiche vorzugsweise horizontal länglich (z. B. zeilenweise) - entsprechend der horizontalen Einleseweise - angenommen. Entsprechend werden bei Vorlagen, bei denen die Informationen überwiegend zeilenweise (oder vertikal) auftreten, die Bereiche ebenfalls zeilenhaft (oder vertikal) ausgeprägt.The threshold value (s) can still be sent to the system-related image properties through a suitable choice of Areas for examining local image properties be adjusted. The system-related image properties belong u. a. those caused by the import process Image disturbances or the original type-specific Image properties, from template to template of a template type stay the same. The image type-specific image properties are particularly due to the image structure and the image division of the respective template type. For a template that is in is read in the horizontal direction, the Examination areas preferably horizontally elongated (e.g. line by line) - according to the horizontal import method - accepted. Correspondingly, for templates in which the Information occurs predominantly line by line (or vertical), the areas are also line-like (or vertical).
Die Erfindung findet Anwendung bei der (Vor-)verarbeitung von Dokumenten für eine Bilderkennung und/oder für eine Archivierung der Dokumente.The invention finds application in the (pre) processing of Documents for image recognition and / or archiving of the documents.
Weitere, vorteilhafte Ausführungen der Erfindung finden sich in den Unteransprüchen.Further advantageous embodiments of the invention can be found in the subclaims.
Zur näheren Erläuterung der Erfindung sind im folgenden Ausführungsbeispiele mit Bezugnahme auf die Zeichnungen beschrieben. Funktionsgleiche Elemente sollen gleiche Bezugszeichen tragen.To explain the invention in more detail, the following are Embodiments with reference to the drawings described. Functionally identical elements should be the same Wear reference numbers.
Fig. 1 zeigt eine Vorlage mit einer Schrift und einer zufälligen Bildstörung, Fig. 1 shows a template with a signature and a random image disturbance,
Fig. 2 zeigt ein elektronisches Grauwertbild der Vorlage, aus Fig. 1, das mit einem einheitlichen, mittleren Schwellwert aus der Vorlage gewonnen wurde, FIG. 2 shows an electronic gray scale image of the template from FIG. 1, which was obtained from the template with a uniform, average threshold value,
Fig. 3 zeigt die Grauwertverteilung in horizontaler Richtung für 3 exemplarisch ausgewählte Zeilenbereiche A, B und C mit einer Länge L in dem Grauwertbild aus Fig. 2, Fig. 3 shows the gray value distribution in the horizontal direction for 3 exemplarily selected row areas A, B and C having a length L in the gray scale image of FIG. 2,
Fig. 4 zeigt ein gemäß der Erfindung aus der Vorlage in Fig. 1 gewonnenes Bild, Fig. 4 shows a product obtained according to the invention from the template in Fig. 1 image,
Fig. 5 erläutern die Erfindung an einem Beispiel eines Scanners, der eine 4-Bit-Wandlung durchführt. Fig. 5 illustrate the invention using an example of a scanner that performs 4-bit conversion.
Fig. 1 zeigt eine Vorlage 10 mit einer Schrift 20 und einer zufälligen Bildstörung 30. Fig. 2 zeigt ein elektronisches Grauwertbild 40 der Vorlage 10, das mit einem einheitlichen, mittleren Schwellwert SWmittel aus der Vorlage 10 gewonnen wurde. Der mittlere Schwellwert SWmittel kann beispielsweise aus einer Mittelung der Grauwertverteilung der Vorlage oder eines Bereiches davon stammen oder als Erfahrungswert einfach vorgegeben werden. Das Grauwertbild 40 weist ein Bild 20′ der Schrift 20 und ein Bild 30′ der zufälligen Bildstörung 30 auf. Wie aus Fig. 2 zu entnehmen ist, sind durch die Schwellwertfilterung Informationen verloren gegangen, die im ungünstigsten Fall eine Erkennbarkeit der Schrift 20 erschweren können. Fig. 1 shows a template 10 with a magazine 20 and a random image disturbance 30th Fig. 2 shows an electronic gray scale image 40 of the original 10 which has been obtained with a uniform, medium threshold value SW medium from the template 10. The mean threshold value SW medium can, for example, come from averaging the gray value distribution of the original or a region thereof, or can simply be specified as an empirical value. The gray scale image 40 has an image 20 'of the font 20 and an image 30 ' of the random image disturbance 30 . As can be seen from FIG. 2, information has been lost due to the threshold value filtering, which in the worst case can make it difficult to recognize the font 20 .
Fig. 3 zeigt die Grauwertverteilung in horizontaler Richtung für 3 exemplarisch ausgewählte Zeilenbereiche A, B und C mit einer Länge L in dem Grauwertbild 40. Innerhalb des Zeilenbereiches A werden 8 Peaks oberhalb und 1 Peak unterhalb eines vorgegebenen Grauwertes G ermittelt. Innerhalb des Zeilenbereiches B wird kein Peak oberhalb und es werden 2 Peaks unterhalb des Grauwertes G gefunden. Innerhalb des Zeilenbereiches C werden 2 Peaks oberhalb und 1 Peak unterhalb des Grauwertes G ermittelt. FIG. 3 shows the gray value distribution in the horizontal direction for 3 line areas A, B and C with a length L in the gray value image 40 selected as examples. Within the line area A, 8 peaks above and 1 peak below a predetermined gray value G are determined. No peak above is found within line area B and 2 peaks below gray value G are found. Within the line area C, 2 peaks above and 1 peak below the gray value G are determined.
Als Grenzwert für die Erkennung bild-relevanter Bereiche innerhalb der Vorlage 10 sei eine Anzahl von 4 Peaks oberhalb des vorgegebenen Grauwertes G für einen Zeilenbereich der Länge L gegeben. Dementsprechend wird nur der Zeilenbereich A als ein Bild-relevanter Bereich erkannt. Für diesen Zeilenbereich A wird für einen zweiten Einlesevorgang ein Schwellwert SWinformation, der gegenüber dem mittleren Schwellwert SWmittel weiter in Richtung "weiß" verschoben ist, also weniger Informationen herausfiltern wird, eingestellt. Die Zeilenbereiche B und C hingegen werden als nicht-bild-relevante Bereiche eingestuft und es wird für einen zweiten Einlesevorgang ein Schwellwert SWhinergrund, der gegenüber dem mittleren Schwellwert SWmittel weiter in Richtung "schwarz" verschoben ist, also mehr Informationen herausfiltern wird, eingestellt. As a limit for the recognition of image-relevant areas within template 10 , a number of 4 peaks above the given gray value G for a line area of length L is given. Accordingly, only the line area A is recognized as an image-relevant area. For this range of rows A, a threshold value SW information, which compared with the average threshold value SW medium in the direction of "white" is for a second reading process is shifted, is thus filtered out less information set. The line areas B and C, however, are classified as non-image-related areas and there is a threshold value SW Hinergrund for a second reading process, which compared to the average threshold value SW medium in the direction of "black" is shifted, will therefore filter out more information set .
Der oben dargestellte Vorgang zur Erkennung bild-relevanter Bereiche wird entsprechend zeilenweise für das gesamte Bild 40 durchgeführt, die Schwellwerte der einzelnen Bereiche werden an die erkannten Bereiche angepaßt und ein neues Bild 50 mit Hilfe der neu angepaßten Schwellwerte erzeugt. Fig. 4 zeigt das neue Bild 50. Die Schrift 20 der Vorlage 10 wurde als bild-relevanter Bereich erkannt und in dem Bild 50 als Schrift 20′′ abgebildet. Die zufällige Bildstörung 30 aus der Vorlage 10 konnte durch diesen Prozeß vollständig eliminiert werden.The above-described process for recognizing image-relevant areas is carried out correspondingly line by line for the entire image 40 , the threshold values of the individual areas are adapted to the recognized regions and a new image 50 is generated with the aid of the newly adapted threshold values. Fig. 4 shows the new Figure 50. The font 20 of the template 10 was recognized as an image-relevant area and shown in the image 50 as font 20 ''. The random image disturbance 30 from the original 10 could be completely eliminated by this process.
Die Erfindung soll an einem weiteren Beispiel eines Scanners, der eine 4-Bit-Wandlung durchführt, erläutert. Eine 4-Bit- Wandlung bedeutet, daß als Vorlage ein Graubild mit 16 Graustufen vorliegt, das in ein Schwarz-Weiß-Bild gewandelt werden soll. Der Grauwert 15 soll in diesem Beispiel der Graustufe "weiß" entsprechen und der Grauwert 0 der Graustufe "schwarz".The invention is to be explained using a further example of a scanner which carries out a 4-bit conversion. A 4-bit conversion means that a gray image with 16 gray levels is available as a template, which is to be converted into a black and white image. In this example, the gray value 15 should correspond to the gray level "white" and the gray value 0 to the gray level "black".
Fig. 5a zeigt einen Bildausschnitt eines ersten eingescannten Testbildes einer (hier nicht gezeigten) Vorlage. Fig. 5b stellt die Verteilung der Bilddaten (Grauwert-Histogramm) für einen Bereich des Testbildes dar. Aus diesem Histogramm ergibt sich ein mittlerer Grauwert von 11,23. Wird als Schwellwert für die Wandlung der Vorlage in ein Schwarz-Weiß-Bild dieser mittlere Grauwert, oder durch die Abrundung auf gerade Werte (Integer) ein entsprechender Schwellwert von 11, verwendet, werden nicht ausreichend Bildinformationen der Vorlage in dem gezeigten Bildausschnitt in schwarze Bildpunkte umgewandelt werden. Die Schwellwertfilterung bewirkt, daß Werte, die kleiner als der vorgegebene Schwellwert sind, in signifikante, schwarze Bildpunkte umgewandelt werden. Störinformation (Rauschen, Digitalisierungsfehler), aber auch tatsächliche Bildinformationen mit Grauwerten größer als der Schwellwert werden als weiße Bildpunkte dargestellt. Fig. 5a shows a detail of a first image scanned test image of an original (not shown here). Fig. 5b represents the distribution of the image data (gray level histogram) is for a region of the test image. From this histogram results in a mean gray value of 11.23. If this mean gray value is used as the threshold value for the conversion of the original into a black and white image, or a corresponding threshold value of 11 due to the rounding down to even values (integer), insufficient image information of the original in the image section shown is turned into black pixels being transformed. The threshold value filtering has the effect that values which are smaller than the predetermined threshold value are converted into significant black pixels. Interference information (noise, digitization errors), but also actual image information with gray values greater than the threshold value are shown as white pixels.
Aus dem Histoprogramm in Fig. 5b ist nicht ersichtlich, ob es sich bei den Bildpunkten um verwertbare Informationen oder um Rauschen handelt. Daher ist hier eine Schwarz-Weiß-Wandlung immer mit dem Risiko des Auslöschens von Informationen behaftet. It is not apparent from the histoprogram in FIG. 5b whether the pixels are usable information or noise. Therefore, black-and-white conversion always involves the risk of information being erased.
Erfindungsgemäß wird nun eine Verteilungsanalyse durchgeführt, d. h. es wird die "Frequenz" der vorliegenden Bilddaten in horizontaler Richtung untersucht. Die horizontale Bildrichtung bietet sich insbesondere dann an, wenn Schriften in horizontaler Richtung erwartet werden. Fig. 5c zeigt einen Verlauf 100 der Grauwerte für einen Bereich in horizontaler Richtung innerhalb der Schrift "Konto-Nr" in Fig. 5a, wobei diese in der Vorlage rot gedruckt wurde. Der Verlauf 100 der Grauwerte wird mathematisch differenziert und führt zu einem Verlauf 110 der Ableitung. Durch Aufsummieren der vorkommenden Wendepunkte oder Maxima in der Ableitung 110, bezogen auf die Längeneinheit, ergibt sich eine "Frequenz" für diesen Bereich. Die so ermittelte "Frequenz" wird mit einem vorgegebenen Grenzwert verglichen. Dabei wurde der Grenzwert aufgrund vorangegangener Bilduntersuchungen so eingestellt, daß signifikante Textbereiche erkannt werden können.According to the invention, a distribution analysis is now carried out, ie the "frequency" of the available image data is examined in the horizontal direction. The horizontal direction of the image is particularly useful when fonts are expected in the horizontal direction. FIG. 5c shows a course 100 of the gray values for an area in the horizontal direction within the font "account number" in FIG. 5a, this being printed in red in the template. The course 100 of the gray values is mathematically differentiated and leads to a course 110 of the derivation. Adding up the occurring turning points or maxima in the derivation 110 , based on the unit of length, results in a "frequency" for this area. The "frequency" determined in this way is compared with a predetermined limit value. The limit was set based on previous image examinations so that significant text areas can be recognized.
In dem Beispiel in Fig. 5c liegt die ermittelte "Frequenz" oberhalb des vorgegebenen Grenzwertes, so daß ein signifikanter Textbereich angenommen wird. Der Schwellwert für die Schwarz-Weiß-Wandlung wird entsprechend angepaßt und in diesem Beispiel um eine Graustufe (also von 11 auf 12) nach oben festgelegt. Fig. 5d zeigt das Ergebnis der durchgeführten Schwarz-Weiß-Wandlung mit dem angepaßten Schwellwert.In the example in FIG. 5c, the "frequency" determined is above the predetermined limit value, so that a significant text area is assumed. The threshold value for the black-and-white conversion is adjusted accordingly and in this example is increased by one gray level (that is from 11 to 12). Fig. 5d shows the result of performing monochrome conversion with the adjusted threshold value.
Der Einfachheit halber wurde in Fig. 5d die Schwarz-Weiß-Wandlung für den ganzen in Fig. 5a gezeigten Bereich mit dem angepaßten Schwellwert durchgeführt. Entsprechend könnte jedoch auch eine Schwarz-Weiß-Wandlung mit einer Vielzahl von an einzelne Bereiche angepaßten Schwellwerten durchgeführt werden.For the sake of simplicity, the black-and-white conversion was carried out in FIG. 5d for the entire region shown in FIG. 5a with the adjusted threshold value. Correspondingly, however, a black-and-white conversion could also be carried out with a large number of threshold values adapted to individual areas.
Claims (17)
einem ersten Schritt der Erfassung der Bildeigenschaften der Vorlage (10);
einem zweiten Schritt der Analyse der räumlichen und/oder örtlichen Verteilung der Bildeigenschaften der Vorlage (10); und
einem dritten Schritt des Ermittelns eines Schwellwertes aus der Verteilungsanalyse der Bildeigenschaften der Vorlage (10).1. A method for determining a threshold value for the generation of an electronic image ( 50 ) from a template ( 10 ), with:
a first step of capturing the image properties of the original ( 10 );
a second step of analyzing the spatial and / or local distribution of the image properties of the template ( 10 ); and
a third step of determining a threshold value from the distribution analysis of the image properties of the template ( 10 ).
einem Mittel zur Erfassung der Bildeigenschaften der Vorlage (10);
einem Mittel zur Analyse der räumlichen und/oder örtlichen Verteilung der Bildeigenschaften der Vorlage (10); und
einem Mittel zur Ermittlung des Schwellwertes aus der Verteilungsanalyse der Bildeigenschaften der Vorlage (10), wobei das Mittel zur Ermittlung des Schwellwertes ein Mittel zur Auswertung und Bewertung der Analyse der räumlichen Verteilung der Bildeigenschaften aufweist.17. Device for determining a threshold value for generating an electronic image ( 50 ) from a template ( 10 ), with:
means for detecting the image properties of the original ( 10 );
a means for analyzing the spatial and / or spatial distribution of the image properties of the original ( 10 ); and
a means for determining the threshold value from the distribution analysis of the image properties of the template ( 10 ), the means for determining the threshold value having a means for evaluating and evaluating the analysis of the spatial distribution of the image properties.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19536170A DE19536170A1 (en) | 1995-09-29 | 1995-09-29 | Image thresholding for optical character recognition |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19536170A DE19536170A1 (en) | 1995-09-29 | 1995-09-29 | Image thresholding for optical character recognition |
Publications (1)
Publication Number | Publication Date |
---|---|
DE19536170A1 true DE19536170A1 (en) | 1997-04-03 |
Family
ID=7773481
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19536170A Ceased DE19536170A1 (en) | 1995-09-29 | 1995-09-29 | Image thresholding for optical character recognition |
Country Status (1)
Country | Link |
---|---|
DE (1) | DE19536170A1 (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10054185A1 (en) * | 2000-11-02 | 2002-05-29 | Infineon Technologies Ag | Process for optimizing an electronically generated image |
EP1330111A2 (en) * | 2002-01-16 | 2003-07-23 | Eastman Kodak Company | Automatic image quality evaluation and correction technique |
DE10010621B4 (en) * | 1999-03-12 | 2006-08-24 | International Business Machines Corp. | Quickly locate address blocks in grayscale images |
US7499569B2 (en) | 2004-02-26 | 2009-03-03 | Mitsubishi Fuso Truck And Bus Corporation | Hand pattern switching apparatus |
US8194941B2 (en) | 2007-03-12 | 2012-06-05 | Nec Corporation | Character noise eliminating apparatus, character noise eliminating method, and character noise eliminating program |
CN106529518B (en) * | 2016-09-08 | 2018-12-14 | 广东德诚科教有限公司 | A kind of method and device of answering card identification |
DE112006003272B4 (en) | 2005-11-30 | 2022-08-18 | Adobe Inc. | Method and device for removing noise from a digital image |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4590606A (en) * | 1982-12-13 | 1986-05-20 | International Business Machines Corporation | Multi-function image processing system |
DE2757456C2 (en) * | 1976-12-22 | 1988-04-14 | Recognition Equipment Inc., Dallas, Tex., Us | |
DE3433493C2 (en) * | 1983-09-12 | 1988-07-21 | Ricoh Co., Ltd., Tokio/Tokyo, Jp | |
US4878248A (en) * | 1988-04-18 | 1989-10-31 | Industrial Technology Research Institute | Method and apparatus for automatically recognizing license plate characters |
US5038381A (en) * | 1988-07-11 | 1991-08-06 | New Dest Corporation | Image/text filtering system and method |
EP0505729A2 (en) * | 1991-03-29 | 1992-09-30 | EASTMAN KODAK COMPANY (a New Jersey corporation) | Image binarization system |
DE4411248C1 (en) * | 1994-03-31 | 1995-10-26 | Licentia Gmbh | Method and device for binarizing pixel data |
DE4445386C1 (en) * | 1994-12-20 | 1996-05-02 | Ibm | Separation of foreground and background information on document |
-
1995
- 1995-09-29 DE DE19536170A patent/DE19536170A1/en not_active Ceased
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE2757456C2 (en) * | 1976-12-22 | 1988-04-14 | Recognition Equipment Inc., Dallas, Tex., Us | |
US4590606A (en) * | 1982-12-13 | 1986-05-20 | International Business Machines Corporation | Multi-function image processing system |
DE3433493C2 (en) * | 1983-09-12 | 1988-07-21 | Ricoh Co., Ltd., Tokio/Tokyo, Jp | |
US4878248A (en) * | 1988-04-18 | 1989-10-31 | Industrial Technology Research Institute | Method and apparatus for automatically recognizing license plate characters |
US5038381A (en) * | 1988-07-11 | 1991-08-06 | New Dest Corporation | Image/text filtering system and method |
EP0505729A2 (en) * | 1991-03-29 | 1992-09-30 | EASTMAN KODAK COMPANY (a New Jersey corporation) | Image binarization system |
DE4411248C1 (en) * | 1994-03-31 | 1995-10-26 | Licentia Gmbh | Method and device for binarizing pixel data |
DE4445386C1 (en) * | 1994-12-20 | 1996-05-02 | Ibm | Separation of foreground and background information on document |
Non-Patent Citations (3)
Title |
---|
OHYA, SHIO, AKAMATSU: "Recognition characters in scane images" IEEE Transactions on pattern analysis and machine intelligence, Vol. PAMI-16, N. 2, 1994, S. 214-220 * |
SAHOO, et al: "A Survey of Thresholding Techni- ques" Computer Vision, Graphics and Image Pro- cessing 41, 1988, S. 233-260 * |
WHITE/ROHRER: "Image Thresholding for Optical Character Recognition and other Application Reguiring Character Image Extraction" IBM J.Res. Develop., Vol. 27, Nr. 4, July 1983, pp. 400-411 * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE10010621B4 (en) * | 1999-03-12 | 2006-08-24 | International Business Machines Corp. | Quickly locate address blocks in grayscale images |
DE10054185A1 (en) * | 2000-11-02 | 2002-05-29 | Infineon Technologies Ag | Process for optimizing an electronically generated image |
EP1330111A2 (en) * | 2002-01-16 | 2003-07-23 | Eastman Kodak Company | Automatic image quality evaluation and correction technique |
EP1330111A3 (en) * | 2002-01-16 | 2004-12-08 | Eastman Kodak Company | Automatic image quality evaluation and correction technique |
US6970606B2 (en) | 2002-01-16 | 2005-11-29 | Eastman Kodak Company | Automatic image quality evaluation and correction technique for digitized and thresholded document images |
US7499569B2 (en) | 2004-02-26 | 2009-03-03 | Mitsubishi Fuso Truck And Bus Corporation | Hand pattern switching apparatus |
DE112006003272B4 (en) | 2005-11-30 | 2022-08-18 | Adobe Inc. | Method and device for removing noise from a digital image |
US8194941B2 (en) | 2007-03-12 | 2012-06-05 | Nec Corporation | Character noise eliminating apparatus, character noise eliminating method, and character noise eliminating program |
CN106529518B (en) * | 2016-09-08 | 2018-12-14 | 广东德诚科教有限公司 | A kind of method and device of answering card identification |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE4445386C1 (en) | Separation of foreground and background information on document | |
DE60308739T2 (en) | Automatic image quality evaluation method and correction technique | |
DE69533054T2 (en) | Multi-windowing technique for thresholding an image using local image properties | |
DE69728127T2 (en) | Apparatus and method for extracting an object in an image | |
DE69925354T2 (en) | Image processing system to reduce vertical patterns on scanned images | |
DE3545951C2 (en) | ||
DE69828909T2 (en) | NEW PERCEPTIVE LOCAL GRADIENT-BASED GRATING | |
DE19956158A1 (en) | Image binarisation method for scanned greytone images e.g. newspaper article, uses 2 different conversion methods for providing 2 binary images from scanned greytone image, combined to provide output binary image | |
DE3633743C2 (en) | ||
DE4103229C2 (en) | ||
DE60132315T2 (en) | IMPROVED PROCESS FOR IMAGE BINARIZATION | |
DE69926205T2 (en) | ARTIFICIAL REMOVAL TECHNOLOGY FOR SLOW CORRECTED IMAGES | |
DE60020038T2 (en) | Method for processing a numerical image | |
EP0925682B1 (en) | Process for detecting edges in an image signal | |
DE69728724T2 (en) | Image area recognition method and image processing apparatus | |
DE112010005721B4 (en) | Image processing device | |
DE102007013971A1 (en) | Method and device for determining a cell contour of a cell | |
DE102008013789A1 (en) | Apparatus, method and program for eliminating character disturbances | |
DE112019005143T5 (en) | SYSTEM FOR CO-REGISTRATION OF MEDICAL IMAGES USING A CLASSIFICATOR | |
EP0402868A2 (en) | Method for recognizing previously located character represented as digital grey-value images, in particular of character stamped into metal surfaces | |
DE10303724B4 (en) | Dynamic two-level thresholding of digital images | |
DE60024535T2 (en) | Method for character separation | |
DE19536170A1 (en) | Image thresholding for optical character recognition | |
DE69728469T2 (en) | Apparatus and method for determining the character line using simplified projection information; Character recognition device and method | |
EP3123393B1 (en) | Method for the optical detection of symbols |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8128 | New person/name/address of the agent |
Representative=s name: RACH, W., DR., PAT.-ASS., 70569 STUTTGART |
|
8131 | Rejection |