DE10111885C2 - Verfahren zum Ermitteln gültiger Adresskodes - Google Patents

Verfahren zum Ermitteln gültiger Adresskodes

Info

Publication number
DE10111885C2
DE10111885C2 DE10111885A DE10111885A DE10111885C2 DE 10111885 C2 DE10111885 C2 DE 10111885C2 DE 10111885 A DE10111885 A DE 10111885A DE 10111885 A DE10111885 A DE 10111885A DE 10111885 C2 DE10111885 C2 DE 10111885C2
Authority
DE
Germany
Prior art keywords
address
valid
dictionary
codes
valid address
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
DE10111885A
Other languages
English (en)
Other versions
DE10111885A1 (de
Inventor
Wolfgang Jakesch
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Siemens AG
Original Assignee
Siemens Production and Logistics Systems AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Siemens Production and Logistics Systems AG filed Critical Siemens Production and Logistics Systems AG
Priority to DE10111885A priority Critical patent/DE10111885C2/de
Priority to EP02004571A priority patent/EP1241590B1/de
Priority to DE50204815T priority patent/DE50204815D1/de
Priority to US10/095,042 priority patent/US6970868B2/en
Publication of DE10111885A1 publication Critical patent/DE10111885A1/de
Application granted granted Critical
Publication of DE10111885C2 publication Critical patent/DE10111885C2/de
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/26Techniques for post-processing, e.g. correcting the recognition result
    • G06V30/262Techniques for post-processing, e.g. correcting the recognition result using context analysis, e.g. lexical, syntactic or semantic context
    • G06V30/274Syntactic or semantic context, e.g. balancing
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B07SEPARATING SOLIDS FROM SOLIDS; SORTING
    • B07CPOSTAL SORTING; SORTING INDIVIDUAL ARTICLES, OR BULK MATERIAL FIT TO BE SORTED PIECE-MEAL, e.g. BY PICKING
    • B07C3/00Sorting according to destination
    • B07C3/10Apparatus characterised by the means used for detection ofthe destination
    • B07C3/14Apparatus characterised by the means used for detection ofthe destination using light-responsive detecting means
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Description

Die Erfindung betrifft ein Verfahren zum Ermitteln gültiger Adresskodes zu gültigen Adressdaten unter Verwendung eines Adresswörterbuches.
Das automatische Adresslesen von Sendungen ist eine weltweit verbreitete Technologie beim Sortieren und Verteilen der Sen­ dungen. Die Adressen auf den Sendungen beinhalten dabei einen Postkode, Ortsangaben, Straßennamen, Hausnummern, ggf. Appar­ tementnummern und Namen, sowie evtl. weitere kennzeichnenden Angaben. Der Postkode besteht entweder aus Zahlen (ZIP-Code in US, Postleitzahl in DE) und beschreibt den Ort oder aus einem Gemisch von Zahlen und Buchstaben und beschreibt die Adresse herunter bis zur Straße.
Beim automatischen Lesevorgang in einem OCR-Leser werden die Zeichen und dann die einzelnen Elemente der Adresse gelesen. Danach erfolgt ein Abgleich mit den Eintragungen eines Ad­ resswörterbuches und mit Hilfe des Adresswörterbuches die Er­ mittlung eines die Adresse bis hinunter zu Hausnummern einer Straße beschreibenden Adresskodes (Postkode und weitere in der Adressdatenbank eingetragene Kodezeichen). Beschreibt der Postkode die Adresse hinunter bis zur Straße, erfolgt beim Lesen in der OCR-Einheit ein Abgleich der gelesenen Postkode­ daten und der gelesenen Städte- und Straßennamen sowie Haus­ nummer auf Gültigkeit.
Diese Technologie ist jedoch nicht perfekt. Die beim automa­ tischen Lesen ermittelte Verteilinformation stimmt in manchen Fällen nicht mit der Verteilinformation auf der Postsendung überein.
Durch Vergleich des beim automatischen Lesen der Adresse be­ stimmten Adresskodes mit allen für diese Adresse gültigen Adresskodes kann festgestellt werden, ob der beim automatischen Lesen bestimmte Adresskode richtig oder falsch ist. Um dies durchzuführen, sind die gültigen Adresskodes der jeweiligen Adresse zu ermitteln.
Um dazu notwendige, gültige Adressdaten zu erhalten, wurde bisher nach dem Stand der Technik die Adresse manuell an ei­ nem Videokodierplatz eingegeben. Dann wurde ein Adresswörter­ buch, in welchem Adressen und zugehörige Adresskodes einge­ tragen sind, mit den eingegebenen Adressdaten nach entspre­ chenden Einträgen mit den Adresskodes mittels Lookup interak­ tiv von dem Operateur durchsucht, wobei dieses Durchsuchen auf Erfahrungswerte des jeweiligen Operateurs beruht. Die so ermittelten Adresskodes wurden dann als gültige Adresskodes ausgegeben. Eine entsprechende Vorrichtung zum Lesen der Ad­ ressen von Sendungen mit OCR-Leser und Videokodierplätzen ist in der DE 100 10 241 C1 beschrieben.
Dieses Vorgehen ist zeitintensiv, fehleranfällig und liefert meist nicht alle gültigen Adresskodes einer Adresse. Darüber hinaus muss das Verfahren bei jedem Update des Lookup erneut durchgeführt werden.
Der im Anspruch 1 angegebenen Erfindung liegt die Aufgabe zugrunde, ein Verfahren zum Ermitteln gültiger Adresskodes zu gültigen Adressdaten mit Hilfe eines Adresswörterbuches zu schaffen, bei dem alle für die Adresse gültigen Adresskodes in kurzer Zeit ermittelt werden.
Erfindungsgemäß wird das Adresswörterbuch, in dem für ein be­ stimmtes Territorium alle zulässigen Adressangaben mit den dazugehörenden Adresskodes recherchierbar abgespeichert sind, automatisch anhand der gültigen Adressdaten und von jeweils daraus abgeleiteten sämtlichen Vergröberungsstufen durch­ sucht. Die in den zu jeder gültigen Adresse einschließlich sämtlicher zugehörender Vergröberungsstufen gefundenen Wörterbucheinträgen enthaltenen Adresskodes werden dann als gül­ tige Adresskodes ausgegeben. Damit entfällt der aufwendige manuelle und erfahrungsabhängige, bisherige Suchprozess im Adresswörterbuch.
Vorteilhaft ist es, zur Ableitung der ersten Vergröberungs­ stufe von der vollständigen Adresse den diese am feinsten be­ schreibenden Teil zu entfernen, zur Ableitung der zweiten Vergröberungsstufe von der ersten Vergröberungsstufe den die­ se am feinsten beschreibenden Teil zu entfernen und dies, so­ lange ein entsprechender Eintrag im Adresswörterbuch gefunden wird, weiterzuführen.
Vorteilhaft ist es auch, die gültigen Adressdaten durch manu­ elles Eingeben zu erzeugen.
Anschließend wird die Erfindung in einem Ausführungsbeispiel anhand der Zeichnung näher erläutert.
Dabei zeigt
Fig. 1 den Verfahrensablauf anhand eines Fluss­ bildes.
Zum Erzeugen gültiger Adressdaten wird zuerst eine Adresse manuell eingegeben 1. Danach wird in einem Adresswörterbuch, in dem für ein bestimmtes Territorium alle zulässigen Adress­ angaben mit den zugehörenden Adresskodes recherchierbar ge­ speichert sind, nach den eingegebenen Adressdaten dieser Ad­ resse gesucht 2.
Wurde ein entsprechender Eintrag gefunden, so wird der ent­ haltene Adresskode abgespeichert 3. Danach wird von diesen Adressangaben der am feinsten beschreibende Teil entfernt 4. Anschließend erfolgt ein weiteres Durchsuchen des Adresswör­ terbuches mit diesen reduzierten/vergröberten Adressanga­ ben 2. Wurde ein Eintrag gefunden, so wird der darin enthal­ tene Adresskode ebenfalls abgespeichert 3 und von diesen um einen Teil reduzierten Adressangaben wird der nunmehr am feinsten beschreibende Teil ebenfalls entfernt 4. Damit wird das Adresswörterbuch durchsucht usw. Dieser Prozess wird solange durchgeführt, bis kein Eintrag mehr gefunden wird. Dann erfolgt die Ausgabe der während dieses Ablaufes gespeicherten Adresskodes als gültige Adresskodes 5 und die Beendigung der Ermittlung der für die eingegebene Adresse gültigen Adressko­ des. Wurde mit den eingegebenen Adressdaten schon am Anfang kein Eintrag im Adresswörterbuch gefunden (falsche Adressan­ gaben), erfolgt sofort die Beendigung des Ablaufes.
Anhand einer US-Adresse wird dies kurz erläutert:
INDEPENDENCE BLUE CROSS 1901 MARKET STREET STE 3 PHILADELPHIA PA 19103
Dessen Postcode lautet: 19103-1475-01
Die dazugehörigen Adresselemente sind:
City = "PHILADELPHIA", State = "PA", Zip Code = "19103" Primary Number = "1901", Street = "MARKET", Suffix = "ST" Secondary Name = "STE", Secondary Number = "3" Firm = "INDEPENDENCE BLUE CROSS"
Dazu gibt es folgende Vergröberungen
1901 MARKET STREET STE 3 PHILADELPHIA PA 19103
Dessen Postcode lautet: 19103-1400-03
1901 MARKET STREET STE PHILADELPHIA PA 19103
Dessen Postcode lautet: 19103-1400-99
1901 MARKET STREET PHILADELPHIA PA 19103
Dessen Postcode lautet: 19103-1414-01
PHILADELPHIA PA 19103
Dessen Postcode lautet: 19103.
PHILADELPHIA PA
Dessen Postcode lautet: 19100.
Diese hier aufgeführten Adresskodes sind sämtliche gültigen Adresskodes zur angegebenen Adresse.

Claims (3)

1. Verfahren zum Ermitteln von gültigen Adresskodes zu gülti­ gen Adressdaten unter Verwendung eines Adresswörterbuches, dadurch gekennzeichnet, dass das Ad­ resswörterbuch, in dem für ein bestimmtes Territorium alle zulässigen Adressangaben mit den dazugehörenden Adressko­ des recherchierbar abgespeichert sind, automatisch anhand der gültigen Adressdaten und von jeweils daraus abgeleite­ ten sämtlichen Vergröberungsstufen durchsucht wird und dass die in den zu jeder gültigen Adresse einschließlich sämtlicher zugehöriger Vergröberungsstufen gefundenen Wör­ terbucheinträge enthaltenen Adresskodes als gültige Ad­ resskode ausgegeben werden.
2. Verfahren nach Anspruch 1, dadurch gekenn­ zeichnet, dass zur Ableitung der ersten Vergröbe­ rungsstufe von der vollständigen Adresse der diese am feinsten beschreibende Teil entfernt wird, zur Ableitung der zweiten Vergröberungsstufe von der ersten Vergröbe­ rungsstufe der diese am feinsten beschreibende Teil ent­ fernt wird und dies, solange ein entsprechender Eintrag im Adresswörterbuch gefunden wird, weitergeführt wird.
3. Verfahren nach Anspruch 1, dadurch gekenn­ zeichnet, dass die gültigen Adressdaten durch ma­ nuelles Eingeben erzeugt werden.
DE10111885A 2001-03-13 2001-03-13 Verfahren zum Ermitteln gültiger Adresskodes Expired - Fee Related DE10111885C2 (de)

Priority Applications (4)

Application Number Priority Date Filing Date Title
DE10111885A DE10111885C2 (de) 2001-03-13 2001-03-13 Verfahren zum Ermitteln gültiger Adresskodes
EP02004571A EP1241590B1 (de) 2001-03-13 2002-02-27 Verfahren zum Ermitteln gültiger Adresskodes
DE50204815T DE50204815D1 (de) 2001-03-13 2002-02-27 Verfahren zum Ermitteln gültiger Adresskodes
US10/095,042 US6970868B2 (en) 2001-03-13 2002-03-12 Method for ascertaining valid address codes

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10111885A DE10111885C2 (de) 2001-03-13 2001-03-13 Verfahren zum Ermitteln gültiger Adresskodes

Publications (2)

Publication Number Publication Date
DE10111885A1 DE10111885A1 (de) 2002-10-02
DE10111885C2 true DE10111885C2 (de) 2003-02-20

Family

ID=7677186

Family Applications (2)

Application Number Title Priority Date Filing Date
DE10111885A Expired - Fee Related DE10111885C2 (de) 2001-03-13 2001-03-13 Verfahren zum Ermitteln gültiger Adresskodes
DE50204815T Expired - Lifetime DE50204815D1 (de) 2001-03-13 2002-02-27 Verfahren zum Ermitteln gültiger Adresskodes

Family Applications After (1)

Application Number Title Priority Date Filing Date
DE50204815T Expired - Lifetime DE50204815D1 (de) 2001-03-13 2002-02-27 Verfahren zum Ermitteln gültiger Adresskodes

Country Status (3)

Country Link
US (1) US6970868B2 (de)
EP (1) EP1241590B1 (de)
DE (2) DE10111885C2 (de)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10007739B1 (en) * 2007-07-03 2018-06-26 Valassis Direct Mail, Inc. Address database reconciliation
US8055497B2 (en) * 2007-11-02 2011-11-08 International Business Machines Corporation Method and system to parse addresses using a processing system
US20090198954A1 (en) * 2008-02-01 2009-08-06 Electronic Data Systems Corporation Method and system for generating location codes
CN110688851B (zh) * 2019-09-26 2023-07-28 亿企赢网络科技有限公司 一种提取地址文本的关键信息的方法、装置及介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10010241C1 (de) * 2000-03-02 2001-03-01 Siemens Ag Verfahren und Vorrichtung zum Lesen der Adressen von Sendungen

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5050218A (en) * 1986-08-26 1991-09-17 Nec Corporation Apparatus for recognizing address appearing on mail article
US5422821B1 (en) * 1992-04-06 1998-07-21 Electrocom Automation Lp Apparatus for intercepting and forwarding incorrectly addressed postal mail
JP3388829B2 (ja) * 1993-03-23 2003-03-24 株式会社東芝 文字読取装置
US5687212A (en) * 1995-07-25 1997-11-11 Bell Atlantic Network Services, Inc. System for reactively maintaining telephone network facilities in a public switched telephone network
US5459717A (en) * 1994-03-25 1995-10-17 Sprint International Communications Corporation Method and apparatus for routing messagers in an electronic messaging system
US5659731A (en) * 1995-06-19 1997-08-19 Dun & Bradstreet, Inc. Method for rating a match for a given entity found in a list of entities
US5984174A (en) * 1995-10-20 1999-11-16 Kabushiki Kaisha Toshiba Method of printing bar codes on pieces to deliver, and method and system for encoding and decoding bar codes
US5901214A (en) * 1996-06-10 1999-05-04 Murex Securities, Ltd. One number intelligent call processing system
JP3106994B2 (ja) * 1997-02-21 2000-11-06 日本電気株式会社 住所読み取り装置
JP3246432B2 (ja) * 1998-02-10 2002-01-15 株式会社日立製作所 宛名読取り装置および郵便物等区分機
US6363392B1 (en) * 1998-10-16 2002-03-26 Vicinity Corporation Method and system for providing a web-sharable personal database
US6701307B2 (en) * 1998-10-28 2004-03-02 Microsoft Corporation Method and apparatus of expanding web searching capabilities
US6549892B1 (en) * 1999-05-21 2003-04-15 Pitney Bowes Inc. System for delivering mail
US6539098B1 (en) * 1999-09-24 2003-03-25 Mailcode Inc. Mail processing systems and methods
US20010042055A1 (en) * 2000-02-07 2001-11-15 Jan Didriksen Parcel self-servicing machine
US6360001B1 (en) * 2000-05-10 2002-03-19 International Business Machines Corporation Automatic location of address information on parcels sent by mass mailers
US6373012B1 (en) * 2000-09-15 2002-04-16 Lockheed Martin Corporation Method and apparatus for facilitating custom sorting of mail items and improved search techniques usable therewith
US6575376B2 (en) * 2001-02-16 2003-06-10 Sybase, Inc. System with improved methodology for providing international address validation

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10010241C1 (de) * 2000-03-02 2001-03-01 Siemens Ag Verfahren und Vorrichtung zum Lesen der Adressen von Sendungen

Also Published As

Publication number Publication date
EP1241590B1 (de) 2005-11-09
US6970868B2 (en) 2005-11-29
EP1241590A1 (de) 2002-09-18
US20020133372A1 (en) 2002-09-19
DE10111885A1 (de) 2002-10-02
DE50204815D1 (de) 2005-12-15

Similar Documents

Publication Publication Date Title
DE19718805C2 (de) Verfahren und Anordnung zum Erkennen von Verteilinformationen
EP1015138B1 (de) Verfahren und anordnung zum erkennen von verteilinformationen auf sendungen
DE10010241C1 (de) Verfahren und Vorrichtung zum Lesen der Adressen von Sendungen
DE19836767C1 (de) Verfahren und Vorrichtung zum Bearbeiten von an den Absender zurückzuschickenden Sendungen
DE60004370T2 (de) Verfahren und gerät zum aktualisieren einer adressendatenbank mit registrierten adressendaten
DE10111885C2 (de) Verfahren zum Ermitteln gültiger Adresskodes
DE19933984C2 (de) Verfahren zur Bildung und/oder Aktualisierung von Wörterbüchern zum automatischen Adreßlesen
Nieswiadomy LSAT scores of economics majors
EP0856176A1 (de) Datenbankmanagementsystem sowie datenübertragungsverfahren
DE4435903A1 (de) Verfahren, EDV-System und Zugriffsfilter zum gebietsorientierten Zugriff auf eine Datenbank
EP0844029A2 (de) Verfahren und Vorrichtung zur Identifizierung von Sendungen
WO2004022253A1 (de) Verfahren und vorrichtung zum lesen der adressen von sendungen
EP1485865B1 (de) Verfahren und vorrichtung zum lesen der adressen von sendungen
DE3128794A1 (de) Verfahren zum auffinden und abgrenzen von buchstaben und buchstabengruppen oder woertern in textbereichen einer vorlage, die ausser textbereichen auch graphik-und/oder bildbereiche enthalten kann.
EP1241613B1 (de) Verfahren zum Ermitteln von Fehlerarten fehlerbehafteter Leseergebnisse
Wadington Unit concept coordinate indexing
EP1159705B1 (de) Verfahren zum lesen von dokumenteintragungen und adressen
WO2007048452A1 (de) Verfahren und vorrichtung zum lesen der adressen von sendungen
DE10064529C1 (de) Verfahren und Vorrichtung zum Lesen von Postkodes von Adressen auf Sendungen
DE102004047934B3 (de) Verfahren zum Sortieren von adressierten Sendungen entsprechend der Zieladresse
EP1229484A1 (de) Verfahren und Vorrichtung zum Lesen von Sendungsadressen mit Postkodes
DE102004040600B3 (de) Verfahren zum Ermitteln von Fehlern in Adressdatenbanken
Guttridge Lord North
DE4304082A1 (de) Verfahren zum verbesserten Erkennen von gedruckten Schriftzeichen
Swartz Survey of the Teaching of Journalism and the Content of Journalism Courses in the Secondary Schools of Oklahoma

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8304 Grant after examination procedure
8364 No opposition during term of opposition
8327 Change in the person/name/address of the patent owner

Owner name: SIEMENS AG, 80333 MUENCHEN, DE

8339 Ceased/non-payment of the annual fee