DE69434620T2 - Verfahren und Gerät zum Herstellen, Indexieren und Anschauen von zusammengefassten Dokumenten - Google Patents
Verfahren und Gerät zum Herstellen, Indexieren und Anschauen von zusammengefassten Dokumenten Download PDFInfo
- Publication number
- DE69434620T2 DE69434620T2 DE69434620T DE69434620T DE69434620T2 DE 69434620 T2 DE69434620 T2 DE 69434620T2 DE 69434620 T DE69434620 T DE 69434620T DE 69434620 T DE69434620 T DE 69434620T DE 69434620 T2 DE69434620 T2 DE 69434620T2
- Authority
- DE
- Germany
- Prior art keywords
- document
- text
- areas
- image
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/313—Selection or weighting of terms for indexing
Description
- Die vorliegende Erfindung bezieht sich auf ein Verfahren und eine Vorrichtung zur Erstellung einer Sammlung indexierter Dokumentenabbilder, wobei die Dokumentenabbilder durch den Index aufgefunden werden können, und auf ein Verfahren und eine Vorrichtung zur schnellen Suche durch Dokumentenabbilder durch Ansehen abstrahierter Strukturansichten der Dokumentenabbilder anstelle der Dokumentenabbilder selbst.
- Seit kurzem sind immer größere Speichergeräte verfügbar, und es ist möglich geworden, Dokumente nicht nur einfach als ASCII-Text, sondern auch als volle naturgetreue Nachbildung des Dokuments zu speichern. Genauer gesagt, ist es heute üblich, ein Dokument in ein computerlesbares Bitmap-Abbild des Dokuments umzuwandeln und das Bitmap-Abbild des Dokuments zu speichern. Entsprechend ist es jetzt möglich, ein Dokument in computerlesbarer Form zu speichern und nicht nur Text, sondern auch Bilder, Line-Art, Graphiken, Tabellen und andere Nicht-Textobjekte im Dokument anzuzeigen, wohingegen die ASCII-Textspeicherung lediglich die Speicherung und Anzeige von Textabschnitten des Dokuments zuließ. Genauso ist es möglich, Dokumente so anzuzeigen und zu speichern, dass Textattribute wie Schriftgröße, Schriftart, Position, oder dergleichen erhalten bleiben.
- Trotz dieser Fortschritte ist es jedoch noch immer schwierig, die Dokumentenabbilder rasch im Computerspeicher aufzufinden und die computerangezeigten Dokumentenabbilder rasch durchzugehen, beispielsweise in der Situation eines Computeranwenders, der viele Dokumentenabbilder auffindet und diese Dokumentenabbilder durchsucht, um ein bestimmtes Dokument zu finden. Diese Schwierigkeiten sind durch mindestens zwei Einschränkungen begründet. Erstens beschränken die momentanen Bandbreiteneinschränkungen in Computersystemen die Geschwindigkeit, mit der Dokumente im Speicher aufgefunden und angezeigt werden können. Bei einer Auflösung von 300 Punkten pro Zoll (dpi) (120 Punkte pro cm) erfordert ein normales 8½-auf-11-Zoll- (21,6-auf-27,9-cm-) Dokument in Schwarzweiß ungefähr 8,4 Millionen Bits zur Speicherung eines vollen Dokumentenabbilds. Die Hinzufügung von Halbtönen (Graustufen) oder Farbe zum Abbild oder die Erhöhung der Auflösung, mit der das Abbild gespeichert wird, kann den Speicherbedarf mit Leichtigkeit um viele Zehn Millionen Bits erhöhen. Die zur Auffindung dieser Bits im Speicher und zur Erstellung und Anzeige des sich daraus ergebenden Abbilds erforderliche Zeit ist selbst mit einer modernen Hochgeschwindigkeits-Computerausstattung nicht zu vernachlässigen. Die Zeit wird in Situationen, in denen ein Dokumentenabbild im Speicher eines ersten Computers aufgefunden und zum Beispiel über Modem an einen zweiten Computer zur Anzeige auf dem zweiten Computer elektronisch übertragen wird, noch weiter verlängert.
- Zweitens, selbst wenn einem Anwender ein volles Dokumentenabbild angezeigt wird, gibt es üblicherweise zu viele Informationen für den Durchschnittsanwender, um sie rasch zu verstehen. Viele der dem Anwender angezeigten Informationen sind für die Anfrage des Anwenders nicht relevant, und viel Zeit wird mit der Anzeige nichtrelevanter Informationen verschwendet, und das Vorhandensein dieser nichtrelevanten Informationen kann den Anwender bei seinem Versuch bremsen, für seine Anfrage relevante Informationen zu lokalisieren und zu verstehen.
- Außerdem kann sich das einfache Auffinden passender Dokumente aus einer großen Sammlung zur Darstellung dem Anwender gegenüber wegen der immensen zu durchsuchenden Informationsmenge als schwierig erweisen. Übliche Systeme zur Dokumentenauffindung verlassen sich üblicherweise auf die Erstellung eines Textindex, durch den Textdokumente aufgefunden werden können. Bei Dokumentenabbildern (im Gegensatz zu Textdokumenten) wurde vorgeschlagen, die Dokumentenabbilder der optischen Zeichenerkennungs-Verarbeitung (engl. optical character recognition, „OCR processing") zu unterziehen und den resultierenden Text zu indexieren. Systeme, wie das im US-Patent 5.109.439 von Froessl vorgeschlagene, schlagen vor, dass es lediglich erforderlich ist, bestimmte Gebiete des Dokuments mit OCR zu verarbeiten, um den Indexierungsvorgang zu vereinfachen, aber nichtsdestotrotz hat sich zuvor die Erstellung eines angemessenen Index für das Auffinden von Dokumentenabbildern als schwierig erwiesen.
- Der in „Computer", Ausgabe 25, Nr.7 im Juli 1992 in Los Alamitos, USA, auf den Seiten 10–22 veröffentlichte Artikel „A Prototype Document Image Analysis System for Technical Journals" von G. Nagy u.a. offenbart ein System zur Abbildauffindung zur Verwendung beim Zugriff auf eine Bibliothek mit Dokumenten, beispielsweise technische Zeitschriften, die ein vorbestimmtes Seitenformat aufweisen. Damit ein Anwender die Dokumente durchgehen kann, werden Textteile durch die Verwendung von OCR und regelbasierten Entscheidungen erkannt und angezeigt.
- Der Erfindung liegt die Überwindung der vorstehend beschriebenen Schwierigkeiten als Aufgabe zugrunde.
- Gemäß einer Ausgestaltung der Erfindung wird ein System zum schnellen Blättern in Dokumentenabbildern bereitgestellt, bei dem nicht das volle Dokumentenabbild, sondern lediglich eine abstrahierte Strukturansicht des Dokumentenabbilds angezeigt wird. Genauer gesagt, enthält die Strukturansicht des Dokumentenabbilds benannte Objekte wie „Titel", „Text", „Tabelle", „Line-Art" bzw. Strichzeichnung, „Halbton" und ähnliche üblicherweise in Dokumenten vorzufindende Objekte, und diese Objekte werden dem Anwender in einem abstrahierten strukturierten Layout zur Darstellung angezeigt, das für das volle Dokumentenabbild repräsentativ ist. Die Abstraktionsebene, und wie das Dokument auf der Anzeige wiedergegeben wird, kann vom Anwender definiert werden. Dadurch ist es dem Anwender möglich, eine hohe Abstraktionsebene zu spezifizieren, in der lediglich benannte Objekte im passenden Layout angezeigt werden. Desgleichen ist es dem Anwender auch möglich, eine niedrigere Abstraktionsebene zu spezifizieren, in der lediglich spezifische Objekttypen, wie Titel, angezeigt werden. Es ist dem Anwender auch möglich, anzugeben, dass Textobjekte als ASCII-Zeichen anstelle des Originalabbilds des Texts angezeigt werden sollen. Durch ledigliche Anzeige abstrahierter Strukturansichten von Dokumentenabbildern anstelle der vollen Dokumentenabbilder und dadurch, dass dem Anwendenden die Angabe der Abstraktionsebene gestattet wird, ist es möglich, Dokumentenabbilder rasch aufzufinden, anzuzeigen und dem Anwender die Informationen in einem rasch zu verstehenden Format darzustellen.
- Gemäß der ersten Ausgestaltung der vorliegenden Erfindung wird Verfahren zur Anzeige von Dokumenten, mit den Schritten Bereitstellen eines Abbildes eines Dokuments, Anlegen eines Auffindungsindex durch ein Verfahren, das die Schritte aufweist, Verarbeiten des Abbildes des Dokuments zur Identifikation von Textbereichen im Dokument und Nicht-Textbereichen im Dokument auf Basis regelbasierter Entscheidungen, und Umwandeln des Abbildes des Dokuments innerhalb von Textbereichen in Text, gekennzeichnet durch die Schritte Bestimmen eines Bereichstyps für jeden Textbereich im Dokument unter Verwendung regelbasierter Entscheidungen, die automatisch auf das Abbild des Textbereichs ohne Rücksicht auf die Position des Textbereichs im Dokument und ohne Rücksicht auf ein vorbestimmtes Format für das Dokument angewendet werden, wobei der Bereichstyp ist einer der zahlreichen verschiedenen vordefinierten Bereichstypen ist, die durch Regeln umspannt werden, Indexieren des umgewandelten Texts, um Auffinden durch Bezugnahme auf den umgewandelten Text zu ermöglichen, Indexieren des bestimmten Bereichstyps, um das Auffinden durch Bezugnahme auf einen der vorbestimmten Bereichstypen zu ermöglichen, Speichern des Abbildes des Dokuments, damit das gespeicherte Dokumentenabbild durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage in den indexierten Bereichstypen erscheint, aufgefunden werden kann, zum Bereitstellen von entsprechenden Zusammensetzungsinformationen für das Dokument, wobei die Zusammensetzungsinformationen für jeden der bis zu zahlreichen Bereiche des Dokuments Bereichstypinformationen enthalten, Anzeigen einer abstrahierten Ansicht des Dokuments durch Verwendung der Zusammensetzungsinformationen und Ersetzen zumindest eines Bereichs der abstrahierten Ansicht durch ein entsprechendes Abbild im Dokument innerhalb der abstrahierten Ansicht selbst, so dass Zusammensetzungsinformationen und Abbildinformationen gemischt angezeigt werden.
- Gemäß einer zweiten Ausgestaltung der Erfindung wird eine Anzeigevorrichtung zur Dokumentenanzeige bereitgestellt mit einer Einrichtung zur Bereitstellung eines Abbildes eines Dokuments und einer Vorrichtung zum Anlegen eines Auffindeindex, die Vorrichtung zum Anlegen eines Auffindeindex mit einer erste Speichereinrichtung zur Speicherung eines Dokumentenabbildes und eines Auffindeindex, einer zweiten Speichereinrichtung zur Speicherung der Verarbeitungsschritte zur Verarbeitung des Dokumentenabbildes, um Textbereiche im Dokument und Nicht-Textbereiche im Dokument auf der Grundlage regelbasierter Entscheidungen zu identifizieren und um das Dokumentenabbild in Textbereichen in Text umzuwandeln, einer Verarbeitungseinrichtung zur Ausführung der im zweiten Speicher gespeicherten Verarbeitungsschritte, gekennzeichnet durch den Prozessor, der zur Ausführung von Verarbeitungsschritten eingerichtet wurde, mit einer Bestimmung eines Bereichstyps für jeden Textbereich im Dokument unter Verwendung regelbasierter Entscheidungen, die automatisch auf das Abbild des Textbereichs ohne Rücksicht auf die Position des Textbereichs im Dokument und ohne Rücksicht auf ein vorbestimmtes Format für das Dokument angewendet werden, wobei der Bereichstyp einer der Vielzahl an verschiedenen vordefinierten Bereichstypen ist, die durch Regeln umspannt werden, einer Indexierung des umgewandelten Texts, um Auffinden durch Bezugnahme auf den umgewandelten Text zu ermöglichen, einer Indexierung des bestimmten Bereichstyps, um Auffinden durch Bezugnahme auf einen der vorbestimmten Bereichstypen zu ermöglichen, einem Einrichten des ersten Speichers zur Speicherung des Dokumentenabbildes, so dass das gespeicherte Dokumentenabbild durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage in den indexierten Bereichstypen erscheint, aufgefunden werden kann und einer Bereitstellung entsprechender Zusammensetzungsinformationen für das Dokument, wobei die Zusammensetzungsinformationen Bereichstypeninformationen für jede der bis zu einer Vielzahl von Bereichen im Dokument enthält, einer Anzeigevorrichtung, weiterhin mit einer Anzeigeeinrichtung zur abstrahierten Ansicht des Dokuments unter Verwendung der Zusammensetzungsinformationen und einer Ersetzungseinrichtung zur Ersetzung zumindest eines Bereichs der abstrahierten Ansicht durch ein entsprechendes Abbild im Dokument innerhalb der abstrahierten Ansicht selbst, so dass Zusammensetzungsinformationen und Abbildinformationen gemischt angezeigt werden.
- Gemäß einer dritten Ausgestaltung der vorliegenden Erfindung wird ein Datenspeichermedium bereitgestellt zur Zuführung des Informationsinhalts einer Vielzahl von Dokumenten und weiterhin zur Zuführung des durch das Verfahren gemäß der ersten Ausgestaltung erstellten Auffindeindex, so dass die Gesamtstruktur eines Dokuments für die Anzeige ohne die Auffindung des gesamten Informationsinhalts des Dokuments aufgefunden werden kann.
- Gemäß einer vierten Ausgestaltung der vorliegenden Erfindung gibt es ein Computerprogramm, das computerausführbare Befehle zur Durchführung aller Schritte eines jeden Verfahrens gemäß dem ersten Ausgestaltung der Erfindung enthält.
- Gemäß einer fünften Ausgestaltung der vorliegenden Erfindung gibt es ein computerlesbares Speichermedium zur Speicherung eines Computerprogramms gemäß dem vierten Ausgestaltung der vorliegenden Erfindung.
- Gemäß einer sechsten Ausgestaltung der vorliegenden Erfindung gibt es ein Signal zur Zuführung des Informationsinhalts einer Vielzahl von Dokumenten und ferner zur Zuführung des durch das Verfahren gemäß dem im ersten Ausgestaltung der vorliegenden Erfindung erstellten Auffindeindex, so dass die Gesamtstruktur eines Dokuments für die Anzeige ohne die Auffindung des gesamten Informationsinhalts des Dokuments aufgefunden werden kann.
- Diese Kurzfassung wurde zum schnellen Verständnis der Natur der Erfindung bereitgestellt. Ein vollständigeres Verständnis der Erfindung lässt sich durch Bezugnahme auf die nachstehende ausführliche Beschreibung des bevorzugten Ausführungsbeispiels der Erfindung in Verbindung mit der beiliegenden Zeichnung gewinnen.
- Kurzbeschreibung der Zeichnung
- Es zeigen:
-
1 eine perspektivische Ansicht der äußeren Erscheinung einer erfindungsgemäßen Vorrichtung, und2 ein Blockschaltbild der generellen Funktionsweise der Vorrichtung gemäß1 , -
3 eine vollständige Darstellung der generellen Funktionsweise der Vorrichtung gemäß1 , -
4 eine vollständige Darstellung der erfindungsgemäßen Eingabe und Indexierung von Dokumenten, -
5 eine Ansicht eines repräsentativen Eingabedokuments, -
6 eine Ansicht zur Beschreibung, wie verschiedene innerhalb des Originaldokuments identifizierte Blöcke gespeichert werden, -
7 ein Ablaufdiagramm zur Erklärung der erfindungsgemäßen Dokumentenanzeige, -
8 bis10 Ansichten einer repräsentativen Anzeige eines abstrahierten Dokuments, wobei die9 und10 Ansichten von Erweiterungen ausgewählter Gebiete des abstrahierten Dokuments sind. - Ausführliche Beschreibung des bevorzugten Ausführungsbeispiels
- Die
1 und2 zeigen eine erfindungsgemäße Vorrichtung. - Wie in diesen Figuren gezeigt, bezeichnet das Bezugszeichen
10 eine Personal-Computer-Ausstattung, wie einen IBM-PC oder PC-kompatiblen Computer. Die Computer-Ausstattung enthält eine CPU11 (zentrale Verarbeitungseinheit, „central processing unit"), wie z.B. einen 80386 Prozessor, der gespeicherte Programmbefehle, wie anwendergewählte Anwendungsprogramme ausführt, die im RAM12 (Speicher mit wahlfreiem Zugriff, „random access memory") gespeichert sind oder spezialisierte Funktionen wie Systemhochfahrprogramme oder ein BIOS, die im ROM14 (Festwertspeicher, „read only memory") gespeichert sind. Die Computer-Ausstattung10 enthält ferner eine Schnittstelle zum lokalen Netzwerk15 , die eine Schnittstelle zu einem lokalen Netzwerk16 bereitstellt, wodurch die Computer-Ausstattung10 auf Dateien, wie Dokumentdateien auf einem entfernten Dateien-Server zugreifen oder Dateien zum Fernausdruck versenden oder entfernten Geräten Zugriff auf Dokumentenabbilder auf der Ausstattung10 erlauben kann, oder auf andere Weise mit einem lokalen Netzwerk gemäß bekannten Techniken, wie durch Dateienaustausch oder durch Senden oder Empfangen elektronischer Post, interagieren kann. - Die Computer-Ausstattung
10 enthält ferner einen Monitor17 zur Anzeige grafischer Abbilder und eine Tastatur19 bzw. Maus19 , um dem Anwender die Auswahl von Gebieten auf Monitor17 und die Eingabe von Informationen zu ermöglichen. - Ein Massenspeicher
20 , wie eine Festplatte oder ein Diskettenlaufwerk, ist zum Zugriff durch die CPU11 angeschlossen. Der Massenspeicher20 enthält typischerweise gespeicherte Programmbefehlsfolgen, wie eine Befehlsfolge zum erfindungsgemäßen Abtasten, Indexieren, Auffinden und Anzeigen von Dokumenten, sowie weitere gespeicherte Programmbefehlsfolgen zur Ausführung von wortverarbeitenden Anwendungsprogrammen, optischen Zeichenerkennungs- (OCR-) Programmen, Anwendungsprogrammen zur Blockauswahl, Tabellenkalkulation und weitere Informationen und Datenverarbeitungsprogramme. Der Massenspeicher20 enthält ferner Dokumentenindextabellen, die Indexinformationen enthalten, durch die sowohl Dokumente als auch Bitmap-Abbilder von Dokumenten, Dokumentstrukturen, und ASCII-Text für Textgebiete des Dokuments aufgefunden werden können. Weitere Daten können nach Wunsch des Anwenders auf dem Massenspeicher20 gespeichert werden. - Ein Modem
21 , eine Faxschnittstelle22 und eine Sprachtelefonschnittstelle24 werden bereitgestellt, so dass sich die CPU an eine normale Telefonleitung25 anschließen kann. Sowohl dem Modem21 , als auch der Faxschnittstelle22 und der Sprachtelefonschnittstelle24 wird ein Zugriff auf die Telefonleitung25 über einen Telefonleitungsschalter26 gegeben, der unter Steuerung durch die CPU11 eingeschaltet wird, um die Telefonleitung25 an entweder das Modem21 , die Faxschnittstelle22 oder die Sprachtelefonschnittstelle24 , passend zu den auf der Telefonleitung gesendeten und empfangenen Daten, anzuschließen. Dadurch kann die CPU11 binäre Daten, wie ASCII-Textdateien oder Dokumentenabbild-Dateien, über das Modem21 senden und empfangen, und kann sie durch einen entfernten Computer über das Modem21 gesteuert werden, kann sie Faxnachrichten über die Faxschnittstelle22 senden und empfangen, und sie kann auf einer normalen Telefonleitung über die Sprachtelefonschnittstelle24 interagieren. Im Hinblick darauf ist für die Telefonschnittstelle24 ein DTMF-Dekoder24A bereitgestellt, um Töne auf der Telefonleitung25 zu dekodieren, die Anwendertastenbetätigungen auf einem Telefonbedienfeld entsprechen. Gemäß den im Massenspeicher20 gespeicherten Programmbefehlsfolgen werden die decodierten Töne durch die CPU11 in Anwenderbefehle übersetzt und diese Anwenderbefehle ausgeführt, um vorbestimmte Maßnahmen gemäß den Anwendertastenbetätigungen auf dem Telefonbedienfeld zu ergreifen. - Ein üblicher Text-zu-Sprache-Wandler
27 ist mit der CPU11 verbunden. Der Text-zu-Sprache-Wandler27 übersetzt ihm zugesendete Textzeilen und wandelt diese Textzeichenketten in Audio-Sprachinformationen um. Der Text-Zu-Sprache-Wandler27 führt die Audio-Sprachinformationen entweder einem Lautsprecher28 zur sprachlichen Mitteilung an einen lokalen Computeranwender zu oder er führt die Audio-Sprachinformationen der Sprachtelefonschnittstelle24 zur sprachlichen Mitteilung über übliche Sprachtelefonleitungen zu. - Auch ein MIDI-(MIDI-Protokoll, „Musical Instrument Digital Interface") Synthesizer
30 ist mit der CPU11 verbunden, und übersetzt MIDI-Musikbefehle von der CPU11 , indem er diese MIDI-Musikbefehle in Audiosignalverläufe umwandelt. Im Gegenzug werden die Audiosignalverläufe über den Lautsprecher28 abgespielt oder der Sprachtelefonschnittstelle24 zum Abspielen über eine übliche Sprachtelefonleitung zugeführt. - Eine Abtastvorrichtung
31 arbeitet zur Abtastung von auf Papierblättern gedruckten Originaldokumenten, und zur Umwandlung dieser Originaldokumente in eine bitweise computerlesbare Darstellung dieses Dokuments. Die Abtastvorrichtung31 kann eine einfache Schwarzweiß-Abtastvorrichtung sein, vorzugsweise weist die Abtastvorrichtung31 aber wenigstens Halbton-(Graustufen-) Verarbeitungsfähigkeit und/oder Farbverarbeitungsfähigkeit auf. - Ein Drucker
32 ist zur Bildung von Dokumentenabbildern unter der Steuerung durch die CPU11 bereitgestellt. Der Drucker32 kann ein üblicher Schwarzweiß-Drucker sein, vorzugsweise weist der Drucker32 aber Halbton- (Graustufen-) und/oder Farbfähigkeit auf. - Eine CD-ROM
34 , wie ein optische Disk, ist zum Zugriff durch die CPU11 angeschlossen. Die CD-ROM34 funktioniert zur Erweiterung des Speichers im Massenspeicher20 und enthält zusätzliche Informationen in bezug auf Dokumentenindizes, Dokumentenabbilder und Dokumentenstruktur. Es ist auch möglich, ein optisches Einfach-Schreib-/Vielfach-Lese- (WORM, „wirte-once-read-many") Gerät oder eine übliche optische Schreib-/Lese-Vorrichtung bereitzustellen, um die Speicherfähigkeit noch weiter zu erweitern. Zusätzlich kann die CPU11 über das lokale Netzwerk16 auf auf entfernten Orten von Dateien-Servern gespeicherte Dokumentenindizes und Dokumentenabbilder zugreifen, und über Modem21 kann die CPU11 auf Dokumentenindizes und Dokumentenabbilder, die in zentralisierten Datenbankorten gespeichert sind, über eine übliche Sprachtelefonleitung zugreifen. -
3 ist ein Ablaufdiagramm, das die generelle Funktionsweise der Vorrichtung gemäß den1 und2 zeigt. Die in3 gezeigten Verarbeitungsschritte werden von der CPU11 gemäß den im Massenspeicher20 gespeicherten und aus dem RAM14 ausgeführten Programmbefehlsfolgen ausgeführt. - In Schritt S301 zeigt die CPU
11 ein Hauptauswahlmenü auf Monitor17 an und ermöglicht dem Anwender die Auswahl eines der Menüpunkte. Hat der Anwender in Schritt S302 die Eingabe von Dokumenten ausgewählt, dann geht der Ablauf zu Schritt S303 über, in dem die Verarbeitung von Dokumentenabbildern ausgeführt wird, wonach der Ablauf zu Schritt S301 zurückkehrt. Wählt der Anwender keine Dokumenteneingabe aus, sondern stattdessen die Dokumentenauffindung (Schritt S304), dann geht der Ablauf zu Schritt S305 über, in dem die Auffindeverarbeitung von Dokumenten ausgeführt wird, wonach der Ablauf zu Schritt S301 zurückkehrt. Wählt der Anwender keine Dokumentenauffindung aus, sondern stattdessen die Dokumentenanzeige (Schritt S306), dann geht der Ablauf zu Schritt S307 über, in dem die Anzeigeverarbeitung von Dokumenten ausgeführt wird, wonach der Ablauf zu Schritt S301 zurückkehrt. Jede dieser Verarbeitungen ist nachstehend ausführlich beschrieben. - Obwohl die in
3 gezeigte Ablaufverarbeitung den Eindruck erweckt, kontinuierlich und der Reihe nach ausgeführt zu werden, soll verstanden werden, dass die Verarbeitungen zu deutlich verschiedenen Zeiten, in verschiedener Reihenfolge, und sogar durch verschiedene Geräte ausgeführt werden können. Es ist beispielsweise möglich, dass eine erste Maschine Dokumente eingibt, und diese Dokumente zur Auffindung und Anzeige durch eine unterschiedliche Maschine speichert. Ebenso ist es möglich, dass eine Maschine Dokumente auffindet, und sie beispielsweise über Modem21 an eine andere Maschine zur Anzeige auf dieser unterschiedlichen Maschine übermittelt. -
4 ist ein ausführliches Ablaufdiagramm, das die Eingabeverarbeitung von Dokumenten gemäß Schritt S303 gemäß3 zeigt. - In Schritt S401 veranlasst die CPU
11 die Abtastvorrichtung31 , ein in die Abtastvorrichtung31 eingeführtes Dokument abzutasten, um so das Originaldokument in ein computerlesbares Bitmap-Abbild dieses Dokuments umzuwandeln. Das Bitmap-Abbild kann vorübergehend im RAM14 zur Weiterverarbeitung gespeichert werden. - In Schritt S402 leitet die CPU
11 Strukturinformationen her, die das Layout von Objekten innerhalb des Dokuments betreffen. Genauer gesagt, unterzieht die CPU11 das Bitmap-Dokumentenabbild Blockauswahltechniken, wie die in der anhängigen US-Patentanmeldung Nr. 07/873,012 beschriebenen, um ein Dokumentenabbild in einen allgemeinen Objektsatz zu zerlegen. Derartige Blockauswahltechniken können, unter Verwendung regelbasierter Entscheidungen, verwandte Bereiche oder Gebiete innerhalb des Dokuments identifizieren und können die Abbildtypen innerhalb dieser Bereiche bestimmen. Beispielsweise verarbeitet die CPU11 unter Verwendung von Blockauswahltechniken, wie die in der vorstehend genannten US-Patentanmeldung 07/873.012 beschriebenen, die abgetasteten, im RAM14 gespeicherten Bitmap-Abbilder, um verwandte Bereiche im Abbild zu identifizieren. Dann identifiziert die CPU11 den Bereichstyp, beispielsweise ob ein Bereich ein Titelbereich, ein Textbereich, ein Absatzbereich, ein Tabellenbereich oder ein Line-Art-Abbildbereich ist, wie eine Grafik, ein Halbton-Abbildbereich, ein Farb-Abbildbereich oder dergleichen. -
5 zeigt Bereiche, die durch Verarbeitung in einem Dokumentenabbild gemäß den Verarbeitungsschritten in Schritt402 identifiziert worden sind.5 ist ein repräsentatives, aus Seite40 eines Zeitschriftenartikels bestehendes Dokumentenabbild. Wie in5 gezeigt, enthält die Seite40 Titelbereiche, wie die Bereiche41 ,42 und47 sowie Textbereiche, wie die Bereiche43 ,44 und48 . Die Seite40 enthält ebenso Line-Art-Bereiche45 , Tabellenbereiche49 und Halbtonobjektbereiche46 . Weitere Bereichstypen sind möglich. Gemäß der Verarbeitung in Schritt S402 identifiziert die CPU11 die verwandten Bereiche im Dokument und bestimmt den Abbildtyp in jedem der Bereiche. In5 wurde jeder Bereich schematisch mit einem umbeschriebenen Rechteck bezeichnet. - Gemäß
4 geht der Ablauf zu Schritt S403 über, in dem die CPU11 den Dokumententyp identifiziert. Genauer gesagt, weisen viele Dokumente relative Standardstrukturen auf. Ein Geschäftsbrief beispielsweise enthält quasi immer einen Bereich mit Briefkopf des Unternehmens (der in Schritt S402 als Line-Art-Abbildsgebiet identifiziert werden wird), einen Bereich mit Datum und Empfänger (der in Schritt S402 als getrenntes, aber angrenzendes Textgebiet identifiziert werden wird), eine Grußformel, Textkörper- und Abschlussbereiche (die in Schritt S402 als Line-Art-Abbildsgebiete identifiziert werden werden) und eine Unterschrift (die als Line-Art-Abbildsgebiet identifiziert werden wird). Die CPU11 speichert Vorlagen dieser Standarddokumenttypen und vergleicht in Schritt S403 die in Schritt S402 hergeleiteten Strukturinformationen mit diesen gespeicherten Vorlagen. Ist eine Übereinstimmung zwischen der gespeicherten Vorlage und den in Schritt S402 hergeleiteten Strukturinformationen gefunden, so ordnet die CPU11 den assoziierten Dokumententyp dem in RAM14 gespeicherten Dokumentenabbild zu. - In Schritt S404 korreliert die CPU
11 verwandte Bereiche innerhalb des Dokuments. Genauer gesagt, gibt es oft Bereiche innerhalb eines Dokuments, die zusammen betrachtet werden sollten, wie die Beschriftung für eine Figur oder die Fußnote für einen Textblock. Beispielsweise ist unter Bezugnahme auf5 der Textbereich48 mit dem Titel47 , und Tabellenbereich49 mit Titel50 verwandt. Die CPU11 korreliert verwandte Bereiche unter Verwendung regelbasierter Entscheidungsverarbeitung. - In Schritt S405 unterzieht die CPU
11 festgelegte Dokumentenbereiche der OCR-Verarbeitung als Vorbereitung auf die Erstellung eines Auffindeindex für das Dokument. Genauer gesagt, erstellt die CPU11 einen Auffindeindex aus den Textbereichen innerhalb des Dokuments, um das Dokumentenabbild auf der Grundlage eines wortbasierten Auffindesystems auffinden zu können. Es ist möglich, alle in Schritt S402 identifizierten Textbereiche einer OCR-Verarbeitung zu unterziehen und den Index auf der Grundlage des resultierenden Textes zu bilden, aber vorzugsweise bietet die CPU11 dem Anwender eine wählbare Indexebene an. Genauer gesagt, bietet die CPU11 dem Anwender die Option zur Auswahl der Indexebene gemäß folgender Ebenen an:
Ebene 1: Lediglich Titelbereiche
Ebene 2: Erste Zeile der Textbereiche
Ebene 3: auf Grafiken bezogene Textbeschriftungen
Ebene 4: Voller Text - Wählt der Anwender Ebene 1 aus („Lediglich Titel"), dann unterzieht die CPU
11 lediglich die Titelbereiche einer OCR-Verarbeitung. Der resultierende Text aus den Titelbereichen wird für einen Auffindeindex bereitgestellt, um das Auffinden des Dokuments zu ermöglichen, wenn Worte im Titel mit einer angegebenen Suchanfrage übereinstimmen. Gibt der Anwender auf gleiche Weise Indexebene 2 („Erste Zeile der Textbereiche") an, dann unterzieht die CPU11 sowohl Titelbereiche, als auch lediglich die erste Zeile eines jeden Textbereichs einer OCR-Verarbeitung und erstellt einen Auffindeindex auf der Grundlage des resultierenden Textes. Ist Indexebene 3 ausgewählt („auf Grafiken bezogene Textbeschriftungen"), dann unterzieht die CPU11 die Elemente in den Ebenen 1 und 2 sowie die auf Grafiken bezogene Textbereiche, wie sie in den in Schritt S404 gewonnenen Korrelationen spezifiziert sind, einer OCR-Verarbeitung. Gibt der Anwender schließlich Indexebene 4 („Voller Text") an, dann werden sowohl Titelbereiche als auch die vollen, wo auch immer lokalisierten Textbereiche der OCR-Verarbeitung unterzogen und der resultierende Text für eine Bildung des Auffindeindex bereitgestellt. Es ist möglich, weitere Ebenen der Indexierung mit einzubeziehen. - In Schritt S406 werden die aus der OCR-Verarbeitung gewonnenen ASCII-Textzeichen indiziert, und der Dokumentenauffindeindex passend aktualisiert. Zusätzlich zur Indexierung der ASCII-Textworte wird auch ein Flag indexiert, das den Objekttyp anzeigt, aus dem das Wort gewonnen wurde, das heißt Titel, Text, Beschriftung oder dergleichen. Das Flag kann als Teil des Auffindevorgangs verwendet werden, um Dokumente auf der Grundlage des Auftretens des Wortes in bestimmten Gebieten des Dokuments aufzufinden.
- In Schritt S407 speichert die CPU
11 die in Schritt S402 hergeleiteten und in Schritt S406 korrelierten Strukturinformationen.6 ist eine repräsentative Ansicht, wie die Strukturinformationen gespeichert werden. Wie in6 gezeigt, enthalten die Strukturinformation für jedes Dokument eine Dokumentenkennung51 , die die selbe Kennung wie die der dem vollen Dokument zugeordneten ist, und durch die es möglich ist, das volle Dokumentenabbild aufzufinden. In Gebiet52 wird der in Schritt S402 hergeleitete Dokumententyp gespeichert. Bei53 werden alle Strukturinformationen für das Dokument und sein Layout innerhalb des Dokuments gespeichert. Wie bei53 gezeigt, wird, für jeden in Schritt S402 identifizierten Bereich, durch die CPU11 eine Bereichskennung, ein Bereichstyp, rechtwinklige, die Position des Bereichs auf der Seite spezifizierende Koordinaten (hier• die linken oberen Eckkoordinaten („upper left corner", ULC) und die rechten unteren Eckkoordinaten („lower right corner", LRC)) und alle in Schritt S406 identifizierten, verwandten Bereiche gespeichert. Gemäß6 entspricht Bereich 1 dem Bereich41 gemäß5 , und enthält, wie in6 gezeigt, einen Typ „Titel", obere linke Koordinaten von <0,0>, untere rechte Koordinaten von <5,40> und keine verwandten Bereiche. Die übrigen, in6 gezeigten Bereiche folgen in gleicher Weise. - Es können auch Bereichsattribute
54 gespeichert werden, wie beispielsweise eine Schriftartauswahl und eine Schriftgröße, wie in6 gezeigt. Es können auch andere Attribute gespeichert werden, wie die Anzahl der Textzeilen, die Anzahl der Absätze oder dergleichen. - In Schritt S408 wird das Dokumentenabbild gespeichert, vorzugsweise mit OCR-verarbeitetem Dokumententext. Der Dokumententext wird in dem Fall gespeichert, dass eine schnelle Anzeige von ASCII-Textzeichen anstelle der langsameren Anzeige von Abbildern der Textbereiche gewünscht ist. Entsprechend hat die CPU
11 am Ende von Schritt S408 die Dokumenten-Eingabeverarbeitung abgeschlossen und einen text-suchbaren Index für das Dokument, die Dokumentenstruktur, und OCR-verarbeiteten Text der Textbereiche des Dokuments gespeichert, falls gewünscht. - Gemäß
3 geht der Ablauf zu Schritt S305 zur Dokumenten-Auffindungsverarbeitung über, wenn der Anwender eine Dokumentenauffindung auswählt (Schritt S304). Die im bevorzugten Ausführungsbeispiel der Erfindung verwendete Dokumenten-Auffindungsverarbeitung ist ein wortbasiertes Auffinde- und Suchsystem auf der Grundlage einer durch den Anwender angegebenen Suchanfrage. Eine derartige Anfrage kann durch eine logische Folge angegeben sein, die in jedem Dokument gefunden werden muss (eine „boolesche" Suche), oder kann durch ein natürlich-sprachbasiertes Anfragesystem spezifiziert sein. Die Anfrage kann direkt durch einen lokalen Anwender, aus der Ferne durch einen Anwender mit Sprach- oder DTMF-Telefonzugriff oder durch von einem entfernten Computer über Modem oder LAN gegebene Befehle erfolgen. - Der Anwender kann auch angeben, dass Dokumente auf der Grundlage des Auftretens eines Worts in bestimmten Dokumentenbereichen, wie Titelbereiche oder Beschriftungen, aufgefunden werden. Mit der Anfrage übereinstimmende Dokumente werden aufgefunden, und es werden ihnen Wertungen auf der Grundlage des Grads der Übereinstimmung des Dokuments mit der Anfrage zugeordnet. Höhere Wertungen können für das Auftreten von Worten in bestimmten Dokumentenbereichen zugeordnet werden, wobei die Wertung genauso wie die vorstehende Auswahl der Indexierungsebene gewichtet wird. Dadurch kann beispielsweise dem Auftreten von Worten in Titelbereichen eine höhere Wertung zugeordnet werden als dem Auftreten von Worten in Textbereichen. Ist eine Vielzahl von Dokumenten aufgefunden, dann werden sie in der Reihenfolge ihrer Wertung angezeigt.
- Wählt der Anwender die Dokumenten-Anzeigeverarbeitung (Schritt S306), dann geht der Ablauf für die CPU
11 zu Schritt S307 über, um die Dokumenten-Anzeigeverarbeitung auszuführen.7 ist ein ausführliches Ablaufdiagramm, das die Dokumenten-Anzeigeverarbeitung zeigt. - In Schritt S701 ermöglicht die CPU
11 dem Anwender die Einstellung von Anzeigeoptionen, unter denen aufgefundene Dokumente angezeigt werden. Genauer gesagt, wählt der Anwender einen von zwei Modi aus, unter dem aufgefundene Dokumente angezeigt werden: voller Dokumentenabbild- oder Blättermodus. Ist der volle Dokumentenabbildmodus ausgewählt, dann werden volle Dokumentenabbilder der aufgefundenen Dokumente angezeigt. Ist der Suchmodus ausgewählt, dann wird lediglich eine abstrahierte Strukturansicht eines jeden Dokuments angezeigt, und dadurch wird dem Anwender ein schnelles Blättern durch alle aufgefundenen Dokumente ermöglicht. Im Suchmodus können drei weitere Parameter durch den Anwender eingestellt werden. Erstens kann der Anwender auswählen, ob ASCII-Textzeichen OCR-verarbeiteter Textbereiche oder Dokumentenabbilder der Textbereiche angezeigt werden sollen. Zweitens kann der Anwender die Abstraktionsebene auswählen, auf der die Strukturansicht angezeigt wird. Neun Abstraktionsebenen sind bei diesem Ausführungsbeispiel der Erfindung möglich, obwohl andere Anordnungen möglich sind:
Ebene 1: Lediglich Struktur
Ebene 2: Titel
Ebene 3: Auffindeparameter
Ebene 4: Erste Textzeile
Ebene 5: Voller Text
Ebene 6: Tabellen
Ebene 7: Line-Art
Ebene 8: Halbton
Ebene 9: Farbe - Gemäß der ausgewählten Abstraktionsebene zeigt die CPU
11 Strukturansichten des Dokuments gemischt mit Bereichen voller Dokumentenabbilder an. Ist Abstraktionsebene 1 ausgewählt, wird lediglich eine Struktur angezeigt. Ist aber Abstraktionsebene 2 oder höher ausgewählt, werden Strukturinformationen gemischt mit Bereichen voller Dokumentenabbilder angezeigt. Auf Abstraktionsebene 2 beispielsweise werden die Strukturinformationen gemischt mit Abbildern (oder ASCII-Text, falls ausgewählt) von Titelbereichen des Dokuments angezeigt. Die erforderlichen Abbildbereiche werden aus dem vollen Dokumentenabbild gemäß der mit der Struktur gespeicherten ULC- und LRC-Koordinaten gewonnen. Ist Abstraktionsebene 3 ausgewählt, dann werden die Strukturinformationen gemischt mit Abbildern der Titel (oder ASCII-Text, falls ausgewählt) und mit den Auffindeparametern angezeigt, durch die das Dokument aufgefunden wurde. Auf Abstraktionsebene 4 werden die Strukturinformationen gemischt mit Abbildern der Titelbereiche, Auffindeparametern und der ersten Textzeile der Textabbilder in jedem Textblock angezeigt. Ist eine ASCII-Textanzeige ausgewählt, dann wird wie zuvor der ASCII-Text anstelle der Textabbilder angezeigt. Höhere Abstraktionsebenen zeigen zunehmend mehr und mehr des vollen Dokumentenabbilds gemäß der ausgewählten Abstraktionsebene an. - Zusätzlich zum Abstraktionsebenenparameter kann der Anwender im Suchmodus auch auswählen, ob eine manuell oder automatische Abbildverbesserung zugelassen werden soll. Genauer gesagt, kann bei der manuellen Abbildverbesserung, wenn die Struktur eines aufgefundenen Dokuments angezeigt wird, der Anwender einen bestimmten Bereich des Dokuments, beispielsweise mit einer Maus
19 , anvisieren und von der CPU11 die Ersetzung des angezeigten Bereichs durch das volle Dokumentenabbild anfordern. Ist eine automatische Verbesserung ausgewählt, dann ersetzt die CPU11 automatisch gerade angezeigte Strukturinformationen durch volle Dokumentenabbilder. Die automatische Verbesserung arbeitet während ruhiger Zeitspannen des CPU-Betriebs, das heißt wenn die CPU genügend Bearbeitungszeit aufweist, um das Abbild zu verbessern. Die Verbesserung schreitet in der vorstehend angegebenen Reihenfolge der Abstraktionsebenen voran. Dadurch beginnt die CPU während ruhiger Bearbeitungszeitspannen mit der Ersetzung erstens der Titelbereiche durch volle Abbilder der Titelbereiche, zweitens der Auffindeparameterbereiche durch volle Abbilder der Auffindeparameter, drittens der ersten Zeilen der Textbereiche durch volle Abbilder der ersten Textzeilen, usw. - Nachdem in Schritt S701 die Anzeigeoptionen eingestellt wurden, geht der Ablauf zu Schritt S702 über, in dem die CPU
11 bestimmt, ob der volle Abbildmodus ausgewählt wurde. Wurde der volle Abbildmodus ausgewählt, verzweigt sich der Ablauf zu Schritt S703, in dem volle Abbilder der vollen Abbilder angezeigt werden. - Wurde andererseits der Suchmodus ausgewählt, geht der Ablauf zu Schritt S704 über, in dem die Dokumentenstruktur auf der ausgewählten Abstraktionsebene angezeigt wird. Eine repräsentative Anzeige der Strukturinformationen ist in
8 gezeigt. - In
8 hat der Anwender den Suchmodus und ASCII-Textanzeige bei Abstraktionsebene 2 ausgewählt, das heißt „Titel". Dadurch wird dem Anwender die in8 gezeigte abstrahierte Strukturansicht des Dokuments mit ASCII-Textentsprechungen der Titelbereiche dargereicht. Die übrigen Bereiche werden einfach mit dem Bereichstyp benannt, wie im Bereichstypengebiet gemäß6 angegeben ist. Die Benennung kann durch eine Farbcodierung des Bereichs oder, wie in8 gezeigt, durch Anwendung einer Textmarke erfolgen. Jeder der Bereiche wird durch eine Rechteckform umfahren, deren Koordinaten aus den ULC- und LRC-Koordinaten gemäß6 angegeben werden. Es werden ASCII-Textentsprechungen der Titelbereiche an den entsprechenden ULC- und LRC-Koordinaten angezeigt. Dadurch wird dem Anwender eine abstrahierte Strukturansicht des Dokuments mit auswählbarer Abstraktionsebene dargestellt. Dies ermöglicht dem Anwender die schnelle Suche durch aufgefundene Dokumente, um bestimmte Dokumente von Interesse zu finden. - Der Ablauf geht zu Schritt S705 über, in dem die CPU
11 bestimmt, ob der manuelle Verbesserungsparameter ausgewählt wurde. Wurde der manuelle Verbesserungsparameter nicht ausgewählt, dann verzweigt sich der Ablauf zu Schritt S706, in dem die CPU11 automatisch strukturell angezeigte Bereiche des Dokuments während ruhiger Betriebszeiten der CPU durch die vollen Abbilder (oder ASCII-Text, falls gewählt) dieser Bereiche ersetzt. Wurde unter der Annahme der Verfügbarkeit von genügend ruhiger Rechenzeit der automatische Verbesserungsmodus ausgewählt, dann wird dem Anwender schließlich das volle Dokument dargestellt, da die CPU die strukturell dargestellten Bereiche dieses Dokuments ersetzt. Der Anwender kann zu jedem Zeitpunkt während dieses Vorgangs die Anzeige (Schritt S710) des nächsten aufgefundenen Dokuments auswählen, worauf der Ablauf zu Schritt S702 zurückkehrt, um das nächste aufgefundene Dokument anzuzeigen. - Wurde der manuelle Verbesserungsmodus ausgewählt, dann geht der Ablauf weiter zu Schritt S707, in dem die CPU
11 bestimmt, ob ein Dokumentenbereich vom Anwender anvisiert wurde. Wurde kein Dokumentenbereich vom Anwender anvisiert, tut die CPU11 nichts oder beginnt vorzugsweise mit dem Ersetzen von Strukturbereichen des Dokuments durch volle Dokumentenabbilder, wie in Schritt S708 gezeigt. Wieder kann dieser Vorgang zu jedem Zeitpunkt durch eine Anwenderauswahl des nächsten Dokuments (Schritt S710) unterbrochen werden. - Hat der Anwender andererseits in Schritt S707 einen Bereich zur Ersetzung anvisiert, geht der Ablauf zu Schritt S709 weiter, in dem die CPU
11 das entsprechende Dokumentenabbild aus der Dokumentenabbildsdatei auffindet und den strukturell dargestellten Bereich des angezeigten Dokuments durch das volle Dokumentenabbild ersetzt. Der Anwender hat dadurch, wie in9 gezeigt, das Gebiet54 anvisiert, das ein Textbereich ist. Daraufhin findet die CPU11 das zu dem rechteckigen, durch die ULC- und LRC-Koordinaten umbeschriebenen Gebiet entsprechende Dokumentenabbild oder die ASCII-Textentsprechung auf, wenn diese Option ausgewählt wurde, und ersetzt das Gebiet in8 mit dem entsprechenden Dokumentenabbild, wie in9 gezeigt. Der Ablauf kehrt dann zu Schritt S707 zurück, um weitere Anwendernominierungen abzuwarten. - In
9 passt die ASCII-Textentsprechung für Gebiet54 nicht in das zugeteilte Gebiet. In dieser Situation zeigt die CPU11 nur die passende Textmenge an, aber die CPU11 ermöglicht das Bildschirmrollen innerhalb des Gebiets, um dem Anwender die Ansicht des gesamten Texts zu ermöglichen. - Wie ferner in
9 gezeigt, hat der Anwender die Anzeige der ersten Zeile des Texts von Bereich44 angefordert und die ASCII-Textentsprechung dieses Texts wird bei55 angezeigt. Wurde natürlich der Abbildmodus ausgewählt, dann wäre das Abbild der ersten Textzeile angezeigt worden. - Visiert der Anwender in Schritt S709 einen Dokumentenbereich an, der einen verwandten Bereich aufweist, wie Bereich
42 oder43 , dann ersetzt die CPU11 nicht lediglich den anvisierten Bereich, sondern auch den verwandten Bereich. Visiert der Anwender entsprechend Bereich42 an, der ein Titelbereich ist, ersetzt die CPU11 den Titelbereich42 mit dem vollen Abbild (oder Text) des Bereichs42 , und ersetzt auch den Textbereich43 mit dem vollen Abbild (oder Text) des Textbereichs43 . Durch die Wirkung dieses Merkmals wird dem Anwender ein schneller Zugriff auf gewünschte Informationen bereitgestellt, ohne dem Anwender die Ausführung zusätzlicher Tastenbetätigungen oder dergleichen abzuverlangen. -
10 zeigt eine Situation, in der der Anwender die Anzeige als Abbilder anstelle als ASCII-Text für bestimmte Bereiche ausgewählt hat. Genauer gesagt, hat der Anwender die vollen Abbilder der Bereiche46 bzw.48 angefordert und diese Bereiche wurden bereitgestellt, wie bei56 bzw.57 gezeigt ist.
Claims (47)
- Verfahren zur Anzeige von Dokumenten, mit den Schritten: Bereitstellen eines Abbildes eines Dokuments, Anlegen eines Auffindungsindex durch ein Verfahren, das die Schritte aufweist: Verarbeiten des Abbildes des Dokuments (S402) zur Identifikation von Textbereichen in dem Dokument und Nicht-Textbereichen im Dokument auf Basis regelbasierter Entscheidungen, und Umwandeln des Abbildes des Dokuments innerhalb von Textbereichen in Text (S405), gekennzeichnet durch die Schritte: Bestimmen eines Bereichstyps für jeden Textbereich (
43 ,44 ,48 ) im Dokument unter Verwendung regelbasierter Entscheidungen, die automatisch auf das Abbild des Textbereichs ohne Rücksicht auf die Position des Textbereichs im Dokument und ohne Rücksicht auf ein vorbestimmtes Format für das Dokument angewendet werden, wobei der Bereichstyp einer mehrerer verschiedener vordefinierter Bereichstypen ist, die durch Regeln umspannt werden, Indexieren des umgewandelten Texts (S406), um Auffinden durch Bezugnahme auf den umgewandelten Text zu ermöglichen, Indexieren des bestimmten Bereichstyps, um das Auffinden durch Bezugnahme auf einen der vorbestimmten Bereichstypen zu ermöglichen, Speichern des Abbildes des Dokuments (S408), damit das gespeicherte Dokumentenabbild durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage in den indexierten Bereichstypen erscheint, aufgefunden werden kann, zum Bereitstellen von entsprechenden Zusammensetzungsinformationen für das Dokument, wobei die Zusammensetzungsinformationen für jeden von bis zu mehreren Bereichen des Dokuments Bereichstypinformationen enthalten, Anzeigen einer abstrahierten Ansicht des Dokuments (S704) durch Verwendung der Zusammensetzungsinformationen und Ersetzen zumindest eines Bereichs der abstrahierten Ansicht durch ein entsprechendes Abbild im Dokument (S706, S708, S709) innerhalb der abstrahierten Ansicht selbst, so dass Zusammensetzungsinformationen und Abbildinformationen gemischt angezeigt werden. - Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Zuordnen des Abbildes des Dokuments mit dem indexierten Text, damit das Abbild des Dokuments durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage im indexierten Bereichstyp erscheint, aufgefunden werden kann.
- Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Festlegen einer Indexebene, die angibt, welche Bereichstypen indexiert werden sollen, und wobei der Umwandlungsschritt Textbereiche (
43 ,44 ,48 ) gemäß der festgelegten Indexebene umwandelt. - Verfahren gemäß Patentanspruch 1, wobei die Bereichstypen für Textbereiche (
43 ,44 ,48 ) aus einer Gruppe vorbestimmter Bereichstypen ausgewählt werden, die Titelbereiche und Haupttextbereiche enthalten. - Verfahren gemäß Patentanspruch 1, wobei der Bereichstyp für Nicht-Textbereiche aus einer Gruppe vorbestimmter Bereichstypen ausgewählt wird, die Line-Art-Bereiche, Halbtonbereiche und Tabellenbereiche enthält.
- Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt schrittweises Ersetzen von Bereichen innerhalb der abstrahierten Ansicht des Dokuments durch entsprechende Vollabbilder der Bereiche des Dokuments.
- Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Festlegen einer Abstraktionsebene auf der Grundlage der Zusammensetzungsinformationen zur Anzeige der abstrahierten Ansicht, wobei in dem Anzeigeschritt die abstrahierte Ansicht mit gemischten Bereichen aus Zusammensetzungsinformationen und Dokumentenabbild gemäß festgelegter Abstraktionsebene angezeigt wird.
- Verfahren gemäß Patentanspruch 1, wobei im Bereitstellungsschritt eine Vielzahl von Dokumentenabbildern und entsprechenden Dokumenten-Zusammensetzungsinformationen bereitgestellt werden, und weiterhin mit dem Schritt Auffinden von einem aus der Vielzahl der Dokumentenabbilder und entsprechender Dokumenten-Zusammensetzungsinformationen zur Anzeige.
- Verfahren gemäß Patentanspruch 8, wobei den aufgefundenen Dokumenten eine Wertung gemäß dem Grad der Übereinstimmung mit den Auffindeparametern zugeordnet wird und wobei die aufgefundenen Dokumente in einer von der Wertung bestimmten Reihenfolge angezeigt werden.
- Verfahren gemäß Patentanspruch 8, wobei im Anzeigeschritt die abstrahierte Ansicht gemischt mit Auffindeparametern angezeigt wird.
- Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Benennen der Bereiche der abstrahierten Ansicht gemäß den Zusammensetzungsinformationen für die Bereiche.
- Verfahren gemäß Patentanspruch 1, wobei der Anzeigeschritt eine sprachliche Mitteilung der Dokumentenstruktur durch Text-zu-Sprache-Umwandlung der Zusammensetzungsinformationen darstellt.
- Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Identifizieren des Dokumententyps basierend auf den Zusammensetzungsinformationen.
- Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Identifizieren verwandter Bereiche im Dokument und wobei im Ersetzungsschritt auch verwandte Bereiche innerhalb der abstrahierten Ansicht ersetzt werden, wenn ein Bereich innerhalb der abstrahierten Ansicht ersetzt wird.
- Verfahren gemäß Patentanspruch 1, wobei im Bereitstellungsschritt das Abbild des Dokuments von einer entfernten Quelle über ein Modem oder über ein lokales Netzwerk (LAN) bereitgestellt wird.
- Verfahren gemäß Patentanspruch 15, wobei im Bereitstellungsschritt Abbilder der Bereiche des Dokuments über das Modem oder LAN aufgefunden werden, wenn genügend Zeit zur Verfügung steht und wobei der Ersetzungsschritt schrittweise vorgeht, so dass Bereiche in der abstrahierten Ansicht schrittweise innerhalb der abstrahierten Ansicht durch die aufgefundenen Bereiche des Dokuments ersetzt werden.
- Verfahren gemäß Patentanspruch 16, wobei die schrittweise Ersetzung in einer von der Priorität unter den zahlreichen verschiedenen vorbestimmten Bereichstypen bestimmten Reihenfolge voranschreitet.
- Vorrichtung zur Dokumentenanzeige mit: einer Einrichtung (
31 ) zur Bereitstellung eines Abbildes eines Dokuments und einer Vorrichtung zum Anlegen eines Auffindeindex, wobei die Vorrichtung zum Anlegen eines Auffindeindex aufweist: eine erste Speichereinrichtung zur Speicherung eines Dokumentenabbildes und eines Auffindeindex, eine zweiten Speichereinrichtung zur Speicherung der Verarbeitungsschritte zur Verarbeitung des Dokumentenabbildes, um Textbereiche (43 ,44 ,48 ) im Dokument und Nicht-Textbereiche im Dokument auf der Grundlage regelbasierter Entscheidungen zu identifizieren und um das Dokumentenabbild in Textbereichen (43 ,44 ,48 ) in Text umzuwandeln, eine Verarbeitungseinrichtung (11 ) zur Ausführung der im zweiten Speicher gespeicherten Verarbeitungsschritte, dadurch gekennzeichnet, dass der Prozessor eingerichtet ist (11 ) zur Ausführung der Verarbeitungsschritte: Bestimmen eines Bereichstyps für jeden Textbereich im Dokument unter Verwendung regelbasierter Entscheidungen, die automatisch auf das Abbild des Textbereichs ohne Rücksicht auf die Position des Textbereichs im Dokument und ohne Rücksicht auf ein vorbestimmtes Format für das Dokument angewendet werden, wobei der Bereichstyp einer der Vielzahl an verschiedenen vordefinierten Bereichstypen ist, die durch Regeln umspannt werden, Indexieren des umgewandelten Texts, um Auffinden durch Bezugnahme auf den umgewandelten Text zu ermöglichen, Indexieren des bestimmten Bereichstyps, um Auffinden durch Bezugnahme auf einen der vorbestimmten Bereichstypen zu ermöglichen, und wobei die erste Speichereinrichtung eingerichtet ist, das Dokumentenabbild zu speichern, so dass das gespeicherte Dokumentenabbild durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage in den indexierten Bereichstypen erscheint, aufgefunden werden kann, zur Bereitstellung entsprechender Zusammensetzungsinformationen (34 ) für das Dokument, wobei die Zusammensetzungsinformationen Bereichstypeninformationen für jede der bis zu einer Vielzahl von Bereichen im Dokument enthalten, wobei die Anzeigevorrichtung, weiterhin aufweist: eine Einrichtung (17 ) zur Anzeige einer abstrahierten Ansicht des Dokuments unter Verwendung der Zusammensetzungsinformationen, und einer Ersetzungseinrichtung zur Ersetzung zumindest eines Bereichs der abstrahierten Ansicht durch ein entsprechendes Abbild im Dokument innerhalb der abstrahierten Ansicht selbst, so dass Zusammensetzungsinformationen und Abbildinformationen gemischt angezeigt werden. - Vorrichtung gemäß Patentanspruch 18, ferner mit einer Anzeigeschnittstelle, wobei der zweite Speicherbereich mit Befehlen zum Auffinden eines Dokuments und zur Übertragung einer abstrahierten Ansicht zu der Anzeigeschnittstelle programmiert ist, wobei Dokumentenbereiche gemäß entsprechender Bereichstypen identifiziert werden.
- Vorrichtung gemäß Patentanspruch 19, wobei der zweite Speicherbereich mit Befehlen zur Ersetzung von Bereichen innerhalb der abstrahierten Ansicht aufgefundener Dokumente durch entsprechende Bereiche aus dem Dokumentenabbild programmiert sind.
- Vorrichtung gemäß Patentanspruch 19, weiterhin mit einer Wertungseinrichtung zur Zuordnung einer Wertung zu aufgefundenen Dokumenten gemäß dem Grad der Übereinstimmung mit den Auffindeparametern, wobei die aufgefundenen Dokumente in einer von der Wertung bestimmten Reihenfolge angezeigt werden.
- Vorrichtung gemäß Patentanspruch 18, wobei die Verarbeitungsschritte weiterhin die Zuordnung des Dokumentenabbildes zu dem indexierten Text umfassen, damit das Dokumentenabbild durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage im indexierten Bereichstyp erscheint, aufgefunden werden kann.
- Vorrichtung gemäß Patentanspruch 18, wobei die Verarbeitungsschritte die Festlegung einer Indexebene umfassen, die angibt, welche Bereichstypen indexiert werden sollen, und wobei der Verarbeitungsschritt zur Umwandlung Textbereiche gemäß der festgelegten Indexebene umwandelt.
- Vorrichtung gemäß Patentanspruch 18, bei der die Bereichstypen für Textbereiche aus einer Gruppe vorbestimmter Bereichstypen ausgewählt werden, die Titelbereiche und Haupttextbereiche enthält.
- Vorrichtung gemäß Patentanspruch 18, bei der der Bereichstyp für Nicht-Textbereiche aus einer Gruppe vorbestimmter Bereichstypen, die Line-Art-Bereiche, Halbtonbereiche und Tabellenbereiche enthält, ausgewählt wird.
- Vorrichtung gemäß Patentanspruch 19, weiterhin mit einer ein Modem (
21 ) oder durch eine Schnittstelle (15 ) zu einem lokalen Netzwerk (LAN) umfassende Datenübertragungseinrichtung, wobei Dokumente über die Datenübertragungseinrichtung aufgefunden werden. - Vorrichtung gemäß Patentanspruch 26, weiterhin mit einer Auffindeeinrichtung zum Auffinden von Abbildern von Bereichen des Dokuments über das Modem (
21 ) oder LAN (16 ), wenn genügend Zeit zur Verfügung steht, und einer Ersetzungseinrichtung zur schrittweisen Ersetzung von Bereichen innerhalb der abstrahierten Ansicht durch die aufgefundenen Abbilder der Bereiche des Dokuments. - Vorrichtung gemäß Patentanspruch 20 oder 27, wobei die schrittweise Ersetzung in einer von der Priorität unter einer Vielzahl von verschiedenen vorbestimmten Bereichstypen bestimmten Reihenfolge voranschreitet.
- Vorrichtung gemäß Patentanspruch 18, weiterhin mit einer Festlegungseinrichtung zur Festlegung einer Abstraktionsebene auf der Grundlage von Zusammensetzungsinformationen zur Anzeige der abstrahierten Ansicht des Dokuments, wobei die abstrahierte Ansicht mit gemischten Bereichen von Zusammensetzungsinformationen und Dokumentenabbild gemäß der festgelegten Abstraktionsebene angezeigt wird.
- Vorrichtung gemäß Patentanspruch 18, wobei eine Vielzahl von Dokumentenbildern und entsprechenden Dokumenten-Zusammensetzungsinformationen bereitgestellt werden, und die weiterhin eine Auffindeeinrichtung zum Auffinden von einem aus der Vielzahl von Dokumentenabbildern und entsprechenden Dokumenten-Zusammensetzungsinformationen zur Anzeige umfasst.
- Vorrichtung gemäß Patentanspruch 30, weiterhin mit einer zur Zuordnung von Werten zu aufgefundenen Dokumenten gemäß dem Grad der Übereinstimmung mit den Auffindeparametern eingerichteten Wertungseinrichtung, wobei die aufgefundenen Dokumente in einer von der Wertung bestimmten Reihenfolge angezeigt werden.
- Vorrichtung gemäß Patentanspruch 30, wobei die Anzeigeeinrichtung zur Anzeige der mit Auffindeparametern gemischten abstrahierten Ansicht eingerichtet ist.
- Vorrichtung gemäß Patentanspruch 18, weiterhin mit einer Benennungseinrichtung zur Benennung von Strukturbereichen der abstrahierten Ansicht gemäß den Zusammensetzungsinformationen für die Bereiche.
- Vorrichtung gemäß Patentanspruch 18, wobei die Anzeigeeinrichtung zur Bereitstellung einer sprachlichen Mitteilung der Dokumentenstruktur durch Text-zu-Sprache-Umwandlung der Zusammensetzungsinformationen eingerichtet ist.
- Vorrichtung gemäß Patentanspruch 18, weiterhin mit einer Identifikationseinrichtung zur Identifikation des Dokumententyps basierend auf den Zusammensetzungsinformationen.
- Vorrichtung gemäß Patentanspruch 18, weiterhin mit einer Identifikationseinrichtung zur Identifikation verwandter Bereiche im Dokument, und wobei im Ersetzungsschritt auch verwandte Bereiche innerhalb der abstrahierten Ansicht ersetzt werden, wenn ein Bereich innerhalb der abstrahierten Ansicht ersetzt wird.
- Vorrichtung gemäß Patentanspruch 18, wobei Textbereiche des Dokuments durch Textbereiche des Dokuments oder durch Textentsprechungen gemäß einer manuellen Auswahl ersetzt werden.
- Vorrichtung gemäß Patentanspruch 18, wobei das Abbild des Dokuments von einer entfernten Quelle über ein Modem (
21 ) oder ein lokales Netzwerk (LAN) (16 ) bereitgestellt wird. - Vorrichtung gemäß Patentanspruch 38, wobei Abbilder von Bereichen des Dokuments über das Modem (
21 ) oder LAN (16 ) aufgefunden werden, wenn genügend Zeit zur Verfügung steht, und wobei die Ersetzung schrittweise vorgeht, so dass Bereiche der abstrahierten Ansicht schrittweise innerhalb der abstrahierten Ansicht durch die aufgefundenen Abbildern der Bereiche des Dokuments ersetzt werden. - Vorrichtung gemäß Patentanspruch 39, bei der die schrittweise Ersetzung in einer von der Priorität unter den zahlreichen verschiedenen vorbestimmten Bereichstypen bestimmten Reihenfolge voranschreitet.
- Vorrichtung zur Dokumentenanzeige gemäß Patentanspruch 18, wobei die Ersetzungseinrichtung aufweist: einen ersten Speicherbereich, aus dem ein Abbild eines Dokuments und entsprechende Zusammensetzungsinformationen für das Dokument aufgefunden werden können, einen zweiten Speicherbereich zur Speicherung der Verarbeitungsschritte und einen Prozessor (
11 ) zur Ausführung der im zweiten Speicher gespeicherten Verarbeitungsschritte, wobei der zweite Speicher mit Befehlen zur Anzeige der abstrahierten Ansicht eines aufgefundenen Dokuments gemäß den Zusammensetzungsinformationen auf einer Anzeigeeinheit und zur Ersetzung eines ausgewählten Bereichs der abstrahierten Ansicht durch ein entsprechendes Dokumentenabbild innerhalb der abstrahierten Ansicht selbst programmiert wurde, so dass Zusammensetzungsinformationen und Abbildinformationen gemischt angezeigt werden. - Vorrichtung gemäß Patentanspruch 41, weiterhin mit einer Eingabeeinrichtung zur Eingabe von Bedienerfestlegungen, und wobei der zweite Speicher Verarbeitungsschritte enthält, um die Festlegung einer Abstraktionsebene, auf der die abstrahierte Ansicht angezeigt wird, zu ermöglichen, in welcher gemischte Bereiche von Zusammensetzungsinformationen und Dokumentenabbild gemäß der festgelegten Abstraktionsebene angezeigt werden.
- Vorrichtung gemäß Patentanspruch 41, wobei der erste Speicher eine Vielzahl von Dokumentenabbildern und eine Vielzahl von entsprechenden Zusammensetzungsinformationen enthält, und wobei der zweite Speicher Verarbeitungsschritte zum Auffinden von einem aus der Vielzahl von gespeicherten Dokumentenabbilder und entsprechenden Dokumenten-Zusammensetzungsinformationen zur Anzeige enthält.
- Datenspeichermedium zur Beförderung des Informationsinhalts einer Vielzahl von Dokumenten und weiterhin zur Beförderung des durch das Verfahren gemäß Patentanspruch 1 erstellten Auffindeindex, so dass die Gesamtstruktur eines Dokuments für die Anzeige ohne die Auffindung des gesamten Informationsinhalts des Dokuments aufgefunden werden kann.
- Computerprogramm, das computerausführbare Befehle zur Durchführung aller Schritte eines jeden Verfahrens gemäß einem der Patentansprüche 1 bis 17 enthält.
- Computerlesbares Speichermedium zur Speicherung eines Computerprogramms gemäß Patentanspruch 45.
- Signal zur Beförderung des Informationsinhalts einer Vielzahl von Dokumenten und ferner zur Zuführung des durch das Verfahren gemäß Patentanspruch 1 erstellten Auffindeindex, so dass die Gesamtstruktur eines Dokuments für die Anzeige ohne die Auffindung des gesamten Informationsinhalts des Dokuments aufgefunden werden kann.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/005,444 US6002798A (en) | 1993-01-19 | 1993-01-19 | Method and apparatus for creating, indexing and viewing abstracted documents |
US5444 | 1993-01-19 |
Publications (2)
Publication Number | Publication Date |
---|---|
DE69434620D1 DE69434620D1 (de) | 2006-04-20 |
DE69434620T2 true DE69434620T2 (de) | 2006-08-03 |
Family
ID=21715899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE69434620T Expired - Lifetime DE69434620T2 (de) | 1993-01-19 | 1994-01-19 | Verfahren und Gerät zum Herstellen, Indexieren und Anschauen von zusammengefassten Dokumenten |
Country Status (6)
Country | Link |
---|---|
US (1) | US6002798A (de) |
EP (1) | EP0609996B1 (de) |
JP (1) | JPH06325084A (de) |
DE (1) | DE69434620T2 (de) |
SG (1) | SG75792A1 (de) |
TW (1) | TW229290B (de) |
Families Citing this family (111)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6578027B2 (en) * | 1996-08-20 | 2003-06-10 | Business Objects, Sa | Relational database access system using semantically dynamic objects |
US8352400B2 (en) | 1991-12-23 | 2013-01-08 | Hoffberg Steven M | Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore |
US6496841B1 (en) * | 1996-06-26 | 2002-12-17 | Sun Microsystems, Inc. | Techniques for identifying and manipulating quoted or reproduced material using a quote bar |
US5802533A (en) * | 1996-08-07 | 1998-09-01 | Walker; Randall C. | Text processor |
US6279017B1 (en) * | 1996-08-07 | 2001-08-21 | Randall C. Walker | Method and apparatus for displaying text based upon attributes found within the text |
US7484172B2 (en) * | 1997-05-23 | 2009-01-27 | Walker Digital, Llc | System and method for providing a customized index with hyper-footnotes |
US6353840B2 (en) * | 1997-08-15 | 2002-03-05 | Ricoh Company, Ltd. | User-defined search template for extracting information from documents |
JP4100746B2 (ja) * | 1998-01-09 | 2008-06-11 | キヤノン株式会社 | 画像処理装置及び方法 |
US6269188B1 (en) | 1998-03-12 | 2001-07-31 | Canon Kabushiki Kaisha | Word grouping accuracy value generation |
US6240407B1 (en) | 1998-04-29 | 2001-05-29 | International Business Machines Corp. | Method and apparatus for creating an index in a database system |
US6243501B1 (en) * | 1998-05-20 | 2001-06-05 | Canon Kabushiki Kaisha | Adaptive recognition of documents using layout attributes |
JP2000137728A (ja) * | 1998-11-02 | 2000-05-16 | Fujitsu Ltd | 文書解析装置及びプログラム記録媒体 |
WO2000034845A2 (en) * | 1998-12-08 | 2000-06-15 | Mediadna, Inc. | A system and method of obfuscating data |
US7062707B1 (en) * | 1998-12-08 | 2006-06-13 | Inceptor, Inc. | System and method of providing multiple items of index information for a single data object |
US7904187B2 (en) | 1999-02-01 | 2011-03-08 | Hoffberg Steven M | Internet appliance system and method |
US6631373B1 (en) * | 1999-03-02 | 2003-10-07 | Canon Kabushiki Kaisha | Segmented document indexing and search |
US6397213B1 (en) * | 1999-05-12 | 2002-05-28 | Ricoh Company Ltd. | Search and retrieval using document decomposition |
US6522790B1 (en) * | 1999-09-28 | 2003-02-18 | Motorola, Inc. | Method and apparatus for merging images |
JP2001236287A (ja) * | 2000-02-24 | 2001-08-31 | Matsushita Electric Ind Co Ltd | 画像表示方法及び該方法により画像を表示する携帯端末 |
WO2001086390A2 (en) | 2000-05-08 | 2001-11-15 | Walker Digital, Llc | Method and system for providing a link in an electronic file being presented to a user |
JP2002007413A (ja) * | 2000-06-20 | 2002-01-11 | Fujitsu Ltd | 画像検索装置 |
US7054509B2 (en) * | 2000-10-21 | 2006-05-30 | Cardiff Software, Inc. | Determining form identification through the spatial relationship of input data |
JP2002182815A (ja) * | 2000-12-12 | 2002-06-28 | Fujitsu Ltd | 表示装置および表示制御プログラムを記録したコンピュータ読取可能な記録媒体 |
DE10110275A1 (de) * | 2001-03-02 | 2002-09-19 | Daimler Chrysler Ag | Verfahren zur Kennzeichnung von gespeicherter Information |
US20020126902A1 (en) * | 2001-03-08 | 2002-09-12 | Konica Corporation | Character information collating correction apparatus |
US6735329B2 (en) * | 2001-05-18 | 2004-05-11 | Leonard S. Schultz | Methods and apparatus for image recognition and dictation |
ES2201871B1 (es) * | 2001-08-30 | 2005-05-16 | Cultura Y Solidaridad, S.L. | Sistema de busquedas bibliograficas mediante consultas de indices. |
US20030042319A1 (en) * | 2001-08-31 | 2003-03-06 | Xerox Corporation | Automatic and semi-automatic index generation for raster documents |
JP5339657B2 (ja) * | 2001-09-11 | 2013-11-13 | キヤノン株式会社 | 文書登録システム、方法、プログラム及び記憶媒体 |
US6678699B2 (en) | 2001-10-09 | 2004-01-13 | International Business Machines Corporation | Visual indexing of displayable digital documents |
JP3624186B2 (ja) * | 2002-03-15 | 2005-03-02 | Tdk株式会社 | スイッチング電源装置用の制御回路及びこれを用いたスイッチング電源装置 |
JP3941624B2 (ja) * | 2002-07-30 | 2007-07-04 | コニカミノルタビジネステクノロジーズ株式会社 | ファイル保存装置 |
JP2004139484A (ja) * | 2002-10-21 | 2004-05-13 | Hitachi Ltd | 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム |
US7045377B2 (en) * | 2003-06-26 | 2006-05-16 | Rj Mears, Llc | Method for making a semiconductor device including a superlattice and adjacent semiconductor layer with doped regions defining a semiconductor junction |
US8442331B2 (en) | 2004-02-15 | 2013-05-14 | Google Inc. | Capturing text from rendered documents using supplemental information |
US7707039B2 (en) * | 2004-02-15 | 2010-04-27 | Exbiblio B.V. | Automatic modification of web pages |
US10635723B2 (en) | 2004-02-15 | 2020-04-28 | Google Llc | Search engines and systems with handheld document data capture devices |
US7812860B2 (en) | 2004-04-01 | 2010-10-12 | Exbiblio B.V. | Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device |
WO2005084282A2 (en) * | 2004-02-27 | 2005-09-15 | Akron Special Machinery, Inc. | Load wheel drive |
US20050210048A1 (en) * | 2004-03-18 | 2005-09-22 | Zenodata Corporation | Automated posting systems and methods |
US8146156B2 (en) | 2004-04-01 | 2012-03-27 | Google Inc. | Archive of text captures from rendered documents |
US9116890B2 (en) | 2004-04-01 | 2015-08-25 | Google Inc. | Triggering actions in response to optically or acoustically capturing keywords from a rendered document |
US20060081714A1 (en) | 2004-08-23 | 2006-04-20 | King Martin T | Portable scanning device |
US20060098900A1 (en) | 2004-09-27 | 2006-05-11 | King Martin T | Secure data gathering from rendered documents |
US8081849B2 (en) | 2004-12-03 | 2011-12-20 | Google Inc. | Portable scanning and memory device |
US7990556B2 (en) | 2004-12-03 | 2011-08-02 | Google Inc. | Association of a portable scanner with input/output and storage devices |
US7894670B2 (en) | 2004-04-01 | 2011-02-22 | Exbiblio B.V. | Triggering actions in response to optically or acoustically capturing keywords from a rendered document |
US9143638B2 (en) | 2004-04-01 | 2015-09-22 | Google Inc. | Data capture from rendered documents using handheld device |
WO2008028674A2 (en) | 2006-09-08 | 2008-03-13 | Exbiblio B.V. | Optical scanners, such as hand-held optical scanners |
US9008447B2 (en) | 2004-04-01 | 2015-04-14 | Google Inc. | Method and system for character recognition |
US8713418B2 (en) | 2004-04-12 | 2014-04-29 | Google Inc. | Adding value to a rendered document |
US8874504B2 (en) | 2004-12-03 | 2014-10-28 | Google Inc. | Processing techniques for visual capture data from a rendered document |
US8489624B2 (en) | 2004-05-17 | 2013-07-16 | Google, Inc. | Processing techniques for text capture from a rendered document |
US8620083B2 (en) | 2004-12-03 | 2013-12-31 | Google Inc. | Method and system for character recognition |
US7788258B1 (en) * | 2004-06-21 | 2010-08-31 | Google Inc. | Automatic determination of whether a document includes an image gallery |
US8346620B2 (en) | 2004-07-19 | 2013-01-01 | Google Inc. | Automatic modification of web pages |
JP4477468B2 (ja) * | 2004-10-15 | 2010-06-09 | 富士通株式会社 | 組み立て図面の装置部品イメージ検索装置 |
US20060200464A1 (en) * | 2005-03-03 | 2006-09-07 | Microsoft Corporation | Method and system for generating a document summary |
KR100664311B1 (ko) * | 2005-11-18 | 2007-01-04 | 삼성전자주식회사 | 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법 |
US7433548B2 (en) * | 2006-03-28 | 2008-10-07 | Amazon Technologies, Inc. | Efficient processing of non-reflow content in a digital image |
US8023738B1 (en) | 2006-03-28 | 2011-09-20 | Amazon Technologies, Inc. | Generating reflow files from digital images for rendering on various sized displays |
US7788580B1 (en) * | 2006-03-28 | 2010-08-31 | Amazon Technologies, Inc. | Processing digital images including headers and footers into reflow content |
US7966557B2 (en) * | 2006-03-29 | 2011-06-21 | Amazon Technologies, Inc. | Generating image-based reflowable files for rendering on various sized displays |
US7715635B1 (en) | 2006-09-28 | 2010-05-11 | Amazon Technologies, Inc. | Identifying similarly formed paragraphs in scanned images |
US7810026B1 (en) | 2006-09-29 | 2010-10-05 | Amazon Technologies, Inc. | Optimizing typographical content for transmission and display |
US8631012B2 (en) * | 2006-09-29 | 2014-01-14 | A9.Com, Inc. | Method and system for identifying and displaying images in response to search queries |
US7986843B2 (en) | 2006-11-29 | 2011-07-26 | Google Inc. | Digital image archiving and retrieval in a mobile device system |
US20080162602A1 (en) * | 2006-12-28 | 2008-07-03 | Google Inc. | Document archiving system |
US20080162603A1 (en) * | 2006-12-28 | 2008-07-03 | Google Inc. | Document archiving system |
CN101246475B (zh) * | 2007-02-14 | 2010-05-19 | 北京书生国际信息技术有限公司 | 一种基于版面信息的检索方法 |
JP5063151B2 (ja) * | 2007-03-19 | 2012-10-31 | 株式会社リコー | 情報検索システム及び情報検索方法 |
WO2008140721A2 (en) | 2007-05-09 | 2008-11-20 | Lexisnexis Group | Systems and methods for analyzing documents |
CN101308494A (zh) * | 2007-05-15 | 2008-11-19 | 国际商业机器公司 | 演示内容的方法与设备 |
US8160306B1 (en) * | 2007-06-06 | 2012-04-17 | Neustel Michael S | Patent analyzing system |
US9256594B2 (en) | 2007-06-06 | 2016-02-09 | Michael S. Neustel | Patent analyzing system |
CN101354705B (zh) * | 2007-07-23 | 2012-06-13 | 夏普株式会社 | 文档图像处理装置和文档图像处理方法 |
US8290272B2 (en) * | 2007-09-14 | 2012-10-16 | Abbyy Software Ltd. | Creating a document template for capturing data from a document image and capturing data from a document image |
US20090109031A1 (en) | 2007-10-25 | 2009-04-30 | Calvin Duane A | Method of and System for Finding Physical Locations of Servers |
US8782516B1 (en) | 2007-12-21 | 2014-07-15 | Amazon Technologies, Inc. | Content style detection |
DE102008010264A1 (de) * | 2008-02-19 | 2009-08-20 | Bookrix Gmbh & Co. Kg | Verfahren und Vorrichtung zur seitenweisen Bereitstellung eines elektronischen Dokumentes als Computergrafik |
JP4875024B2 (ja) * | 2008-05-09 | 2012-02-15 | 株式会社東芝 | 画像情報伝送装置 |
US8572480B1 (en) | 2008-05-30 | 2013-10-29 | Amazon Technologies, Inc. | Editing the sequential flow of a page |
US8131720B2 (en) | 2008-07-25 | 2012-03-06 | Microsoft Corporation | Using an ID domain to improve searching |
US9390321B2 (en) | 2008-09-08 | 2016-07-12 | Abbyy Development Llc | Flexible structure descriptions for multi-page documents |
US8547589B2 (en) * | 2008-09-08 | 2013-10-01 | Abbyy Software Ltd. | Data capture from multi-page documents |
US9229911B1 (en) | 2008-09-30 | 2016-01-05 | Amazon Technologies, Inc. | Detecting continuation of flow of a page |
US8499046B2 (en) * | 2008-10-07 | 2013-07-30 | Joe Zheng | Method and system for updating business cards |
CN105930311B (zh) | 2009-02-18 | 2018-10-09 | 谷歌有限责任公司 | 执行与再现文档关联的动作的方法、移动设备和可读介质 |
JP4725658B2 (ja) * | 2009-03-03 | 2011-07-13 | ブラザー工業株式会社 | 画像合成出力プログラム、画像合成出力装置及び画像合成出力システム |
WO2010105245A2 (en) | 2009-03-12 | 2010-09-16 | Exbiblio B.V. | Automatically providing content associated with captured information, such as information captured in real-time |
US8447066B2 (en) | 2009-03-12 | 2013-05-21 | Google Inc. | Performing actions based on capturing information from rendered documents, such as documents under copyright |
US20110126113A1 (en) * | 2009-11-23 | 2011-05-26 | c/o Microsoft Corporation | Displaying content on multiple web pages |
US9081799B2 (en) | 2009-12-04 | 2015-07-14 | Google Inc. | Using gestalt information to identify locations in printed information |
US9323784B2 (en) | 2009-12-09 | 2016-04-26 | Google Inc. | Image search using text-based elements within the contents of images |
JP4935891B2 (ja) * | 2009-12-21 | 2012-05-23 | ブラザー工業株式会社 | 画像合成装置及び画像合成プログラム |
DE102010004166A1 (de) * | 2010-01-08 | 2011-07-14 | Giesecke & Devrient GmbH, 81677 | Verfahren zum Konfigurieren einer graphischen Benutzerschnittstelle einer Vorrichtung zur Bearbeitung von Wertdokumenten |
US8499236B1 (en) | 2010-01-21 | 2013-07-30 | Amazon Technologies, Inc. | Systems and methods for presenting reflowable content on a display |
CN101853297A (zh) * | 2010-05-28 | 2010-10-06 | 英华达(南昌)科技有限公司 | 一种在电子设备中快速获得期望图像的方法 |
US9836460B2 (en) * | 2010-06-11 | 2017-12-05 | Lexisnexis, A Division Of Reed Elsevier Inc. | Systems and methods for analyzing patent-related documents |
US9223769B2 (en) | 2011-09-21 | 2015-12-29 | Roman Tsibulevskiy | Data processing systems, devices, and methods for content analysis |
US8687886B2 (en) | 2011-12-29 | 2014-04-01 | Konica Minolta Laboratory U.S.A., Inc. | Method and apparatus for document image indexing and retrieval using multi-level document image structure and local features |
WO2013099038A1 (ja) * | 2011-12-29 | 2013-07-04 | 楽天株式会社 | 画像検索システム、画像検索方法、画像検索装置、プログラム、及び情報記憶媒体 |
US8971630B2 (en) | 2012-04-27 | 2015-03-03 | Abbyy Development Llc | Fast CJK character recognition |
US8989485B2 (en) | 2012-04-27 | 2015-03-24 | Abbyy Development Llc | Detecting a junction in a text line of CJK characters |
US10269063B2 (en) * | 2013-01-11 | 2019-04-23 | Capital One Financial Corporation | Systems and methods for managing a loan application |
KR102103277B1 (ko) * | 2013-04-12 | 2020-04-22 | 삼성전자주식회사 | 이미지를 관리하는 방법 및 그 전자 장치 |
US9454696B2 (en) | 2014-04-17 | 2016-09-27 | Xerox Corporation | Dynamically generating table of contents for printable or scanned content |
US11151108B2 (en) * | 2016-11-21 | 2021-10-19 | International Business Machines Corporation | Indexing and archiving multiple statements using a single statement dictionary |
US20220027419A1 (en) * | 2018-12-28 | 2022-01-27 | Shenzhen Sekorm Component Network Co., Ltd | Smart search and recommendation method for content, storage medium, and terminal |
US11263325B2 (en) * | 2019-01-31 | 2022-03-01 | Mcafee, Llc | System and method for application exploration |
US10984168B1 (en) * | 2020-02-10 | 2021-04-20 | International Business Machines Corporation | System and method for generating a multi-modal abstract |
Family Cites Families (46)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4408181A (en) * | 1979-04-10 | 1983-10-04 | Tokyo Shibaura Denki Kabushiki Kaisha | Document data filing/retrieval system |
JPS56168263A (en) * | 1980-05-30 | 1981-12-24 | Hitachi Ltd | Program making device |
DE3107655A1 (de) * | 1981-02-27 | 1982-09-16 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zum auffinden und abgrenzen von textbereichen auf einer vorlage, die text-, graphik- und/oder bildbereiche enthalten kann |
DE3113555A1 (de) * | 1981-04-03 | 1982-10-21 | Siemens AG, 1000 Berlin und 8000 München | Verfahren zum automatischen erkennen von weissbloecken sowie text-, graphik- und/oder graubildbereichen auf druckvorlagen |
JPH0748795B2 (ja) * | 1982-07-09 | 1995-05-24 | 富士写真フイルム株式会社 | 画像入出力装置 |
GB2126054A (en) * | 1982-08-11 | 1984-03-14 | Philips Electronic Associated | Display system with nested information display |
JPS60134357A (ja) * | 1983-12-21 | 1985-07-17 | Hitachi Ltd | 画像フアイル登録・検索方式 |
US4907285A (en) * | 1984-08-24 | 1990-03-06 | Hitachi, Ltd. | Image understanding system |
US5235653A (en) * | 1984-08-31 | 1993-08-10 | Hitachi, Ltd. | Document analysis system |
JPS6176144A (ja) * | 1984-09-21 | 1986-04-18 | オリンパス光学工業株式会社 | 医用画像フアイル装置 |
EP0382321B1 (de) * | 1984-11-14 | 1999-02-03 | Canon Kabushiki Kaisha | Bildverarbeitungssystem |
US5265242A (en) * | 1985-08-23 | 1993-11-23 | Hiromichi Fujisawa | Document retrieval system for displaying document image data with inputted bibliographic items and character string selected from multiple character candidates |
DE3642220A1 (de) * | 1985-12-11 | 1987-06-19 | Sharp Kk | Einrichtung zum aufzeichnen und wiederauffinden aufgezeichneter information |
JPH0740269B2 (ja) * | 1986-01-24 | 1995-05-01 | 日本電信電話株式会社 | 文書フアイリング装置 |
JPH0785248B2 (ja) * | 1986-03-14 | 1995-09-13 | 株式会社東芝 | デ−タフアイルシステム |
US4764867A (en) * | 1986-06-03 | 1988-08-16 | Banner Blue Software Incorporated | Display system and method for constructing and editing a hierarchical arrangement of information |
US4760606A (en) * | 1986-06-30 | 1988-07-26 | Wang Laboratories, Inc. | Digital imaging file processing system |
JPS6324419A (ja) * | 1986-07-17 | 1988-02-01 | Toshiba Corp | 複合文書処理装置 |
US5144679A (en) * | 1987-06-29 | 1992-09-01 | Hitachi, Ltd | Graphic data searching and storage method |
US4803643A (en) * | 1987-08-10 | 1989-02-07 | Oclc Online Computer Library Center Incorporated | System and method for creating memory-retained, formatted pages of text, tabulation, and graphic data |
US5113492A (en) * | 1987-09-16 | 1992-05-12 | Canon Kabushiki Kaisha | Apparatus for processing character and image data |
US4949392A (en) * | 1988-05-20 | 1990-08-14 | Eastman Kodak Company | Document recognition and automatic indexing for optical character recognition |
US4933880A (en) * | 1988-06-15 | 1990-06-12 | International Business Machines Corp. | Method for dynamically processing non-text components in compound documents |
US5038381A (en) * | 1988-07-11 | 1991-08-06 | New Dest Corporation | Image/text filtering system and method |
JP2509303B2 (ja) * | 1988-07-13 | 1996-06-19 | 株式会社日立製作所 | 情報検索方法および装置 |
US5131053A (en) * | 1988-08-10 | 1992-07-14 | Caere Corporation | Optical character recognition method and apparatus |
DE3881392T2 (de) * | 1988-09-12 | 1993-10-21 | Oce Nederland Bv | System und Verfahren für automatische Segmentierung. |
US5021976A (en) * | 1988-11-14 | 1991-06-04 | Microelectronics And Computer Technology Corporation | Method and system for generating dynamic, interactive visual representations of information structures within a computer |
JPH032979A (ja) * | 1989-05-31 | 1991-01-09 | Toshiba Corp | 画像修正方法及び装置 |
JP2890482B2 (ja) * | 1989-06-13 | 1999-05-17 | 富士ゼロックス株式会社 | 文書画像再配置ファイリング装置 |
US5369716A (en) * | 1989-08-31 | 1994-11-29 | Kabushiki Kaisha Toshiba | Document reader and reading processing method therefor |
JPH0743718B2 (ja) * | 1989-10-13 | 1995-05-15 | 株式会社日立製作所 | マルチメディア文書構造化方式 |
JPH03132874A (ja) * | 1989-10-19 | 1991-06-06 | Fuji Facom Corp | 文書のファイリング方法 |
JPH03202967A (ja) * | 1989-12-28 | 1991-09-04 | Toshiba Corp | 電子ファイリング装置 |
JPH03202958A (ja) * | 1989-12-28 | 1991-09-04 | Toshiba Corp | 画像情報記憶検索装置 |
US5048099A (en) * | 1990-05-21 | 1991-09-10 | Eastman Kodak Company | Polygon-based method for automatic extraction of selected text in a digitized document |
US5050222A (en) * | 1990-05-21 | 1991-09-17 | Eastman Kodak Company | Polygon-based technique for the automatic classification of text and graphics components from digitized paper-based forms |
US5109439A (en) * | 1990-06-12 | 1992-04-28 | Horst Froessl | Mass document storage and retrieval system |
US5396588A (en) * | 1990-07-03 | 1995-03-07 | Froessl; Horst | Data processing using digitized images |
JPH0490054A (ja) * | 1990-08-03 | 1992-03-24 | Toshiba Corp | 画像記憶検索装置 |
US5133051A (en) * | 1990-12-13 | 1992-07-21 | Handley George E | Automatic high speed publishing system |
US5237628A (en) * | 1991-06-03 | 1993-08-17 | Nynex Corporation | System and method for automatic optical data entry |
FR2681454B1 (fr) * | 1991-09-16 | 1995-08-18 | Aerospatiale | Procede et dispositif de traitement d'informations alphanumeriques et graphiques pour la constitution d'une banque de donnees. |
US5359673A (en) * | 1991-12-27 | 1994-10-25 | Xerox Corporation | Method and apparatus for converting bitmap image documents to editable coded data using a standard notation to record document recognition ambiguities |
US5680479A (en) * | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
US5553277A (en) * | 1992-12-29 | 1996-09-03 | Fujitsu Limited | Image search method for searching and retrieving desired image from memory device |
-
1993
- 1993-01-19 US US08/005,444 patent/US6002798A/en not_active Expired - Lifetime
-
1994
- 1994-01-19 SG SG1996009354A patent/SG75792A1/en unknown
- 1994-01-19 EP EP94300376A patent/EP0609996B1/de not_active Expired - Lifetime
- 1994-01-19 JP JP6004256A patent/JPH06325084A/ja active Pending
- 1994-01-19 DE DE69434620T patent/DE69434620T2/de not_active Expired - Lifetime
- 1994-01-19 TW TW083100412A patent/TW229290B/zh not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
SG75792A1 (en) | 2000-10-24 |
EP0609996B1 (de) | 2006-02-08 |
TW229290B (de) | 1994-09-01 |
EP0609996A2 (de) | 1994-08-10 |
JPH06325084A (ja) | 1994-11-25 |
US6002798A (en) | 1999-12-14 |
EP0609996A3 (de) | 1995-02-15 |
DE69434620D1 (de) | 2006-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE69434620T2 (de) | Verfahren und Gerät zum Herstellen, Indexieren und Anschauen von zusammengefassten Dokumenten | |
DE10162156B4 (de) | Die Benutzernavigation durch Multimedia-Dateiinhalte unterstützendes System und Verfahren | |
DE60116442T2 (de) | System zur Zuordnung von Schlüsselwörtern zu Dokumenten | |
DE10135445B4 (de) | Integriertes Verfahren für das Schaffen einer aktualisierbaren Netzabfrage | |
DE69933404T2 (de) | System und Verfahren zum gemeinsamen Benutzen von Fonts und Speichermedium für das Programm zum Ausführen des Verfahrens | |
DE3901485C2 (de) | Verfahren und Vorrichtung zur Durchführung des Verfahrens zur Wiedergewinnung von Dokumenten | |
DE69724755T2 (de) | Auffinden von Titeln und Photos in abgetasteten Dokumentbildern | |
DE69631457T2 (de) | Vorrichtung und verfahren zum übertragbaren indexieren von dokumenten gemäss einer n-gram-wortzerlegung | |
DE69637125T2 (de) | Optimaler zugriff auf elektronische dokumente | |
DE602004005216T2 (de) | Dokumentenscanner | |
DE60208604T2 (de) | Automatisches Verfahren zur Erzeugung von Image-buttons | |
DE60216802T2 (de) | Verfahren und vorrichtung zur sprachenübersetzung eines produktionsjob-output | |
DE19708265B4 (de) | Verfahren zum Durchsuchen einer Dokument-Bilddatenbank und Dokumentbild-Durchstöberungssystem sowie Verfahren zum Extrahieren eines Merkmalsvektors aus einem elektronisch gespeicherten Bild | |
DE69731418T2 (de) | Such- und Wiederauffindungssystem für Dokumente mit Suchverfahren von teilweise passenden, benutzergezeichneten Anmerkungen | |
DE60129652T2 (de) | Bildwiederauffindungssystem und Methode mit semantischer und eigenschaftenbasierter Relevanzrückmeldung | |
DE69930903T2 (de) | Archivierungssystem und Verfahren mit der Fähigkeit, das Archivieren von identischen Dokumenten zu vermeiden | |
DE69133362T2 (de) | Dokumentenverarbeitungs-verfahren und -gerät, entsprechende Program und Speichereinheit | |
DE102005032734B4 (de) | Indexextraktion von Dokumenten | |
DE19751570A1 (de) | Dokumentmanagementsystem, Verfahren zum Betreiben eines solchen Systems und Digitalkopierer | |
DE4430369A1 (de) | Verfahren und Einrichtung zum Erzeugen eines Dokumenten-Layouts | |
DE3411939A1 (de) | Verfahren und vorrichtung zur bildwiedergewinnung unter verwendung von annotationen als leitinformation | |
DE102011005579A1 (de) | Bildverarbeitungsvorrichtung, Bildverarbeitungsverfahren und Speichermedium | |
DE10308014A1 (de) | System und Verfahren zum Lokalisieren eines nichttextlichen Bereichs eines elektronischen Dokumentes oder Bildes, der mit einer benutzerdefinierten Beschreibung des Bereichs übereinstimmt | |
DE19715696A1 (de) | Verfahren und Apparat zum Suchen nach und zum Wiederfinden von Dokumenten, indem ein Faxgerät verwendet wird | |
DE102005032744A1 (de) | Indexextraktion von Dokumenten |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
8364 | No opposition during term of opposition |