DE69434620T2

DE69434620T2 - Verfahren und Gerät zum Herstellen, Indexieren und Anschauen von zusammengefassten Dokumenten

Info

Publication number: DE69434620T2
Application number: DE69434620T
Authority: DE
Inventors: Inc. Douglas L. łc/o Canon Info. Systems Costa Mesa Palmer; Inc. Toshiaki łc/o Canon Info. Systems Costa Mesa Yagasaki
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1993-01-19
Filing date: 1994-01-19
Publication date: 2006-08-03
Anticipated expiration: 2014-01-20
Also published as: SG75792A1; EP0609996B1; TW229290B; EP0609996A2; JPH06325084A; US6002798A; EP0609996A3; DE69434620D1

Description

Die vorliegende Erfindung bezieht sich auf ein Verfahren und eine Vorrichtung zur Erstellung einer Sammlung indexierter Dokumentenabbilder, wobei die Dokumentenabbilder durch den Index aufgefunden werden können, und auf ein Verfahren und eine Vorrichtung zur schnellen Suche durch Dokumentenabbilder durch Ansehen abstrahierter Strukturansichten der Dokumentenabbilder anstelle der Dokumentenabbilder selbst.
Seit kurzem sind immer größere Speichergeräte verfügbar, und es ist möglich geworden, Dokumente nicht nur einfach als ASCII-Text, sondern auch als volle naturgetreue Nachbildung des Dokuments zu speichern. Genauer gesagt, ist es heute üblich, ein Dokument in ein computerlesbares Bitmap-Abbild des Dokuments umzuwandeln und das Bitmap-Abbild des Dokuments zu speichern. Entsprechend ist es jetzt möglich, ein Dokument in computerlesbarer Form zu speichern und nicht nur Text, sondern auch Bilder, Line-Art, Graphiken, Tabellen und andere Nicht-Textobjekte im Dokument anzuzeigen, wohingegen die ASCII-Textspeicherung lediglich die Speicherung und Anzeige von Textabschnitten des Dokuments zuließ. Genauso ist es möglich, Dokumente so anzuzeigen und zu speichern, dass Textattribute wie Schriftgröße, Schriftart, Position, oder dergleichen erhalten bleiben.
Trotz dieser Fortschritte ist es jedoch noch immer schwierig, die Dokumentenabbilder rasch im Computerspeicher aufzufinden und die computerangezeigten Dokumentenabbilder rasch durchzugehen, beispielsweise in der Situation eines Computeranwenders, der viele Dokumentenabbilder auffindet und diese Dokumentenabbilder durchsucht, um ein bestimmtes Dokument zu finden. Diese Schwierigkeiten sind durch mindestens zwei Einschränkungen begründet. Erstens beschränken die momentanen Bandbreiteneinschränkungen in Computersystemen die Geschwindigkeit, mit der Dokumente im Speicher aufgefunden und angezeigt werden können. Bei einer Auflösung von 300 Punkten pro Zoll (dpi) (120 Punkte pro cm) erfordert ein normales 8½-auf-11-Zoll- (21,6-auf-27,9-cm-) Dokument in Schwarzweiß ungefähr 8,4 Millionen Bits zur Speicherung eines vollen Dokumentenabbilds. Die Hinzufügung von Halbtönen (Graustufen) oder Farbe zum Abbild oder die Erhöhung der Auflösung, mit der das Abbild gespeichert wird, kann den Speicherbedarf mit Leichtigkeit um viele Zehn Millionen Bits erhöhen. Die zur Auffindung dieser Bits im Speicher und zur Erstellung und Anzeige des sich daraus ergebenden Abbilds erforderliche Zeit ist selbst mit einer modernen Hochgeschwindigkeits-Computerausstattung nicht zu vernachlässigen. Die Zeit wird in Situationen, in denen ein Dokumentenabbild im Speicher eines ersten Computers aufgefunden und zum Beispiel über Modem an einen zweiten Computer zur Anzeige auf dem zweiten Computer elektronisch übertragen wird, noch weiter verlängert.
Zweitens, selbst wenn einem Anwender ein volles Dokumentenabbild angezeigt wird, gibt es üblicherweise zu viele Informationen für den Durchschnittsanwender, um sie rasch zu verstehen. Viele der dem Anwender angezeigten Informationen sind für die Anfrage des Anwenders nicht relevant, und viel Zeit wird mit der Anzeige nichtrelevanter Informationen verschwendet, und das Vorhandensein dieser nichtrelevanten Informationen kann den Anwender bei seinem Versuch bremsen, für seine Anfrage relevante Informationen zu lokalisieren und zu verstehen.
Außerdem kann sich das einfache Auffinden passender Dokumente aus einer großen Sammlung zur Darstellung dem Anwender gegenüber wegen der immensen zu durchsuchenden Informationsmenge als schwierig erweisen. Übliche Systeme zur Dokumentenauffindung verlassen sich üblicherweise auf die Erstellung eines Textindex, durch den Textdokumente aufgefunden werden können. Bei Dokumentenabbildern (im Gegensatz zu Textdokumenten) wurde vorgeschlagen, die Dokumentenabbilder der optischen Zeichenerkennungs-Verarbeitung (engl. optical character recognition, „OCR processing") zu unterziehen und den resultierenden Text zu indexieren. Systeme, wie das im US-Patent 5.109.439 von Froessl vorgeschlagene, schlagen vor, dass es lediglich erforderlich ist, bestimmte Gebiete des Dokuments mit OCR zu verarbeiten, um den Indexierungsvorgang zu vereinfachen, aber nichtsdestotrotz hat sich zuvor die Erstellung eines angemessenen Index für das Auffinden von Dokumentenabbildern als schwierig erwiesen.
Der in „Computer", Ausgabe 25, Nr.7 im Juli 1992 in Los Alamitos, USA, auf den Seiten 10–22 veröffentlichte Artikel „A Prototype Document Image Analysis System for Technical Journals" von G. Nagy u.a. offenbart ein System zur Abbildauffindung zur Verwendung beim Zugriff auf eine Bibliothek mit Dokumenten, beispielsweise technische Zeitschriften, die ein vorbestimmtes Seitenformat aufweisen. Damit ein Anwender die Dokumente durchgehen kann, werden Textteile durch die Verwendung von OCR und regelbasierten Entscheidungen erkannt und angezeigt.
Der Erfindung liegt die Überwindung der vorstehend beschriebenen Schwierigkeiten als Aufgabe zugrunde.
Gemäß einer Ausgestaltung der Erfindung wird ein System zum schnellen Blättern in Dokumentenabbildern bereitgestellt, bei dem nicht das volle Dokumentenabbild, sondern lediglich eine abstrahierte Strukturansicht des Dokumentenabbilds angezeigt wird. Genauer gesagt, enthält die Strukturansicht des Dokumentenabbilds benannte Objekte wie „Titel", „Text", „Tabelle", „Line-Art" bzw. Strichzeichnung, „Halbton" und ähnliche üblicherweise in Dokumenten vorzufindende Objekte, und diese Objekte werden dem Anwender in einem abstrahierten strukturierten Layout zur Darstellung angezeigt, das für das volle Dokumentenabbild repräsentativ ist. Die Abstraktionsebene, und wie das Dokument auf der Anzeige wiedergegeben wird, kann vom Anwender definiert werden. Dadurch ist es dem Anwender möglich, eine hohe Abstraktionsebene zu spezifizieren, in der lediglich benannte Objekte im passenden Layout angezeigt werden. Desgleichen ist es dem Anwender auch möglich, eine niedrigere Abstraktionsebene zu spezifizieren, in der lediglich spezifische Objekttypen, wie Titel, angezeigt werden. Es ist dem Anwender auch möglich, anzugeben, dass Textobjekte als ASCII-Zeichen anstelle des Originalabbilds des Texts angezeigt werden sollen. Durch ledigliche Anzeige abstrahierter Strukturansichten von Dokumentenabbildern anstelle der vollen Dokumentenabbilder und dadurch, dass dem Anwendenden die Angabe der Abstraktionsebene gestattet wird, ist es möglich, Dokumentenabbilder rasch aufzufinden, anzuzeigen und dem Anwender die Informationen in einem rasch zu verstehenden Format darzustellen.
Gemäß der ersten Ausgestaltung der vorliegenden Erfindung wird Verfahren zur Anzeige von Dokumenten, mit den Schritten Bereitstellen eines Abbildes eines Dokuments, Anlegen eines Auffindungsindex durch ein Verfahren, das die Schritte aufweist, Verarbeiten des Abbildes des Dokuments zur Identifikation von Textbereichen im Dokument und Nicht-Textbereichen im Dokument auf Basis regelbasierter Entscheidungen, und Umwandeln des Abbildes des Dokuments innerhalb von Textbereichen in Text, gekennzeichnet durch die Schritte Bestimmen eines Bereichstyps für jeden Textbereich im Dokument unter Verwendung regelbasierter Entscheidungen, die automatisch auf das Abbild des Textbereichs ohne Rücksicht auf die Position des Textbereichs im Dokument und ohne Rücksicht auf ein vorbestimmtes Format für das Dokument angewendet werden, wobei der Bereichstyp ist einer der zahlreichen verschiedenen vordefinierten Bereichstypen ist, die durch Regeln umspannt werden, Indexieren des umgewandelten Texts, um Auffinden durch Bezugnahme auf den umgewandelten Text zu ermöglichen, Indexieren des bestimmten Bereichstyps, um das Auffinden durch Bezugnahme auf einen der vorbestimmten Bereichstypen zu ermöglichen, Speichern des Abbildes des Dokuments, damit das gespeicherte Dokumentenabbild durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage in den indexierten Bereichstypen erscheint, aufgefunden werden kann, zum Bereitstellen von entsprechenden Zusammensetzungsinformationen für das Dokument, wobei die Zusammensetzungsinformationen für jeden der bis zu zahlreichen Bereiche des Dokuments Bereichstypinformationen enthalten, Anzeigen einer abstrahierten Ansicht des Dokuments durch Verwendung der Zusammensetzungsinformationen und Ersetzen zumindest eines Bereichs der abstrahierten Ansicht durch ein entsprechendes Abbild im Dokument innerhalb der abstrahierten Ansicht selbst, so dass Zusammensetzungsinformationen und Abbildinformationen gemischt angezeigt werden.
Gemäß einer zweiten Ausgestaltung der Erfindung wird eine Anzeigevorrichtung zur Dokumentenanzeige bereitgestellt mit einer Einrichtung zur Bereitstellung eines Abbildes eines Dokuments und einer Vorrichtung zum Anlegen eines Auffindeindex, die Vorrichtung zum Anlegen eines Auffindeindex mit einer erste Speichereinrichtung zur Speicherung eines Dokumentenabbildes und eines Auffindeindex, einer zweiten Speichereinrichtung zur Speicherung der Verarbeitungsschritte zur Verarbeitung des Dokumentenabbildes, um Textbereiche im Dokument und Nicht-Textbereiche im Dokument auf der Grundlage regelbasierter Entscheidungen zu identifizieren und um das Dokumentenabbild in Textbereichen in Text umzuwandeln, einer Verarbeitungseinrichtung zur Ausführung der im zweiten Speicher gespeicherten Verarbeitungsschritte, gekennzeichnet durch den Prozessor, der zur Ausführung von Verarbeitungsschritten eingerichtet wurde, mit einer Bestimmung eines Bereichstyps für jeden Textbereich im Dokument unter Verwendung regelbasierter Entscheidungen, die automatisch auf das Abbild des Textbereichs ohne Rücksicht auf die Position des Textbereichs im Dokument und ohne Rücksicht auf ein vorbestimmtes Format für das Dokument angewendet werden, wobei der Bereichstyp einer der Vielzahl an verschiedenen vordefinierten Bereichstypen ist, die durch Regeln umspannt werden, einer Indexierung des umgewandelten Texts, um Auffinden durch Bezugnahme auf den umgewandelten Text zu ermöglichen, einer Indexierung des bestimmten Bereichstyps, um Auffinden durch Bezugnahme auf einen der vorbestimmten Bereichstypen zu ermöglichen, einem Einrichten des ersten Speichers zur Speicherung des Dokumentenabbildes, so dass das gespeicherte Dokumentenabbild durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage in den indexierten Bereichstypen erscheint, aufgefunden werden kann und einer Bereitstellung entsprechender Zusammensetzungsinformationen für das Dokument, wobei die Zusammensetzungsinformationen Bereichstypeninformationen für jede der bis zu einer Vielzahl von Bereichen im Dokument enthält, einer Anzeigevorrichtung, weiterhin mit einer Anzeigeeinrichtung zur abstrahierten Ansicht des Dokuments unter Verwendung der Zusammensetzungsinformationen und einer Ersetzungseinrichtung zur Ersetzung zumindest eines Bereichs der abstrahierten Ansicht durch ein entsprechendes Abbild im Dokument innerhalb der abstrahierten Ansicht selbst, so dass Zusammensetzungsinformationen und Abbildinformationen gemischt angezeigt werden.
Gemäß einer dritten Ausgestaltung der vorliegenden Erfindung wird ein Datenspeichermedium bereitgestellt zur Zuführung des Informationsinhalts einer Vielzahl von Dokumenten und weiterhin zur Zuführung des durch das Verfahren gemäß der ersten Ausgestaltung erstellten Auffindeindex, so dass die Gesamtstruktur eines Dokuments für die Anzeige ohne die Auffindung des gesamten Informationsinhalts des Dokuments aufgefunden werden kann.
Gemäß einer vierten Ausgestaltung der vorliegenden Erfindung gibt es ein Computerprogramm, das computerausführbare Befehle zur Durchführung aller Schritte eines jeden Verfahrens gemäß dem ersten Ausgestaltung der Erfindung enthält.
Gemäß einer fünften Ausgestaltung der vorliegenden Erfindung gibt es ein computerlesbares Speichermedium zur Speicherung eines Computerprogramms gemäß dem vierten Ausgestaltung der vorliegenden Erfindung.
Gemäß einer sechsten Ausgestaltung der vorliegenden Erfindung gibt es ein Signal zur Zuführung des Informationsinhalts einer Vielzahl von Dokumenten und ferner zur Zuführung des durch das Verfahren gemäß dem im ersten Ausgestaltung der vorliegenden Erfindung erstellten Auffindeindex, so dass die Gesamtstruktur eines Dokuments für die Anzeige ohne die Auffindung des gesamten Informationsinhalts des Dokuments aufgefunden werden kann.
Diese Kurzfassung wurde zum schnellen Verständnis der Natur der Erfindung bereitgestellt. Ein vollständigeres Verständnis der Erfindung lässt sich durch Bezugnahme auf die nachstehende ausführliche Beschreibung des bevorzugten Ausführungsbeispiels der Erfindung in Verbindung mit der beiliegenden Zeichnung gewinnen.
Kurzbeschreibung der Zeichnung
Es zeigen:
1 eine perspektivische Ansicht der äußeren Erscheinung einer erfindungsgemäßen Vorrichtung, und 2 ein Blockschaltbild der generellen Funktionsweise der Vorrichtung gemäß 1,
3 eine vollständige Darstellung der generellen Funktionsweise der Vorrichtung gemäß 1,
4 eine vollständige Darstellung der erfindungsgemäßen Eingabe und Indexierung von Dokumenten,
5 eine Ansicht eines repräsentativen Eingabedokuments,
6 eine Ansicht zur Beschreibung, wie verschiedene innerhalb des Originaldokuments identifizierte Blöcke gespeichert werden,
7 ein Ablaufdiagramm zur Erklärung der erfindungsgemäßen Dokumentenanzeige,
8 bis 10 Ansichten einer repräsentativen Anzeige eines abstrahierten Dokuments, wobei die 9 und 10 Ansichten von Erweiterungen ausgewählter Gebiete des abstrahierten Dokuments sind.
Ausführliche Beschreibung des bevorzugten Ausführungsbeispiels
Die 1 und 2 zeigen eine erfindungsgemäße Vorrichtung.
Wie in diesen Figuren gezeigt, bezeichnet das Bezugszeichen 10 eine Personal-Computer-Ausstattung, wie einen IBM-PC oder PC-kompatiblen Computer. Die Computer-Ausstattung enthält eine CPU 11 (zentrale Verarbeitungseinheit, „central processing unit"), wie z.B. einen 80386 Prozessor, der gespeicherte Programmbefehle, wie anwendergewählte Anwendungsprogramme ausführt, die im RAM 12 (Speicher mit wahlfreiem Zugriff, „random access memory") gespeichert sind oder spezialisierte Funktionen wie Systemhochfahrprogramme oder ein BIOS, die im ROM 14 (Festwertspeicher, „read only memory") gespeichert sind. Die Computer-Ausstattung 10 enthält ferner eine Schnittstelle zum lokalen Netzwerk 15, die eine Schnittstelle zu einem lokalen Netzwerk 16 bereitstellt, wodurch die Computer-Ausstattung 10 auf Dateien, wie Dokumentdateien auf einem entfernten Dateien-Server zugreifen oder Dateien zum Fernausdruck versenden oder entfernten Geräten Zugriff auf Dokumentenabbilder auf der Ausstattung 10 erlauben kann, oder auf andere Weise mit einem lokalen Netzwerk gemäß bekannten Techniken, wie durch Dateienaustausch oder durch Senden oder Empfangen elektronischer Post, interagieren kann.
Die Computer-Ausstattung 10 enthält ferner einen Monitor 17 zur Anzeige grafischer Abbilder und eine Tastatur 19 bzw. Maus 19, um dem Anwender die Auswahl von Gebieten auf Monitor 17 und die Eingabe von Informationen zu ermöglichen.
Ein Massenspeicher 20, wie eine Festplatte oder ein Diskettenlaufwerk, ist zum Zugriff durch die CPU 11 angeschlossen. Der Massenspeicher 20 enthält typischerweise gespeicherte Programmbefehlsfolgen, wie eine Befehlsfolge zum erfindungsgemäßen Abtasten, Indexieren, Auffinden und Anzeigen von Dokumenten, sowie weitere gespeicherte Programmbefehlsfolgen zur Ausführung von wortverarbeitenden Anwendungsprogrammen, optischen Zeichenerkennungs- (OCR-) Programmen, Anwendungsprogrammen zur Blockauswahl, Tabellenkalkulation und weitere Informationen und Datenverarbeitungsprogramme. Der Massenspeicher 20 enthält ferner Dokumentenindextabellen, die Indexinformationen enthalten, durch die sowohl Dokumente als auch Bitmap-Abbilder von Dokumenten, Dokumentstrukturen, und ASCII-Text für Textgebiete des Dokuments aufgefunden werden können. Weitere Daten können nach Wunsch des Anwenders auf dem Massenspeicher 20 gespeichert werden.
Ein Modem 21, eine Faxschnittstelle 22 und eine Sprachtelefonschnittstelle 24 werden bereitgestellt, so dass sich die CPU an eine normale Telefonleitung 25 anschließen kann. Sowohl dem Modem 21, als auch der Faxschnittstelle 22 und der Sprachtelefonschnittstelle 24 wird ein Zugriff auf die Telefonleitung 25 über einen Telefonleitungsschalter 26 gegeben, der unter Steuerung durch die CPU 11 eingeschaltet wird, um die Telefonleitung 25 an entweder das Modem 21, die Faxschnittstelle 22 oder die Sprachtelefonschnittstelle 24, passend zu den auf der Telefonleitung gesendeten und empfangenen Daten, anzuschließen. Dadurch kann die CPU 11 binäre Daten, wie ASCII-Textdateien oder Dokumentenabbild-Dateien, über das Modem 21 senden und empfangen, und kann sie durch einen entfernten Computer über das Modem 21 gesteuert werden, kann sie Faxnachrichten über die Faxschnittstelle 22 senden und empfangen, und sie kann auf einer normalen Telefonleitung über die Sprachtelefonschnittstelle 24 interagieren. Im Hinblick darauf ist für die Telefonschnittstelle 24 ein DTMF-Dekoder 24A bereitgestellt, um Töne auf der Telefonleitung 25 zu dekodieren, die Anwendertastenbetätigungen auf einem Telefonbedienfeld entsprechen. Gemäß den im Massenspeicher 20 gespeicherten Programmbefehlsfolgen werden die decodierten Töne durch die CPU 11 in Anwenderbefehle übersetzt und diese Anwenderbefehle ausgeführt, um vorbestimmte Maßnahmen gemäß den Anwendertastenbetätigungen auf dem Telefonbedienfeld zu ergreifen.
Ein üblicher Text-zu-Sprache-Wandler 27 ist mit der CPU 11 verbunden. Der Text-zu-Sprache-Wandler 27 übersetzt ihm zugesendete Textzeilen und wandelt diese Textzeichenketten in Audio-Sprachinformationen um. Der Text-Zu-Sprache-Wandler 27 führt die Audio-Sprachinformationen entweder einem Lautsprecher 28 zur sprachlichen Mitteilung an einen lokalen Computeranwender zu oder er führt die Audio-Sprachinformationen der Sprachtelefonschnittstelle 24 zur sprachlichen Mitteilung über übliche Sprachtelefonleitungen zu.
Auch ein MIDI-(MIDI-Protokoll, „Musical Instrument Digital Interface") Synthesizer 30 ist mit der CPU 11 verbunden, und übersetzt MIDI-Musikbefehle von der CPU 11, indem er diese MIDI-Musikbefehle in Audiosignalverläufe umwandelt. Im Gegenzug werden die Audiosignalverläufe über den Lautsprecher 28 abgespielt oder der Sprachtelefonschnittstelle 24 zum Abspielen über eine übliche Sprachtelefonleitung zugeführt.
Eine Abtastvorrichtung 31 arbeitet zur Abtastung von auf Papierblättern gedruckten Originaldokumenten, und zur Umwandlung dieser Originaldokumente in eine bitweise computerlesbare Darstellung dieses Dokuments. Die Abtastvorrichtung 31 kann eine einfache Schwarzweiß-Abtastvorrichtung sein, vorzugsweise weist die Abtastvorrichtung 31 aber wenigstens Halbton-(Graustufen-) Verarbeitungsfähigkeit und/oder Farbverarbeitungsfähigkeit auf.
Ein Drucker 32 ist zur Bildung von Dokumentenabbildern unter der Steuerung durch die CPU 11 bereitgestellt. Der Drucker 32 kann ein üblicher Schwarzweiß-Drucker sein, vorzugsweise weist der Drucker 32 aber Halbton- (Graustufen-) und/oder Farbfähigkeit auf.
Eine CD-ROM 34, wie ein optische Disk, ist zum Zugriff durch die CPU 11 angeschlossen. Die CD-ROM 34 funktioniert zur Erweiterung des Speichers im Massenspeicher 20 und enthält zusätzliche Informationen in bezug auf Dokumentenindizes, Dokumentenabbilder und Dokumentenstruktur. Es ist auch möglich, ein optisches Einfach-Schreib-/Vielfach-Lese- (WORM, „wirte-once-read-many") Gerät oder eine übliche optische Schreib-/Lese-Vorrichtung bereitzustellen, um die Speicherfähigkeit noch weiter zu erweitern. Zusätzlich kann die CPU 11 über das lokale Netzwerk 16 auf auf entfernten Orten von Dateien-Servern gespeicherte Dokumentenindizes und Dokumentenabbilder zugreifen, und über Modem 21 kann die CPU 11 auf Dokumentenindizes und Dokumentenabbilder, die in zentralisierten Datenbankorten gespeichert sind, über eine übliche Sprachtelefonleitung zugreifen.
3 ist ein Ablaufdiagramm, das die generelle Funktionsweise der Vorrichtung gemäß den 1 und 2 zeigt. Die in 3 gezeigten Verarbeitungsschritte werden von der CPU 11 gemäß den im Massenspeicher 20 gespeicherten und aus dem RAM 14 ausgeführten Programmbefehlsfolgen ausgeführt.
In Schritt S301 zeigt die CPU 11 ein Hauptauswahlmenü auf Monitor 17 an und ermöglicht dem Anwender die Auswahl eines der Menüpunkte. Hat der Anwender in Schritt S302 die Eingabe von Dokumenten ausgewählt, dann geht der Ablauf zu Schritt S303 über, in dem die Verarbeitung von Dokumentenabbildern ausgeführt wird, wonach der Ablauf zu Schritt S301 zurückkehrt. Wählt der Anwender keine Dokumenteneingabe aus, sondern stattdessen die Dokumentenauffindung (Schritt S304), dann geht der Ablauf zu Schritt S305 über, in dem die Auffindeverarbeitung von Dokumenten ausgeführt wird, wonach der Ablauf zu Schritt S301 zurückkehrt. Wählt der Anwender keine Dokumentenauffindung aus, sondern stattdessen die Dokumentenanzeige (Schritt S306), dann geht der Ablauf zu Schritt S307 über, in dem die Anzeigeverarbeitung von Dokumenten ausgeführt wird, wonach der Ablauf zu Schritt S301 zurückkehrt. Jede dieser Verarbeitungen ist nachstehend ausführlich beschrieben.
Obwohl die in 3 gezeigte Ablaufverarbeitung den Eindruck erweckt, kontinuierlich und der Reihe nach ausgeführt zu werden, soll verstanden werden, dass die Verarbeitungen zu deutlich verschiedenen Zeiten, in verschiedener Reihenfolge, und sogar durch verschiedene Geräte ausgeführt werden können. Es ist beispielsweise möglich, dass eine erste Maschine Dokumente eingibt, und diese Dokumente zur Auffindung und Anzeige durch eine unterschiedliche Maschine speichert. Ebenso ist es möglich, dass eine Maschine Dokumente auffindet, und sie beispielsweise über Modem 21 an eine andere Maschine zur Anzeige auf dieser unterschiedlichen Maschine übermittelt.
4 ist ein ausführliches Ablaufdiagramm, das die Eingabeverarbeitung von Dokumenten gemäß Schritt S303 gemäß 3 zeigt.
In Schritt S401 veranlasst die CPU 11 die Abtastvorrichtung 31, ein in die Abtastvorrichtung 31 eingeführtes Dokument abzutasten, um so das Originaldokument in ein computerlesbares Bitmap-Abbild dieses Dokuments umzuwandeln. Das Bitmap-Abbild kann vorübergehend im RAM 14 zur Weiterverarbeitung gespeichert werden.
In Schritt S402 leitet die CPU 11 Strukturinformationen her, die das Layout von Objekten innerhalb des Dokuments betreffen. Genauer gesagt, unterzieht die CPU 11 das Bitmap-Dokumentenabbild Blockauswahltechniken, wie die in der anhängigen US-Patentanmeldung Nr. 07/873,012 beschriebenen, um ein Dokumentenabbild in einen allgemeinen Objektsatz zu zerlegen. Derartige Blockauswahltechniken können, unter Verwendung regelbasierter Entscheidungen, verwandte Bereiche oder Gebiete innerhalb des Dokuments identifizieren und können die Abbildtypen innerhalb dieser Bereiche bestimmen. Beispielsweise verarbeitet die CPU 11 unter Verwendung von Blockauswahltechniken, wie die in der vorstehend genannten US-Patentanmeldung 07/873.012 beschriebenen, die abgetasteten, im RAM 14 gespeicherten Bitmap-Abbilder, um verwandte Bereiche im Abbild zu identifizieren. Dann identifiziert die CPU 11 den Bereichstyp, beispielsweise ob ein Bereich ein Titelbereich, ein Textbereich, ein Absatzbereich, ein Tabellenbereich oder ein Line-Art-Abbildbereich ist, wie eine Grafik, ein Halbton-Abbildbereich, ein Farb-Abbildbereich oder dergleichen.
5 zeigt Bereiche, die durch Verarbeitung in einem Dokumentenabbild gemäß den Verarbeitungsschritten in Schritt 402 identifiziert worden sind. 5 ist ein repräsentatives, aus Seite 40 eines Zeitschriftenartikels bestehendes Dokumentenabbild. Wie in 5 gezeigt, enthält die Seite 40 Titelbereiche, wie die Bereiche 41, 42 und 47 sowie Textbereiche, wie die Bereiche 43, 44 und 48. Die Seite 40 enthält ebenso Line-Art-Bereiche 45, Tabellenbereiche 49 und Halbtonobjektbereiche 46. Weitere Bereichstypen sind möglich. Gemäß der Verarbeitung in Schritt S402 identifiziert die CPU 11 die verwandten Bereiche im Dokument und bestimmt den Abbildtyp in jedem der Bereiche. In 5 wurde jeder Bereich schematisch mit einem umbeschriebenen Rechteck bezeichnet.
Gemäß 4 geht der Ablauf zu Schritt S403 über, in dem die CPU 11 den Dokumententyp identifiziert. Genauer gesagt, weisen viele Dokumente relative Standardstrukturen auf. Ein Geschäftsbrief beispielsweise enthält quasi immer einen Bereich mit Briefkopf des Unternehmens (der in Schritt S402 als Line-Art-Abbildsgebiet identifiziert werden wird), einen Bereich mit Datum und Empfänger (der in Schritt S402 als getrenntes, aber angrenzendes Textgebiet identifiziert werden wird), eine Grußformel, Textkörper- und Abschlussbereiche (die in Schritt S402 als Line-Art-Abbildsgebiete identifiziert werden werden) und eine Unterschrift (die als Line-Art-Abbildsgebiet identifiziert werden wird). Die CPU 11 speichert Vorlagen dieser Standarddokumenttypen und vergleicht in Schritt S403 die in Schritt S402 hergeleiteten Strukturinformationen mit diesen gespeicherten Vorlagen. Ist eine Übereinstimmung zwischen der gespeicherten Vorlage und den in Schritt S402 hergeleiteten Strukturinformationen gefunden, so ordnet die CPU 11 den assoziierten Dokumententyp dem in RAM 14 gespeicherten Dokumentenabbild zu.
In Schritt S404 korreliert die CPU 11 verwandte Bereiche innerhalb des Dokuments. Genauer gesagt, gibt es oft Bereiche innerhalb eines Dokuments, die zusammen betrachtet werden sollten, wie die Beschriftung für eine Figur oder die Fußnote für einen Textblock. Beispielsweise ist unter Bezugnahme auf 5 der Textbereich 48 mit dem Titel 47, und Tabellenbereich 49 mit Titel 50 verwandt. Die CPU 11 korreliert verwandte Bereiche unter Verwendung regelbasierter Entscheidungsverarbeitung.
In Schritt S405 unterzieht die CPU 11 festgelegte Dokumentenbereiche der OCR-Verarbeitung als Vorbereitung auf die Erstellung eines Auffindeindex für das Dokument. Genauer gesagt, erstellt die CPU 11 einen Auffindeindex aus den Textbereichen innerhalb des Dokuments, um das Dokumentenabbild auf der Grundlage eines wortbasierten Auffindesystems auffinden zu können. Es ist möglich, alle in Schritt S402 identifizierten Textbereiche einer OCR-Verarbeitung zu unterziehen und den Index auf der Grundlage des resultierenden Textes zu bilden, aber vorzugsweise bietet die CPU 11 dem Anwender eine wählbare Indexebene an. Genauer gesagt, bietet die CPU 11 dem Anwender die Option zur Auswahl der Indexebene gemäß folgender Ebenen an:
Ebene 1: Lediglich Titelbereiche
Ebene 2: Erste Zeile der Textbereiche
Ebene 3: auf Grafiken bezogene Textbeschriftungen
Ebene 4: Voller Text
Wählt der Anwender Ebene 1 aus („Lediglich Titel"), dann unterzieht die CPU 11 lediglich die Titelbereiche einer OCR-Verarbeitung. Der resultierende Text aus den Titelbereichen wird für einen Auffindeindex bereitgestellt, um das Auffinden des Dokuments zu ermöglichen, wenn Worte im Titel mit einer angegebenen Suchanfrage übereinstimmen. Gibt der Anwender auf gleiche Weise Indexebene 2 („Erste Zeile der Textbereiche") an, dann unterzieht die CPU 11 sowohl Titelbereiche, als auch lediglich die erste Zeile eines jeden Textbereichs einer OCR-Verarbeitung und erstellt einen Auffindeindex auf der Grundlage des resultierenden Textes. Ist Indexebene 3 ausgewählt („auf Grafiken bezogene Textbeschriftungen"), dann unterzieht die CPU 11 die Elemente in den Ebenen 1 und 2 sowie die auf Grafiken bezogene Textbereiche, wie sie in den in Schritt S404 gewonnenen Korrelationen spezifiziert sind, einer OCR-Verarbeitung. Gibt der Anwender schließlich Indexebene 4 („Voller Text") an, dann werden sowohl Titelbereiche als auch die vollen, wo auch immer lokalisierten Textbereiche der OCR-Verarbeitung unterzogen und der resultierende Text für eine Bildung des Auffindeindex bereitgestellt. Es ist möglich, weitere Ebenen der Indexierung mit einzubeziehen.
In Schritt S406 werden die aus der OCR-Verarbeitung gewonnenen ASCII-Textzeichen indiziert, und der Dokumentenauffindeindex passend aktualisiert. Zusätzlich zur Indexierung der ASCII-Textworte wird auch ein Flag indexiert, das den Objekttyp anzeigt, aus dem das Wort gewonnen wurde, das heißt Titel, Text, Beschriftung oder dergleichen. Das Flag kann als Teil des Auffindevorgangs verwendet werden, um Dokumente auf der Grundlage des Auftretens des Wortes in bestimmten Gebieten des Dokuments aufzufinden.
In Schritt S407 speichert die CPU 11 die in Schritt S402 hergeleiteten und in Schritt S406 korrelierten Strukturinformationen. 6 ist eine repräsentative Ansicht, wie die Strukturinformationen gespeichert werden. Wie in 6 gezeigt, enthalten die Strukturinformation für jedes Dokument eine Dokumentenkennung 51, die die selbe Kennung wie die der dem vollen Dokument zugeordneten ist, und durch die es möglich ist, das volle Dokumentenabbild aufzufinden. In Gebiet 52 wird der in Schritt S402 hergeleitete Dokumententyp gespeichert. Bei 53 werden alle Strukturinformationen für das Dokument und sein Layout innerhalb des Dokuments gespeichert. Wie bei 53 gezeigt, wird, für jeden in Schritt S402 identifizierten Bereich, durch die CPU 11 eine Bereichskennung, ein Bereichstyp, rechtwinklige, die Position des Bereichs auf der Seite spezifizierende Koordinaten (hier• die linken oberen Eckkoordinaten („upper left corner", ULC) und die rechten unteren Eckkoordinaten („lower right corner", LRC)) und alle in Schritt S406 identifizierten, verwandten Bereiche gespeichert. Gemäß 6 entspricht Bereich 1 dem Bereich 41 gemäß 5, und enthält, wie in 6 gezeigt, einen Typ „Titel", obere linke Koordinaten von <0,0>, untere rechte Koordinaten von <5,40> und keine verwandten Bereiche. Die übrigen, in 6 gezeigten Bereiche folgen in gleicher Weise.
Es können auch Bereichsattribute 54 gespeichert werden, wie beispielsweise eine Schriftartauswahl und eine Schriftgröße, wie in 6 gezeigt. Es können auch andere Attribute gespeichert werden, wie die Anzahl der Textzeilen, die Anzahl der Absätze oder dergleichen.
In Schritt S408 wird das Dokumentenabbild gespeichert, vorzugsweise mit OCR-verarbeitetem Dokumententext. Der Dokumententext wird in dem Fall gespeichert, dass eine schnelle Anzeige von ASCII-Textzeichen anstelle der langsameren Anzeige von Abbildern der Textbereiche gewünscht ist. Entsprechend hat die CPU 11 am Ende von Schritt S408 die Dokumenten-Eingabeverarbeitung abgeschlossen und einen text-suchbaren Index für das Dokument, die Dokumentenstruktur, und OCR-verarbeiteten Text der Textbereiche des Dokuments gespeichert, falls gewünscht.
Gemäß 3 geht der Ablauf zu Schritt S305 zur Dokumenten-Auffindungsverarbeitung über, wenn der Anwender eine Dokumentenauffindung auswählt (Schritt S304). Die im bevorzugten Ausführungsbeispiel der Erfindung verwendete Dokumenten-Auffindungsverarbeitung ist ein wortbasiertes Auffinde- und Suchsystem auf der Grundlage einer durch den Anwender angegebenen Suchanfrage. Eine derartige Anfrage kann durch eine logische Folge angegeben sein, die in jedem Dokument gefunden werden muss (eine „boolesche" Suche), oder kann durch ein natürlich-sprachbasiertes Anfragesystem spezifiziert sein. Die Anfrage kann direkt durch einen lokalen Anwender, aus der Ferne durch einen Anwender mit Sprach- oder DTMF-Telefonzugriff oder durch von einem entfernten Computer über Modem oder LAN gegebene Befehle erfolgen.
Der Anwender kann auch angeben, dass Dokumente auf der Grundlage des Auftretens eines Worts in bestimmten Dokumentenbereichen, wie Titelbereiche oder Beschriftungen, aufgefunden werden. Mit der Anfrage übereinstimmende Dokumente werden aufgefunden, und es werden ihnen Wertungen auf der Grundlage des Grads der Übereinstimmung des Dokuments mit der Anfrage zugeordnet. Höhere Wertungen können für das Auftreten von Worten in bestimmten Dokumentenbereichen zugeordnet werden, wobei die Wertung genauso wie die vorstehende Auswahl der Indexierungsebene gewichtet wird. Dadurch kann beispielsweise dem Auftreten von Worten in Titelbereichen eine höhere Wertung zugeordnet werden als dem Auftreten von Worten in Textbereichen. Ist eine Vielzahl von Dokumenten aufgefunden, dann werden sie in der Reihenfolge ihrer Wertung angezeigt.
Wählt der Anwender die Dokumenten-Anzeigeverarbeitung (Schritt S306), dann geht der Ablauf für die CPU 11 zu Schritt S307 über, um die Dokumenten-Anzeigeverarbeitung auszuführen. 7 ist ein ausführliches Ablaufdiagramm, das die Dokumenten-Anzeigeverarbeitung zeigt.
In Schritt S701 ermöglicht die CPU 11 dem Anwender die Einstellung von Anzeigeoptionen, unter denen aufgefundene Dokumente angezeigt werden. Genauer gesagt, wählt der Anwender einen von zwei Modi aus, unter dem aufgefundene Dokumente angezeigt werden: voller Dokumentenabbild- oder Blättermodus. Ist der volle Dokumentenabbildmodus ausgewählt, dann werden volle Dokumentenabbilder der aufgefundenen Dokumente angezeigt. Ist der Suchmodus ausgewählt, dann wird lediglich eine abstrahierte Strukturansicht eines jeden Dokuments angezeigt, und dadurch wird dem Anwender ein schnelles Blättern durch alle aufgefundenen Dokumente ermöglicht. Im Suchmodus können drei weitere Parameter durch den Anwender eingestellt werden. Erstens kann der Anwender auswählen, ob ASCII-Textzeichen OCR-verarbeiteter Textbereiche oder Dokumentenabbilder der Textbereiche angezeigt werden sollen. Zweitens kann der Anwender die Abstraktionsebene auswählen, auf der die Strukturansicht angezeigt wird. Neun Abstraktionsebenen sind bei diesem Ausführungsbeispiel der Erfindung möglich, obwohl andere Anordnungen möglich sind:
Ebene 1: Lediglich Struktur
Ebene 2: Titel
Ebene 3: Auffindeparameter
Ebene 4: Erste Textzeile
Ebene 5: Voller Text
Ebene 6: Tabellen
Ebene 7: Line-Art
Ebene 8: Halbton
Ebene 9: Farbe
Gemäß der ausgewählten Abstraktionsebene zeigt die CPU 11 Strukturansichten des Dokuments gemischt mit Bereichen voller Dokumentenabbilder an. Ist Abstraktionsebene 1 ausgewählt, wird lediglich eine Struktur angezeigt. Ist aber Abstraktionsebene 2 oder höher ausgewählt, werden Strukturinformationen gemischt mit Bereichen voller Dokumentenabbilder angezeigt. Auf Abstraktionsebene 2 beispielsweise werden die Strukturinformationen gemischt mit Abbildern (oder ASCII-Text, falls ausgewählt) von Titelbereichen des Dokuments angezeigt. Die erforderlichen Abbildbereiche werden aus dem vollen Dokumentenabbild gemäß der mit der Struktur gespeicherten ULC- und LRC-Koordinaten gewonnen. Ist Abstraktionsebene 3 ausgewählt, dann werden die Strukturinformationen gemischt mit Abbildern der Titel (oder ASCII-Text, falls ausgewählt) und mit den Auffindeparametern angezeigt, durch die das Dokument aufgefunden wurde. Auf Abstraktionsebene 4 werden die Strukturinformationen gemischt mit Abbildern der Titelbereiche, Auffindeparametern und der ersten Textzeile der Textabbilder in jedem Textblock angezeigt. Ist eine ASCII-Textanzeige ausgewählt, dann wird wie zuvor der ASCII-Text anstelle der Textabbilder angezeigt. Höhere Abstraktionsebenen zeigen zunehmend mehr und mehr des vollen Dokumentenabbilds gemäß der ausgewählten Abstraktionsebene an.
Zusätzlich zum Abstraktionsebenenparameter kann der Anwender im Suchmodus auch auswählen, ob eine manuell oder automatische Abbildverbesserung zugelassen werden soll. Genauer gesagt, kann bei der manuellen Abbildverbesserung, wenn die Struktur eines aufgefundenen Dokuments angezeigt wird, der Anwender einen bestimmten Bereich des Dokuments, beispielsweise mit einer Maus 19, anvisieren und von der CPU 11 die Ersetzung des angezeigten Bereichs durch das volle Dokumentenabbild anfordern. Ist eine automatische Verbesserung ausgewählt, dann ersetzt die CPU 11 automatisch gerade angezeigte Strukturinformationen durch volle Dokumentenabbilder. Die automatische Verbesserung arbeitet während ruhiger Zeitspannen des CPU-Betriebs, das heißt wenn die CPU genügend Bearbeitungszeit aufweist, um das Abbild zu verbessern. Die Verbesserung schreitet in der vorstehend angegebenen Reihenfolge der Abstraktionsebenen voran. Dadurch beginnt die CPU während ruhiger Bearbeitungszeitspannen mit der Ersetzung erstens der Titelbereiche durch volle Abbilder der Titelbereiche, zweitens der Auffindeparameterbereiche durch volle Abbilder der Auffindeparameter, drittens der ersten Zeilen der Textbereiche durch volle Abbilder der ersten Textzeilen, usw.
Nachdem in Schritt S701 die Anzeigeoptionen eingestellt wurden, geht der Ablauf zu Schritt S702 über, in dem die CPU 11 bestimmt, ob der volle Abbildmodus ausgewählt wurde. Wurde der volle Abbildmodus ausgewählt, verzweigt sich der Ablauf zu Schritt S703, in dem volle Abbilder der vollen Abbilder angezeigt werden.
Wurde andererseits der Suchmodus ausgewählt, geht der Ablauf zu Schritt S704 über, in dem die Dokumentenstruktur auf der ausgewählten Abstraktionsebene angezeigt wird. Eine repräsentative Anzeige der Strukturinformationen ist in 8 gezeigt.
In 8 hat der Anwender den Suchmodus und ASCII-Textanzeige bei Abstraktionsebene 2 ausgewählt, das heißt „Titel". Dadurch wird dem Anwender die in 8 gezeigte abstrahierte Strukturansicht des Dokuments mit ASCII-Textentsprechungen der Titelbereiche dargereicht. Die übrigen Bereiche werden einfach mit dem Bereichstyp benannt, wie im Bereichstypengebiet gemäß 6 angegeben ist. Die Benennung kann durch eine Farbcodierung des Bereichs oder, wie in 8 gezeigt, durch Anwendung einer Textmarke erfolgen. Jeder der Bereiche wird durch eine Rechteckform umfahren, deren Koordinaten aus den ULC- und LRC-Koordinaten gemäß 6 angegeben werden. Es werden ASCII-Textentsprechungen der Titelbereiche an den entsprechenden ULC- und LRC-Koordinaten angezeigt. Dadurch wird dem Anwender eine abstrahierte Strukturansicht des Dokuments mit auswählbarer Abstraktionsebene dargestellt. Dies ermöglicht dem Anwender die schnelle Suche durch aufgefundene Dokumente, um bestimmte Dokumente von Interesse zu finden.
Der Ablauf geht zu Schritt S705 über, in dem die CPU 11 bestimmt, ob der manuelle Verbesserungsparameter ausgewählt wurde. Wurde der manuelle Verbesserungsparameter nicht ausgewählt, dann verzweigt sich der Ablauf zu Schritt S706, in dem die CPU 11 automatisch strukturell angezeigte Bereiche des Dokuments während ruhiger Betriebszeiten der CPU durch die vollen Abbilder (oder ASCII-Text, falls gewählt) dieser Bereiche ersetzt. Wurde unter der Annahme der Verfügbarkeit von genügend ruhiger Rechenzeit der automatische Verbesserungsmodus ausgewählt, dann wird dem Anwender schließlich das volle Dokument dargestellt, da die CPU die strukturell dargestellten Bereiche dieses Dokuments ersetzt. Der Anwender kann zu jedem Zeitpunkt während dieses Vorgangs die Anzeige (Schritt S710) des nächsten aufgefundenen Dokuments auswählen, worauf der Ablauf zu Schritt S702 zurückkehrt, um das nächste aufgefundene Dokument anzuzeigen.
Wurde der manuelle Verbesserungsmodus ausgewählt, dann geht der Ablauf weiter zu Schritt S707, in dem die CPU 11 bestimmt, ob ein Dokumentenbereich vom Anwender anvisiert wurde. Wurde kein Dokumentenbereich vom Anwender anvisiert, tut die CPU 11 nichts oder beginnt vorzugsweise mit dem Ersetzen von Strukturbereichen des Dokuments durch volle Dokumentenabbilder, wie in Schritt S708 gezeigt. Wieder kann dieser Vorgang zu jedem Zeitpunkt durch eine Anwenderauswahl des nächsten Dokuments (Schritt S710) unterbrochen werden.
Hat der Anwender andererseits in Schritt S707 einen Bereich zur Ersetzung anvisiert, geht der Ablauf zu Schritt S709 weiter, in dem die CPU 11 das entsprechende Dokumentenabbild aus der Dokumentenabbildsdatei auffindet und den strukturell dargestellten Bereich des angezeigten Dokuments durch das volle Dokumentenabbild ersetzt. Der Anwender hat dadurch, wie in 9 gezeigt, das Gebiet 54 anvisiert, das ein Textbereich ist. Daraufhin findet die CPU 11 das zu dem rechteckigen, durch die ULC- und LRC-Koordinaten umbeschriebenen Gebiet entsprechende Dokumentenabbild oder die ASCII-Textentsprechung auf, wenn diese Option ausgewählt wurde, und ersetzt das Gebiet in 8 mit dem entsprechenden Dokumentenabbild, wie in 9 gezeigt. Der Ablauf kehrt dann zu Schritt S707 zurück, um weitere Anwendernominierungen abzuwarten.
In 9 passt die ASCII-Textentsprechung für Gebiet 54 nicht in das zugeteilte Gebiet. In dieser Situation zeigt die CPU 11 nur die passende Textmenge an, aber die CPU 11 ermöglicht das Bildschirmrollen innerhalb des Gebiets, um dem Anwender die Ansicht des gesamten Texts zu ermöglichen.
Wie ferner in 9 gezeigt, hat der Anwender die Anzeige der ersten Zeile des Texts von Bereich 44 angefordert und die ASCII-Textentsprechung dieses Texts wird bei 55 angezeigt. Wurde natürlich der Abbildmodus ausgewählt, dann wäre das Abbild der ersten Textzeile angezeigt worden.
Visiert der Anwender in Schritt S709 einen Dokumentenbereich an, der einen verwandten Bereich aufweist, wie Bereich 42 oder 43, dann ersetzt die CPU 11 nicht lediglich den anvisierten Bereich, sondern auch den verwandten Bereich. Visiert der Anwender entsprechend Bereich 42 an, der ein Titelbereich ist, ersetzt die CPU 11 den Titelbereich 42 mit dem vollen Abbild (oder Text) des Bereichs 42, und ersetzt auch den Textbereich 43 mit dem vollen Abbild (oder Text) des Textbereichs 43. Durch die Wirkung dieses Merkmals wird dem Anwender ein schneller Zugriff auf gewünschte Informationen bereitgestellt, ohne dem Anwender die Ausführung zusätzlicher Tastenbetätigungen oder dergleichen abzuverlangen.
10 zeigt eine Situation, in der der Anwender die Anzeige als Abbilder anstelle als ASCII-Text für bestimmte Bereiche ausgewählt hat. Genauer gesagt, hat der Anwender die vollen Abbilder der Bereiche 46 bzw. 48 angefordert und diese Bereiche wurden bereitgestellt, wie bei 56 bzw. 57 gezeigt ist.

Claims

Verfahren zur Anzeige von Dokumenten, mit den Schritten: Bereitstellen eines Abbildes eines Dokuments, Anlegen eines Auffindungsindex durch ein Verfahren, das die Schritte aufweist: Verarbeiten des Abbildes des Dokuments (S402) zur Identifikation von Textbereichen in dem Dokument und Nicht-Textbereichen im Dokument auf Basis regelbasierter Entscheidungen, und Umwandeln des Abbildes des Dokuments innerhalb von Textbereichen in Text (S405), gekennzeichnet durch die Schritte: Bestimmen eines Bereichstyps für jeden Textbereich (43, 44, 48) im Dokument unter Verwendung regelbasierter Entscheidungen, die automatisch auf das Abbild des Textbereichs ohne Rücksicht auf die Position des Textbereichs im Dokument und ohne Rücksicht auf ein vorbestimmtes Format für das Dokument angewendet werden, wobei der Bereichstyp einer mehrerer verschiedener vordefinierter Bereichstypen ist, die durch Regeln umspannt werden, Indexieren des umgewandelten Texts (S406), um Auffinden durch Bezugnahme auf den umgewandelten Text zu ermöglichen, Indexieren des bestimmten Bereichstyps, um das Auffinden durch Bezugnahme auf einen der vorbestimmten Bereichstypen zu ermöglichen, Speichern des Abbildes des Dokuments (S408), damit das gespeicherte Dokumentenabbild durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage in den indexierten Bereichstypen erscheint, aufgefunden werden kann, zum Bereitstellen von entsprechenden Zusammensetzungsinformationen für das Dokument, wobei die Zusammensetzungsinformationen für jeden von bis zu mehreren Bereichen des Dokuments Bereichstypinformationen enthalten, Anzeigen einer abstrahierten Ansicht des Dokuments (S704) durch Verwendung der Zusammensetzungsinformationen und Ersetzen zumindest eines Bereichs der abstrahierten Ansicht durch ein entsprechendes Abbild im Dokument (S706, S708, S709) innerhalb der abstrahierten Ansicht selbst, so dass Zusammensetzungsinformationen und Abbildinformationen gemischt angezeigt werden.
Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Zuordnen des Abbildes des Dokuments mit dem indexierten Text, damit das Abbild des Dokuments durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage im indexierten Bereichstyp erscheint, aufgefunden werden kann.
Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Festlegen einer Indexebene, die angibt, welche Bereichstypen indexiert werden sollen, und wobei der Umwandlungsschritt Textbereiche (43, 44, 48) gemäß der festgelegten Indexebene umwandelt.
Verfahren gemäß Patentanspruch 1, wobei die Bereichstypen für Textbereiche (43, 44, 48) aus einer Gruppe vorbestimmter Bereichstypen ausgewählt werden, die Titelbereiche und Haupttextbereiche enthalten.
Verfahren gemäß Patentanspruch 1, wobei der Bereichstyp für Nicht-Textbereiche aus einer Gruppe vorbestimmter Bereichstypen ausgewählt wird, die Line-Art-Bereiche, Halbtonbereiche und Tabellenbereiche enthält.
Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt schrittweises Ersetzen von Bereichen innerhalb der abstrahierten Ansicht des Dokuments durch entsprechende Vollabbilder der Bereiche des Dokuments.
Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Festlegen einer Abstraktionsebene auf der Grundlage der Zusammensetzungsinformationen zur Anzeige der abstrahierten Ansicht, wobei in dem Anzeigeschritt die abstrahierte Ansicht mit gemischten Bereichen aus Zusammensetzungsinformationen und Dokumentenabbild gemäß festgelegter Abstraktionsebene angezeigt wird.
Verfahren gemäß Patentanspruch 1, wobei im Bereitstellungsschritt eine Vielzahl von Dokumentenabbildern und entsprechenden Dokumenten-Zusammensetzungsinformationen bereitgestellt werden, und weiterhin mit dem Schritt Auffinden von einem aus der Vielzahl der Dokumentenabbilder und entsprechender Dokumenten-Zusammensetzungsinformationen zur Anzeige.
Verfahren gemäß Patentanspruch 8, wobei den aufgefundenen Dokumenten eine Wertung gemäß dem Grad der Übereinstimmung mit den Auffindeparametern zugeordnet wird und wobei die aufgefundenen Dokumente in einer von der Wertung bestimmten Reihenfolge angezeigt werden.
Verfahren gemäß Patentanspruch 8, wobei im Anzeigeschritt die abstrahierte Ansicht gemischt mit Auffindeparametern angezeigt wird.
Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Benennen der Bereiche der abstrahierten Ansicht gemäß den Zusammensetzungsinformationen für die Bereiche.
Verfahren gemäß Patentanspruch 1, wobei der Anzeigeschritt eine sprachliche Mitteilung der Dokumentenstruktur durch Text-zu-Sprache-Umwandlung der Zusammensetzungsinformationen darstellt.
Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Identifizieren des Dokumententyps basierend auf den Zusammensetzungsinformationen.
Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Identifizieren verwandter Bereiche im Dokument und wobei im Ersetzungsschritt auch verwandte Bereiche innerhalb der abstrahierten Ansicht ersetzt werden, wenn ein Bereich innerhalb der abstrahierten Ansicht ersetzt wird.
Verfahren gemäß Patentanspruch 1, wobei im Bereitstellungsschritt das Abbild des Dokuments von einer entfernten Quelle über ein Modem oder über ein lokales Netzwerk (LAN) bereitgestellt wird.
Verfahren gemäß Patentanspruch 15, wobei im Bereitstellungsschritt Abbilder der Bereiche des Dokuments über das Modem oder LAN aufgefunden werden, wenn genügend Zeit zur Verfügung steht und wobei der Ersetzungsschritt schrittweise vorgeht, so dass Bereiche in der abstrahierten Ansicht schrittweise innerhalb der abstrahierten Ansicht durch die aufgefundenen Bereiche des Dokuments ersetzt werden.
Verfahren gemäß Patentanspruch 16, wobei die schrittweise Ersetzung in einer von der Priorität unter den zahlreichen verschiedenen vorbestimmten Bereichstypen bestimmten Reihenfolge voranschreitet.
Vorrichtung zur Dokumentenanzeige mit: einer Einrichtung (31) zur Bereitstellung eines Abbildes eines Dokuments und einer Vorrichtung zum Anlegen eines Auffindeindex, wobei die Vorrichtung zum Anlegen eines Auffindeindex aufweist: eine erste Speichereinrichtung zur Speicherung eines Dokumentenabbildes und eines Auffindeindex, eine zweiten Speichereinrichtung zur Speicherung der Verarbeitungsschritte zur Verarbeitung des Dokumentenabbildes, um Textbereiche (43, 44, 48) im Dokument und Nicht-Textbereiche im Dokument auf der Grundlage regelbasierter Entscheidungen zu identifizieren und um das Dokumentenabbild in Textbereichen (43, 44, 48) in Text umzuwandeln, eine Verarbeitungseinrichtung (11) zur Ausführung der im zweiten Speicher gespeicherten Verarbeitungsschritte, dadurch gekennzeichnet, dass der Prozessor eingerichtet ist (11) zur Ausführung der Verarbeitungsschritte: Bestimmen eines Bereichstyps für jeden Textbereich im Dokument unter Verwendung regelbasierter Entscheidungen, die automatisch auf das Abbild des Textbereichs ohne Rücksicht auf die Position des Textbereichs im Dokument und ohne Rücksicht auf ein vorbestimmtes Format für das Dokument angewendet werden, wobei der Bereichstyp einer der Vielzahl an verschiedenen vordefinierten Bereichstypen ist, die durch Regeln umspannt werden, Indexieren des umgewandelten Texts, um Auffinden durch Bezugnahme auf den umgewandelten Text zu ermöglichen, Indexieren des bestimmten Bereichstyps, um Auffinden durch Bezugnahme auf einen der vorbestimmten Bereichstypen zu ermöglichen, und wobei die erste Speichereinrichtung eingerichtet ist, das Dokumentenabbild zu speichern, so dass das gespeicherte Dokumentenabbild durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage in den indexierten Bereichstypen erscheint, aufgefunden werden kann, zur Bereitstellung entsprechender Zusammensetzungsinformationen (34) für das Dokument, wobei die Zusammensetzungsinformationen Bereichstypeninformationen für jede der bis zu einer Vielzahl von Bereichen im Dokument enthalten, wobei die Anzeigevorrichtung, weiterhin aufweist: eine Einrichtung (17) zur Anzeige einer abstrahierten Ansicht des Dokuments unter Verwendung der Zusammensetzungsinformationen, und einer Ersetzungseinrichtung zur Ersetzung zumindest eines Bereichs der abstrahierten Ansicht durch ein entsprechendes Abbild im Dokument innerhalb der abstrahierten Ansicht selbst, so dass Zusammensetzungsinformationen und Abbildinformationen gemischt angezeigt werden.
Vorrichtung gemäß Patentanspruch 18, ferner mit einer Anzeigeschnittstelle, wobei der zweite Speicherbereich mit Befehlen zum Auffinden eines Dokuments und zur Übertragung einer abstrahierten Ansicht zu der Anzeigeschnittstelle programmiert ist, wobei Dokumentenbereiche gemäß entsprechender Bereichstypen identifiziert werden.
Vorrichtung gemäß Patentanspruch 19, wobei der zweite Speicherbereich mit Befehlen zur Ersetzung von Bereichen innerhalb der abstrahierten Ansicht aufgefundener Dokumente durch entsprechende Bereiche aus dem Dokumentenabbild programmiert sind.
Vorrichtung gemäß Patentanspruch 19, weiterhin mit einer Wertungseinrichtung zur Zuordnung einer Wertung zu aufgefundenen Dokumenten gemäß dem Grad der Übereinstimmung mit den Auffindeparametern, wobei die aufgefundenen Dokumente in einer von der Wertung bestimmten Reihenfolge angezeigt werden.
Vorrichtung gemäß Patentanspruch 18, wobei die Verarbeitungsschritte weiterhin die Zuordnung des Dokumentenabbildes zu dem indexierten Text umfassen, damit das Dokumentenabbild durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage im indexierten Bereichstyp erscheint, aufgefunden werden kann.
Vorrichtung gemäß Patentanspruch 18, wobei die Verarbeitungsschritte die Festlegung einer Indexebene umfassen, die angibt, welche Bereichstypen indexiert werden sollen, und wobei der Verarbeitungsschritt zur Umwandlung Textbereiche gemäß der festgelegten Indexebene umwandelt.
Vorrichtung gemäß Patentanspruch 18, bei der die Bereichstypen für Textbereiche aus einer Gruppe vorbestimmter Bereichstypen ausgewählt werden, die Titelbereiche und Haupttextbereiche enthält.
Vorrichtung gemäß Patentanspruch 18, bei der der Bereichstyp für Nicht-Textbereiche aus einer Gruppe vorbestimmter Bereichstypen, die Line-Art-Bereiche, Halbtonbereiche und Tabellenbereiche enthält, ausgewählt wird.
Vorrichtung gemäß Patentanspruch 19, weiterhin mit einer ein Modem (21) oder durch eine Schnittstelle (15) zu einem lokalen Netzwerk (LAN) umfassende Datenübertragungseinrichtung, wobei Dokumente über die Datenübertragungseinrichtung aufgefunden werden.
Vorrichtung gemäß Patentanspruch 26, weiterhin mit einer Auffindeeinrichtung zum Auffinden von Abbildern von Bereichen des Dokuments über das Modem (21) oder LAN (16), wenn genügend Zeit zur Verfügung steht, und einer Ersetzungseinrichtung zur schrittweisen Ersetzung von Bereichen innerhalb der abstrahierten Ansicht durch die aufgefundenen Abbilder der Bereiche des Dokuments.
Vorrichtung gemäß Patentanspruch 20 oder 27, wobei die schrittweise Ersetzung in einer von der Priorität unter einer Vielzahl von verschiedenen vorbestimmten Bereichstypen bestimmten Reihenfolge voranschreitet.
Vorrichtung gemäß Patentanspruch 18, weiterhin mit einer Festlegungseinrichtung zur Festlegung einer Abstraktionsebene auf der Grundlage von Zusammensetzungsinformationen zur Anzeige der abstrahierten Ansicht des Dokuments, wobei die abstrahierte Ansicht mit gemischten Bereichen von Zusammensetzungsinformationen und Dokumentenabbild gemäß der festgelegten Abstraktionsebene angezeigt wird.
Vorrichtung gemäß Patentanspruch 18, wobei eine Vielzahl von Dokumentenbildern und entsprechenden Dokumenten-Zusammensetzungsinformationen bereitgestellt werden, und die weiterhin eine Auffindeeinrichtung zum Auffinden von einem aus der Vielzahl von Dokumentenabbildern und entsprechenden Dokumenten-Zusammensetzungsinformationen zur Anzeige umfasst.
Vorrichtung gemäß Patentanspruch 30, weiterhin mit einer zur Zuordnung von Werten zu aufgefundenen Dokumenten gemäß dem Grad der Übereinstimmung mit den Auffindeparametern eingerichteten Wertungseinrichtung, wobei die aufgefundenen Dokumente in einer von der Wertung bestimmten Reihenfolge angezeigt werden.
Vorrichtung gemäß Patentanspruch 30, wobei die Anzeigeeinrichtung zur Anzeige der mit Auffindeparametern gemischten abstrahierten Ansicht eingerichtet ist.
Vorrichtung gemäß Patentanspruch 18, weiterhin mit einer Benennungseinrichtung zur Benennung von Strukturbereichen der abstrahierten Ansicht gemäß den Zusammensetzungsinformationen für die Bereiche.
Vorrichtung gemäß Patentanspruch 18, wobei die Anzeigeeinrichtung zur Bereitstellung einer sprachlichen Mitteilung der Dokumentenstruktur durch Text-zu-Sprache-Umwandlung der Zusammensetzungsinformationen eingerichtet ist.
Vorrichtung gemäß Patentanspruch 18, weiterhin mit einer Identifikationseinrichtung zur Identifikation des Dokumententyps basierend auf den Zusammensetzungsinformationen.
Vorrichtung gemäß Patentanspruch 18, weiterhin mit einer Identifikationseinrichtung zur Identifikation verwandter Bereiche im Dokument, und wobei im Ersetzungsschritt auch verwandte Bereiche innerhalb der abstrahierten Ansicht ersetzt werden, wenn ein Bereich innerhalb der abstrahierten Ansicht ersetzt wird.
Vorrichtung gemäß Patentanspruch 18, wobei Textbereiche des Dokuments durch Textbereiche des Dokuments oder durch Textentsprechungen gemäß einer manuellen Auswahl ersetzt werden.
Vorrichtung gemäß Patentanspruch 18, wobei das Abbild des Dokuments von einer entfernten Quelle über ein Modem (21) oder ein lokales Netzwerk (LAN) (16) bereitgestellt wird.
Vorrichtung gemäß Patentanspruch 38, wobei Abbilder von Bereichen des Dokuments über das Modem (21) oder LAN (16) aufgefunden werden, wenn genügend Zeit zur Verfügung steht, und wobei die Ersetzung schrittweise vorgeht, so dass Bereiche der abstrahierten Ansicht schrittweise innerhalb der abstrahierten Ansicht durch die aufgefundenen Abbildern der Bereiche des Dokuments ersetzt werden.
Vorrichtung gemäß Patentanspruch 39, bei der die schrittweise Ersetzung in einer von der Priorität unter den zahlreichen verschiedenen vorbestimmten Bereichstypen bestimmten Reihenfolge voranschreitet.
Vorrichtung zur Dokumentenanzeige gemäß Patentanspruch 18, wobei die Ersetzungseinrichtung aufweist: einen ersten Speicherbereich, aus dem ein Abbild eines Dokuments und entsprechende Zusammensetzungsinformationen für das Dokument aufgefunden werden können, einen zweiten Speicherbereich zur Speicherung der Verarbeitungsschritte und einen Prozessor (11) zur Ausführung der im zweiten Speicher gespeicherten Verarbeitungsschritte, wobei der zweite Speicher mit Befehlen zur Anzeige der abstrahierten Ansicht eines aufgefundenen Dokuments gemäß den Zusammensetzungsinformationen auf einer Anzeigeeinheit und zur Ersetzung eines ausgewählten Bereichs der abstrahierten Ansicht durch ein entsprechendes Dokumentenabbild innerhalb der abstrahierten Ansicht selbst programmiert wurde, so dass Zusammensetzungsinformationen und Abbildinformationen gemischt angezeigt werden.
Vorrichtung gemäß Patentanspruch 41, weiterhin mit einer Eingabeeinrichtung zur Eingabe von Bedienerfestlegungen, und wobei der zweite Speicher Verarbeitungsschritte enthält, um die Festlegung einer Abstraktionsebene, auf der die abstrahierte Ansicht angezeigt wird, zu ermöglichen, in welcher gemischte Bereiche von Zusammensetzungsinformationen und Dokumentenabbild gemäß der festgelegten Abstraktionsebene angezeigt werden.
Vorrichtung gemäß Patentanspruch 41, wobei der erste Speicher eine Vielzahl von Dokumentenabbildern und eine Vielzahl von entsprechenden Zusammensetzungsinformationen enthält, und wobei der zweite Speicher Verarbeitungsschritte zum Auffinden von einem aus der Vielzahl von gespeicherten Dokumentenabbilder und entsprechenden Dokumenten-Zusammensetzungsinformationen zur Anzeige enthält.
Datenspeichermedium zur Beförderung des Informationsinhalts einer Vielzahl von Dokumenten und weiterhin zur Beförderung des durch das Verfahren gemäß Patentanspruch 1 erstellten Auffindeindex, so dass die Gesamtstruktur eines Dokuments für die Anzeige ohne die Auffindung des gesamten Informationsinhalts des Dokuments aufgefunden werden kann.
Computerprogramm, das computerausführbare Befehle zur Durchführung aller Schritte eines jeden Verfahrens gemäß einem der Patentansprüche 1 bis 17 enthält.
Computerlesbares Speichermedium zur Speicherung eines Computerprogramms gemäß Patentanspruch 45.
Signal zur Beförderung des Informationsinhalts einer Vielzahl von Dokumenten und ferner zur Zuführung des durch das Verfahren gemäß Patentanspruch 1 erstellten Auffindeindex, so dass die Gesamtstruktur eines Dokuments für die Anzeige ohne die Auffindung des gesamten Informationsinhalts des Dokuments aufgefunden werden kann.