DE69434620T2 - Verfahren und Gerät zum Herstellen, Indexieren und Anschauen von zusammengefassten Dokumenten - Google Patents

Verfahren und Gerät zum Herstellen, Indexieren und Anschauen von zusammengefassten Dokumenten Download PDF

Info

Publication number
DE69434620T2
DE69434620T2 DE69434620T DE69434620T DE69434620T2 DE 69434620 T2 DE69434620 T2 DE 69434620T2 DE 69434620 T DE69434620 T DE 69434620T DE 69434620 T DE69434620 T DE 69434620T DE 69434620 T2 DE69434620 T2 DE 69434620T2
Authority
DE
Germany
Prior art keywords
document
text
areas
image
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69434620T
Other languages
English (en)
Other versions
DE69434620D1 (de
Inventor
Inc. Douglas L. łc/o Canon Info. Systems Costa Mesa Palmer
Inc. Toshiaki łc/o Canon Info. Systems Costa Mesa Yagasaki
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Application granted granted Critical
Publication of DE69434620D1 publication Critical patent/DE69434620D1/de
Publication of DE69434620T2 publication Critical patent/DE69434620T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • G06F16/313Selection or weighting of terms for indexing

Description

  • Die vorliegende Erfindung bezieht sich auf ein Verfahren und eine Vorrichtung zur Erstellung einer Sammlung indexierter Dokumentenabbilder, wobei die Dokumentenabbilder durch den Index aufgefunden werden können, und auf ein Verfahren und eine Vorrichtung zur schnellen Suche durch Dokumentenabbilder durch Ansehen abstrahierter Strukturansichten der Dokumentenabbilder anstelle der Dokumentenabbilder selbst.
  • Seit kurzem sind immer größere Speichergeräte verfügbar, und es ist möglich geworden, Dokumente nicht nur einfach als ASCII-Text, sondern auch als volle naturgetreue Nachbildung des Dokuments zu speichern. Genauer gesagt, ist es heute üblich, ein Dokument in ein computerlesbares Bitmap-Abbild des Dokuments umzuwandeln und das Bitmap-Abbild des Dokuments zu speichern. Entsprechend ist es jetzt möglich, ein Dokument in computerlesbarer Form zu speichern und nicht nur Text, sondern auch Bilder, Line-Art, Graphiken, Tabellen und andere Nicht-Textobjekte im Dokument anzuzeigen, wohingegen die ASCII-Textspeicherung lediglich die Speicherung und Anzeige von Textabschnitten des Dokuments zuließ. Genauso ist es möglich, Dokumente so anzuzeigen und zu speichern, dass Textattribute wie Schriftgröße, Schriftart, Position, oder dergleichen erhalten bleiben.
  • Trotz dieser Fortschritte ist es jedoch noch immer schwierig, die Dokumentenabbilder rasch im Computerspeicher aufzufinden und die computerangezeigten Dokumentenabbilder rasch durchzugehen, beispielsweise in der Situation eines Computeranwenders, der viele Dokumentenabbilder auffindet und diese Dokumentenabbilder durchsucht, um ein bestimmtes Dokument zu finden. Diese Schwierigkeiten sind durch mindestens zwei Einschränkungen begründet. Erstens beschränken die momentanen Bandbreiteneinschränkungen in Computersystemen die Geschwindigkeit, mit der Dokumente im Speicher aufgefunden und angezeigt werden können. Bei einer Auflösung von 300 Punkten pro Zoll (dpi) (120 Punkte pro cm) erfordert ein normales 8½-auf-11-Zoll- (21,6-auf-27,9-cm-) Dokument in Schwarzweiß ungefähr 8,4 Millionen Bits zur Speicherung eines vollen Dokumentenabbilds. Die Hinzufügung von Halbtönen (Graustufen) oder Farbe zum Abbild oder die Erhöhung der Auflösung, mit der das Abbild gespeichert wird, kann den Speicherbedarf mit Leichtigkeit um viele Zehn Millionen Bits erhöhen. Die zur Auffindung dieser Bits im Speicher und zur Erstellung und Anzeige des sich daraus ergebenden Abbilds erforderliche Zeit ist selbst mit einer modernen Hochgeschwindigkeits-Computerausstattung nicht zu vernachlässigen. Die Zeit wird in Situationen, in denen ein Dokumentenabbild im Speicher eines ersten Computers aufgefunden und zum Beispiel über Modem an einen zweiten Computer zur Anzeige auf dem zweiten Computer elektronisch übertragen wird, noch weiter verlängert.
  • Zweitens, selbst wenn einem Anwender ein volles Dokumentenabbild angezeigt wird, gibt es üblicherweise zu viele Informationen für den Durchschnittsanwender, um sie rasch zu verstehen. Viele der dem Anwender angezeigten Informationen sind für die Anfrage des Anwenders nicht relevant, und viel Zeit wird mit der Anzeige nichtrelevanter Informationen verschwendet, und das Vorhandensein dieser nichtrelevanten Informationen kann den Anwender bei seinem Versuch bremsen, für seine Anfrage relevante Informationen zu lokalisieren und zu verstehen.
  • Außerdem kann sich das einfache Auffinden passender Dokumente aus einer großen Sammlung zur Darstellung dem Anwender gegenüber wegen der immensen zu durchsuchenden Informationsmenge als schwierig erweisen. Übliche Systeme zur Dokumentenauffindung verlassen sich üblicherweise auf die Erstellung eines Textindex, durch den Textdokumente aufgefunden werden können. Bei Dokumentenabbildern (im Gegensatz zu Textdokumenten) wurde vorgeschlagen, die Dokumentenabbilder der optischen Zeichenerkennungs-Verarbeitung (engl. optical character recognition, „OCR processing") zu unterziehen und den resultierenden Text zu indexieren. Systeme, wie das im US-Patent 5.109.439 von Froessl vorgeschlagene, schlagen vor, dass es lediglich erforderlich ist, bestimmte Gebiete des Dokuments mit OCR zu verarbeiten, um den Indexierungsvorgang zu vereinfachen, aber nichtsdestotrotz hat sich zuvor die Erstellung eines angemessenen Index für das Auffinden von Dokumentenabbildern als schwierig erwiesen.
  • Der in „Computer", Ausgabe 25, Nr.7 im Juli 1992 in Los Alamitos, USA, auf den Seiten 10–22 veröffentlichte Artikel „A Prototype Document Image Analysis System for Technical Journals" von G. Nagy u.a. offenbart ein System zur Abbildauffindung zur Verwendung beim Zugriff auf eine Bibliothek mit Dokumenten, beispielsweise technische Zeitschriften, die ein vorbestimmtes Seitenformat aufweisen. Damit ein Anwender die Dokumente durchgehen kann, werden Textteile durch die Verwendung von OCR und regelbasierten Entscheidungen erkannt und angezeigt.
  • Der Erfindung liegt die Überwindung der vorstehend beschriebenen Schwierigkeiten als Aufgabe zugrunde.
  • Gemäß einer Ausgestaltung der Erfindung wird ein System zum schnellen Blättern in Dokumentenabbildern bereitgestellt, bei dem nicht das volle Dokumentenabbild, sondern lediglich eine abstrahierte Strukturansicht des Dokumentenabbilds angezeigt wird. Genauer gesagt, enthält die Strukturansicht des Dokumentenabbilds benannte Objekte wie „Titel", „Text", „Tabelle", „Line-Art" bzw. Strichzeichnung, „Halbton" und ähnliche üblicherweise in Dokumenten vorzufindende Objekte, und diese Objekte werden dem Anwender in einem abstrahierten strukturierten Layout zur Darstellung angezeigt, das für das volle Dokumentenabbild repräsentativ ist. Die Abstraktionsebene, und wie das Dokument auf der Anzeige wiedergegeben wird, kann vom Anwender definiert werden. Dadurch ist es dem Anwender möglich, eine hohe Abstraktionsebene zu spezifizieren, in der lediglich benannte Objekte im passenden Layout angezeigt werden. Desgleichen ist es dem Anwender auch möglich, eine niedrigere Abstraktionsebene zu spezifizieren, in der lediglich spezifische Objekttypen, wie Titel, angezeigt werden. Es ist dem Anwender auch möglich, anzugeben, dass Textobjekte als ASCII-Zeichen anstelle des Originalabbilds des Texts angezeigt werden sollen. Durch ledigliche Anzeige abstrahierter Strukturansichten von Dokumentenabbildern anstelle der vollen Dokumentenabbilder und dadurch, dass dem Anwendenden die Angabe der Abstraktionsebene gestattet wird, ist es möglich, Dokumentenabbilder rasch aufzufinden, anzuzeigen und dem Anwender die Informationen in einem rasch zu verstehenden Format darzustellen.
  • Gemäß der ersten Ausgestaltung der vorliegenden Erfindung wird Verfahren zur Anzeige von Dokumenten, mit den Schritten Bereitstellen eines Abbildes eines Dokuments, Anlegen eines Auffindungsindex durch ein Verfahren, das die Schritte aufweist, Verarbeiten des Abbildes des Dokuments zur Identifikation von Textbereichen im Dokument und Nicht-Textbereichen im Dokument auf Basis regelbasierter Entscheidungen, und Umwandeln des Abbildes des Dokuments innerhalb von Textbereichen in Text, gekennzeichnet durch die Schritte Bestimmen eines Bereichstyps für jeden Textbereich im Dokument unter Verwendung regelbasierter Entscheidungen, die automatisch auf das Abbild des Textbereichs ohne Rücksicht auf die Position des Textbereichs im Dokument und ohne Rücksicht auf ein vorbestimmtes Format für das Dokument angewendet werden, wobei der Bereichstyp ist einer der zahlreichen verschiedenen vordefinierten Bereichstypen ist, die durch Regeln umspannt werden, Indexieren des umgewandelten Texts, um Auffinden durch Bezugnahme auf den umgewandelten Text zu ermöglichen, Indexieren des bestimmten Bereichstyps, um das Auffinden durch Bezugnahme auf einen der vorbestimmten Bereichstypen zu ermöglichen, Speichern des Abbildes des Dokuments, damit das gespeicherte Dokumentenabbild durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage in den indexierten Bereichstypen erscheint, aufgefunden werden kann, zum Bereitstellen von entsprechenden Zusammensetzungsinformationen für das Dokument, wobei die Zusammensetzungsinformationen für jeden der bis zu zahlreichen Bereiche des Dokuments Bereichstypinformationen enthalten, Anzeigen einer abstrahierten Ansicht des Dokuments durch Verwendung der Zusammensetzungsinformationen und Ersetzen zumindest eines Bereichs der abstrahierten Ansicht durch ein entsprechendes Abbild im Dokument innerhalb der abstrahierten Ansicht selbst, so dass Zusammensetzungsinformationen und Abbildinformationen gemischt angezeigt werden.
  • Gemäß einer zweiten Ausgestaltung der Erfindung wird eine Anzeigevorrichtung zur Dokumentenanzeige bereitgestellt mit einer Einrichtung zur Bereitstellung eines Abbildes eines Dokuments und einer Vorrichtung zum Anlegen eines Auffindeindex, die Vorrichtung zum Anlegen eines Auffindeindex mit einer erste Speichereinrichtung zur Speicherung eines Dokumentenabbildes und eines Auffindeindex, einer zweiten Speichereinrichtung zur Speicherung der Verarbeitungsschritte zur Verarbeitung des Dokumentenabbildes, um Textbereiche im Dokument und Nicht-Textbereiche im Dokument auf der Grundlage regelbasierter Entscheidungen zu identifizieren und um das Dokumentenabbild in Textbereichen in Text umzuwandeln, einer Verarbeitungseinrichtung zur Ausführung der im zweiten Speicher gespeicherten Verarbeitungsschritte, gekennzeichnet durch den Prozessor, der zur Ausführung von Verarbeitungsschritten eingerichtet wurde, mit einer Bestimmung eines Bereichstyps für jeden Textbereich im Dokument unter Verwendung regelbasierter Entscheidungen, die automatisch auf das Abbild des Textbereichs ohne Rücksicht auf die Position des Textbereichs im Dokument und ohne Rücksicht auf ein vorbestimmtes Format für das Dokument angewendet werden, wobei der Bereichstyp einer der Vielzahl an verschiedenen vordefinierten Bereichstypen ist, die durch Regeln umspannt werden, einer Indexierung des umgewandelten Texts, um Auffinden durch Bezugnahme auf den umgewandelten Text zu ermöglichen, einer Indexierung des bestimmten Bereichstyps, um Auffinden durch Bezugnahme auf einen der vorbestimmten Bereichstypen zu ermöglichen, einem Einrichten des ersten Speichers zur Speicherung des Dokumentenabbildes, so dass das gespeicherte Dokumentenabbild durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage in den indexierten Bereichstypen erscheint, aufgefunden werden kann und einer Bereitstellung entsprechender Zusammensetzungsinformationen für das Dokument, wobei die Zusammensetzungsinformationen Bereichstypeninformationen für jede der bis zu einer Vielzahl von Bereichen im Dokument enthält, einer Anzeigevorrichtung, weiterhin mit einer Anzeigeeinrichtung zur abstrahierten Ansicht des Dokuments unter Verwendung der Zusammensetzungsinformationen und einer Ersetzungseinrichtung zur Ersetzung zumindest eines Bereichs der abstrahierten Ansicht durch ein entsprechendes Abbild im Dokument innerhalb der abstrahierten Ansicht selbst, so dass Zusammensetzungsinformationen und Abbildinformationen gemischt angezeigt werden.
  • Gemäß einer dritten Ausgestaltung der vorliegenden Erfindung wird ein Datenspeichermedium bereitgestellt zur Zuführung des Informationsinhalts einer Vielzahl von Dokumenten und weiterhin zur Zuführung des durch das Verfahren gemäß der ersten Ausgestaltung erstellten Auffindeindex, so dass die Gesamtstruktur eines Dokuments für die Anzeige ohne die Auffindung des gesamten Informationsinhalts des Dokuments aufgefunden werden kann.
  • Gemäß einer vierten Ausgestaltung der vorliegenden Erfindung gibt es ein Computerprogramm, das computerausführbare Befehle zur Durchführung aller Schritte eines jeden Verfahrens gemäß dem ersten Ausgestaltung der Erfindung enthält.
  • Gemäß einer fünften Ausgestaltung der vorliegenden Erfindung gibt es ein computerlesbares Speichermedium zur Speicherung eines Computerprogramms gemäß dem vierten Ausgestaltung der vorliegenden Erfindung.
  • Gemäß einer sechsten Ausgestaltung der vorliegenden Erfindung gibt es ein Signal zur Zuführung des Informationsinhalts einer Vielzahl von Dokumenten und ferner zur Zuführung des durch das Verfahren gemäß dem im ersten Ausgestaltung der vorliegenden Erfindung erstellten Auffindeindex, so dass die Gesamtstruktur eines Dokuments für die Anzeige ohne die Auffindung des gesamten Informationsinhalts des Dokuments aufgefunden werden kann.
  • Diese Kurzfassung wurde zum schnellen Verständnis der Natur der Erfindung bereitgestellt. Ein vollständigeres Verständnis der Erfindung lässt sich durch Bezugnahme auf die nachstehende ausführliche Beschreibung des bevorzugten Ausführungsbeispiels der Erfindung in Verbindung mit der beiliegenden Zeichnung gewinnen.
  • Kurzbeschreibung der Zeichnung
  • Es zeigen:
  • 1 eine perspektivische Ansicht der äußeren Erscheinung einer erfindungsgemäßen Vorrichtung, und 2 ein Blockschaltbild der generellen Funktionsweise der Vorrichtung gemäß 1,
  • 3 eine vollständige Darstellung der generellen Funktionsweise der Vorrichtung gemäß 1,
  • 4 eine vollständige Darstellung der erfindungsgemäßen Eingabe und Indexierung von Dokumenten,
  • 5 eine Ansicht eines repräsentativen Eingabedokuments,
  • 6 eine Ansicht zur Beschreibung, wie verschiedene innerhalb des Originaldokuments identifizierte Blöcke gespeichert werden,
  • 7 ein Ablaufdiagramm zur Erklärung der erfindungsgemäßen Dokumentenanzeige,
  • 8 bis 10 Ansichten einer repräsentativen Anzeige eines abstrahierten Dokuments, wobei die 9 und 10 Ansichten von Erweiterungen ausgewählter Gebiete des abstrahierten Dokuments sind.
  • Ausführliche Beschreibung des bevorzugten Ausführungsbeispiels
  • Die 1 und 2 zeigen eine erfindungsgemäße Vorrichtung.
  • Wie in diesen Figuren gezeigt, bezeichnet das Bezugszeichen 10 eine Personal-Computer-Ausstattung, wie einen IBM-PC oder PC-kompatiblen Computer. Die Computer-Ausstattung enthält eine CPU 11 (zentrale Verarbeitungseinheit, „central processing unit"), wie z.B. einen 80386 Prozessor, der gespeicherte Programmbefehle, wie anwendergewählte Anwendungsprogramme ausführt, die im RAM 12 (Speicher mit wahlfreiem Zugriff, „random access memory") gespeichert sind oder spezialisierte Funktionen wie Systemhochfahrprogramme oder ein BIOS, die im ROM 14 (Festwertspeicher, „read only memory") gespeichert sind. Die Computer-Ausstattung 10 enthält ferner eine Schnittstelle zum lokalen Netzwerk 15, die eine Schnittstelle zu einem lokalen Netzwerk 16 bereitstellt, wodurch die Computer-Ausstattung 10 auf Dateien, wie Dokumentdateien auf einem entfernten Dateien-Server zugreifen oder Dateien zum Fernausdruck versenden oder entfernten Geräten Zugriff auf Dokumentenabbilder auf der Ausstattung 10 erlauben kann, oder auf andere Weise mit einem lokalen Netzwerk gemäß bekannten Techniken, wie durch Dateienaustausch oder durch Senden oder Empfangen elektronischer Post, interagieren kann.
  • Die Computer-Ausstattung 10 enthält ferner einen Monitor 17 zur Anzeige grafischer Abbilder und eine Tastatur 19 bzw. Maus 19, um dem Anwender die Auswahl von Gebieten auf Monitor 17 und die Eingabe von Informationen zu ermöglichen.
  • Ein Massenspeicher 20, wie eine Festplatte oder ein Diskettenlaufwerk, ist zum Zugriff durch die CPU 11 angeschlossen. Der Massenspeicher 20 enthält typischerweise gespeicherte Programmbefehlsfolgen, wie eine Befehlsfolge zum erfindungsgemäßen Abtasten, Indexieren, Auffinden und Anzeigen von Dokumenten, sowie weitere gespeicherte Programmbefehlsfolgen zur Ausführung von wortverarbeitenden Anwendungsprogrammen, optischen Zeichenerkennungs- (OCR-) Programmen, Anwendungsprogrammen zur Blockauswahl, Tabellenkalkulation und weitere Informationen und Datenverarbeitungsprogramme. Der Massenspeicher 20 enthält ferner Dokumentenindextabellen, die Indexinformationen enthalten, durch die sowohl Dokumente als auch Bitmap-Abbilder von Dokumenten, Dokumentstrukturen, und ASCII-Text für Textgebiete des Dokuments aufgefunden werden können. Weitere Daten können nach Wunsch des Anwenders auf dem Massenspeicher 20 gespeichert werden.
  • Ein Modem 21, eine Faxschnittstelle 22 und eine Sprachtelefonschnittstelle 24 werden bereitgestellt, so dass sich die CPU an eine normale Telefonleitung 25 anschließen kann. Sowohl dem Modem 21, als auch der Faxschnittstelle 22 und der Sprachtelefonschnittstelle 24 wird ein Zugriff auf die Telefonleitung 25 über einen Telefonleitungsschalter 26 gegeben, der unter Steuerung durch die CPU 11 eingeschaltet wird, um die Telefonleitung 25 an entweder das Modem 21, die Faxschnittstelle 22 oder die Sprachtelefonschnittstelle 24, passend zu den auf der Telefonleitung gesendeten und empfangenen Daten, anzuschließen. Dadurch kann die CPU 11 binäre Daten, wie ASCII-Textdateien oder Dokumentenabbild-Dateien, über das Modem 21 senden und empfangen, und kann sie durch einen entfernten Computer über das Modem 21 gesteuert werden, kann sie Faxnachrichten über die Faxschnittstelle 22 senden und empfangen, und sie kann auf einer normalen Telefonleitung über die Sprachtelefonschnittstelle 24 interagieren. Im Hinblick darauf ist für die Telefonschnittstelle 24 ein DTMF-Dekoder 24A bereitgestellt, um Töne auf der Telefonleitung 25 zu dekodieren, die Anwendertastenbetätigungen auf einem Telefonbedienfeld entsprechen. Gemäß den im Massenspeicher 20 gespeicherten Programmbefehlsfolgen werden die decodierten Töne durch die CPU 11 in Anwenderbefehle übersetzt und diese Anwenderbefehle ausgeführt, um vorbestimmte Maßnahmen gemäß den Anwendertastenbetätigungen auf dem Telefonbedienfeld zu ergreifen.
  • Ein üblicher Text-zu-Sprache-Wandler 27 ist mit der CPU 11 verbunden. Der Text-zu-Sprache-Wandler 27 übersetzt ihm zugesendete Textzeilen und wandelt diese Textzeichenketten in Audio-Sprachinformationen um. Der Text-Zu-Sprache-Wandler 27 führt die Audio-Sprachinformationen entweder einem Lautsprecher 28 zur sprachlichen Mitteilung an einen lokalen Computeranwender zu oder er führt die Audio-Sprachinformationen der Sprachtelefonschnittstelle 24 zur sprachlichen Mitteilung über übliche Sprachtelefonleitungen zu.
  • Auch ein MIDI-(MIDI-Protokoll, „Musical Instrument Digital Interface") Synthesizer 30 ist mit der CPU 11 verbunden, und übersetzt MIDI-Musikbefehle von der CPU 11, indem er diese MIDI-Musikbefehle in Audiosignalverläufe umwandelt. Im Gegenzug werden die Audiosignalverläufe über den Lautsprecher 28 abgespielt oder der Sprachtelefonschnittstelle 24 zum Abspielen über eine übliche Sprachtelefonleitung zugeführt.
  • Eine Abtastvorrichtung 31 arbeitet zur Abtastung von auf Papierblättern gedruckten Originaldokumenten, und zur Umwandlung dieser Originaldokumente in eine bitweise computerlesbare Darstellung dieses Dokuments. Die Abtastvorrichtung 31 kann eine einfache Schwarzweiß-Abtastvorrichtung sein, vorzugsweise weist die Abtastvorrichtung 31 aber wenigstens Halbton-(Graustufen-) Verarbeitungsfähigkeit und/oder Farbverarbeitungsfähigkeit auf.
  • Ein Drucker 32 ist zur Bildung von Dokumentenabbildern unter der Steuerung durch die CPU 11 bereitgestellt. Der Drucker 32 kann ein üblicher Schwarzweiß-Drucker sein, vorzugsweise weist der Drucker 32 aber Halbton- (Graustufen-) und/oder Farbfähigkeit auf.
  • Eine CD-ROM 34, wie ein optische Disk, ist zum Zugriff durch die CPU 11 angeschlossen. Die CD-ROM 34 funktioniert zur Erweiterung des Speichers im Massenspeicher 20 und enthält zusätzliche Informationen in bezug auf Dokumentenindizes, Dokumentenabbilder und Dokumentenstruktur. Es ist auch möglich, ein optisches Einfach-Schreib-/Vielfach-Lese- (WORM, „wirte-once-read-many") Gerät oder eine übliche optische Schreib-/Lese-Vorrichtung bereitzustellen, um die Speicherfähigkeit noch weiter zu erweitern. Zusätzlich kann die CPU 11 über das lokale Netzwerk 16 auf auf entfernten Orten von Dateien-Servern gespeicherte Dokumentenindizes und Dokumentenabbilder zugreifen, und über Modem 21 kann die CPU 11 auf Dokumentenindizes und Dokumentenabbilder, die in zentralisierten Datenbankorten gespeichert sind, über eine übliche Sprachtelefonleitung zugreifen.
  • 3 ist ein Ablaufdiagramm, das die generelle Funktionsweise der Vorrichtung gemäß den 1 und 2 zeigt. Die in 3 gezeigten Verarbeitungsschritte werden von der CPU 11 gemäß den im Massenspeicher 20 gespeicherten und aus dem RAM 14 ausgeführten Programmbefehlsfolgen ausgeführt.
  • In Schritt S301 zeigt die CPU 11 ein Hauptauswahlmenü auf Monitor 17 an und ermöglicht dem Anwender die Auswahl eines der Menüpunkte. Hat der Anwender in Schritt S302 die Eingabe von Dokumenten ausgewählt, dann geht der Ablauf zu Schritt S303 über, in dem die Verarbeitung von Dokumentenabbildern ausgeführt wird, wonach der Ablauf zu Schritt S301 zurückkehrt. Wählt der Anwender keine Dokumenteneingabe aus, sondern stattdessen die Dokumentenauffindung (Schritt S304), dann geht der Ablauf zu Schritt S305 über, in dem die Auffindeverarbeitung von Dokumenten ausgeführt wird, wonach der Ablauf zu Schritt S301 zurückkehrt. Wählt der Anwender keine Dokumentenauffindung aus, sondern stattdessen die Dokumentenanzeige (Schritt S306), dann geht der Ablauf zu Schritt S307 über, in dem die Anzeigeverarbeitung von Dokumenten ausgeführt wird, wonach der Ablauf zu Schritt S301 zurückkehrt. Jede dieser Verarbeitungen ist nachstehend ausführlich beschrieben.
  • Obwohl die in 3 gezeigte Ablaufverarbeitung den Eindruck erweckt, kontinuierlich und der Reihe nach ausgeführt zu werden, soll verstanden werden, dass die Verarbeitungen zu deutlich verschiedenen Zeiten, in verschiedener Reihenfolge, und sogar durch verschiedene Geräte ausgeführt werden können. Es ist beispielsweise möglich, dass eine erste Maschine Dokumente eingibt, und diese Dokumente zur Auffindung und Anzeige durch eine unterschiedliche Maschine speichert. Ebenso ist es möglich, dass eine Maschine Dokumente auffindet, und sie beispielsweise über Modem 21 an eine andere Maschine zur Anzeige auf dieser unterschiedlichen Maschine übermittelt.
  • 4 ist ein ausführliches Ablaufdiagramm, das die Eingabeverarbeitung von Dokumenten gemäß Schritt S303 gemäß 3 zeigt.
  • In Schritt S401 veranlasst die CPU 11 die Abtastvorrichtung 31, ein in die Abtastvorrichtung 31 eingeführtes Dokument abzutasten, um so das Originaldokument in ein computerlesbares Bitmap-Abbild dieses Dokuments umzuwandeln. Das Bitmap-Abbild kann vorübergehend im RAM 14 zur Weiterverarbeitung gespeichert werden.
  • In Schritt S402 leitet die CPU 11 Strukturinformationen her, die das Layout von Objekten innerhalb des Dokuments betreffen. Genauer gesagt, unterzieht die CPU 11 das Bitmap-Dokumentenabbild Blockauswahltechniken, wie die in der anhängigen US-Patentanmeldung Nr. 07/873,012 beschriebenen, um ein Dokumentenabbild in einen allgemeinen Objektsatz zu zerlegen. Derartige Blockauswahltechniken können, unter Verwendung regelbasierter Entscheidungen, verwandte Bereiche oder Gebiete innerhalb des Dokuments identifizieren und können die Abbildtypen innerhalb dieser Bereiche bestimmen. Beispielsweise verarbeitet die CPU 11 unter Verwendung von Blockauswahltechniken, wie die in der vorstehend genannten US-Patentanmeldung 07/873.012 beschriebenen, die abgetasteten, im RAM 14 gespeicherten Bitmap-Abbilder, um verwandte Bereiche im Abbild zu identifizieren. Dann identifiziert die CPU 11 den Bereichstyp, beispielsweise ob ein Bereich ein Titelbereich, ein Textbereich, ein Absatzbereich, ein Tabellenbereich oder ein Line-Art-Abbildbereich ist, wie eine Grafik, ein Halbton-Abbildbereich, ein Farb-Abbildbereich oder dergleichen.
  • 5 zeigt Bereiche, die durch Verarbeitung in einem Dokumentenabbild gemäß den Verarbeitungsschritten in Schritt 402 identifiziert worden sind. 5 ist ein repräsentatives, aus Seite 40 eines Zeitschriftenartikels bestehendes Dokumentenabbild. Wie in 5 gezeigt, enthält die Seite 40 Titelbereiche, wie die Bereiche 41, 42 und 47 sowie Textbereiche, wie die Bereiche 43, 44 und 48. Die Seite 40 enthält ebenso Line-Art-Bereiche 45, Tabellenbereiche 49 und Halbtonobjektbereiche 46. Weitere Bereichstypen sind möglich. Gemäß der Verarbeitung in Schritt S402 identifiziert die CPU 11 die verwandten Bereiche im Dokument und bestimmt den Abbildtyp in jedem der Bereiche. In 5 wurde jeder Bereich schematisch mit einem umbeschriebenen Rechteck bezeichnet.
  • Gemäß 4 geht der Ablauf zu Schritt S403 über, in dem die CPU 11 den Dokumententyp identifiziert. Genauer gesagt, weisen viele Dokumente relative Standardstrukturen auf. Ein Geschäftsbrief beispielsweise enthält quasi immer einen Bereich mit Briefkopf des Unternehmens (der in Schritt S402 als Line-Art-Abbildsgebiet identifiziert werden wird), einen Bereich mit Datum und Empfänger (der in Schritt S402 als getrenntes, aber angrenzendes Textgebiet identifiziert werden wird), eine Grußformel, Textkörper- und Abschlussbereiche (die in Schritt S402 als Line-Art-Abbildsgebiete identifiziert werden werden) und eine Unterschrift (die als Line-Art-Abbildsgebiet identifiziert werden wird). Die CPU 11 speichert Vorlagen dieser Standarddokumenttypen und vergleicht in Schritt S403 die in Schritt S402 hergeleiteten Strukturinformationen mit diesen gespeicherten Vorlagen. Ist eine Übereinstimmung zwischen der gespeicherten Vorlage und den in Schritt S402 hergeleiteten Strukturinformationen gefunden, so ordnet die CPU 11 den assoziierten Dokumententyp dem in RAM 14 gespeicherten Dokumentenabbild zu.
  • In Schritt S404 korreliert die CPU 11 verwandte Bereiche innerhalb des Dokuments. Genauer gesagt, gibt es oft Bereiche innerhalb eines Dokuments, die zusammen betrachtet werden sollten, wie die Beschriftung für eine Figur oder die Fußnote für einen Textblock. Beispielsweise ist unter Bezugnahme auf 5 der Textbereich 48 mit dem Titel 47, und Tabellenbereich 49 mit Titel 50 verwandt. Die CPU 11 korreliert verwandte Bereiche unter Verwendung regelbasierter Entscheidungsverarbeitung.
  • In Schritt S405 unterzieht die CPU 11 festgelegte Dokumentenbereiche der OCR-Verarbeitung als Vorbereitung auf die Erstellung eines Auffindeindex für das Dokument. Genauer gesagt, erstellt die CPU 11 einen Auffindeindex aus den Textbereichen innerhalb des Dokuments, um das Dokumentenabbild auf der Grundlage eines wortbasierten Auffindesystems auffinden zu können. Es ist möglich, alle in Schritt S402 identifizierten Textbereiche einer OCR-Verarbeitung zu unterziehen und den Index auf der Grundlage des resultierenden Textes zu bilden, aber vorzugsweise bietet die CPU 11 dem Anwender eine wählbare Indexebene an. Genauer gesagt, bietet die CPU 11 dem Anwender die Option zur Auswahl der Indexebene gemäß folgender Ebenen an:
    Ebene 1: Lediglich Titelbereiche
    Ebene 2: Erste Zeile der Textbereiche
    Ebene 3: auf Grafiken bezogene Textbeschriftungen
    Ebene 4: Voller Text
  • Wählt der Anwender Ebene 1 aus („Lediglich Titel"), dann unterzieht die CPU 11 lediglich die Titelbereiche einer OCR-Verarbeitung. Der resultierende Text aus den Titelbereichen wird für einen Auffindeindex bereitgestellt, um das Auffinden des Dokuments zu ermöglichen, wenn Worte im Titel mit einer angegebenen Suchanfrage übereinstimmen. Gibt der Anwender auf gleiche Weise Indexebene 2 („Erste Zeile der Textbereiche") an, dann unterzieht die CPU 11 sowohl Titelbereiche, als auch lediglich die erste Zeile eines jeden Textbereichs einer OCR-Verarbeitung und erstellt einen Auffindeindex auf der Grundlage des resultierenden Textes. Ist Indexebene 3 ausgewählt („auf Grafiken bezogene Textbeschriftungen"), dann unterzieht die CPU 11 die Elemente in den Ebenen 1 und 2 sowie die auf Grafiken bezogene Textbereiche, wie sie in den in Schritt S404 gewonnenen Korrelationen spezifiziert sind, einer OCR-Verarbeitung. Gibt der Anwender schließlich Indexebene 4 („Voller Text") an, dann werden sowohl Titelbereiche als auch die vollen, wo auch immer lokalisierten Textbereiche der OCR-Verarbeitung unterzogen und der resultierende Text für eine Bildung des Auffindeindex bereitgestellt. Es ist möglich, weitere Ebenen der Indexierung mit einzubeziehen.
  • In Schritt S406 werden die aus der OCR-Verarbeitung gewonnenen ASCII-Textzeichen indiziert, und der Dokumentenauffindeindex passend aktualisiert. Zusätzlich zur Indexierung der ASCII-Textworte wird auch ein Flag indexiert, das den Objekttyp anzeigt, aus dem das Wort gewonnen wurde, das heißt Titel, Text, Beschriftung oder dergleichen. Das Flag kann als Teil des Auffindevorgangs verwendet werden, um Dokumente auf der Grundlage des Auftretens des Wortes in bestimmten Gebieten des Dokuments aufzufinden.
  • In Schritt S407 speichert die CPU 11 die in Schritt S402 hergeleiteten und in Schritt S406 korrelierten Strukturinformationen. 6 ist eine repräsentative Ansicht, wie die Strukturinformationen gespeichert werden. Wie in 6 gezeigt, enthalten die Strukturinformation für jedes Dokument eine Dokumentenkennung 51, die die selbe Kennung wie die der dem vollen Dokument zugeordneten ist, und durch die es möglich ist, das volle Dokumentenabbild aufzufinden. In Gebiet 52 wird der in Schritt S402 hergeleitete Dokumententyp gespeichert. Bei 53 werden alle Strukturinformationen für das Dokument und sein Layout innerhalb des Dokuments gespeichert. Wie bei 53 gezeigt, wird, für jeden in Schritt S402 identifizierten Bereich, durch die CPU 11 eine Bereichskennung, ein Bereichstyp, rechtwinklige, die Position des Bereichs auf der Seite spezifizierende Koordinaten (hier• die linken oberen Eckkoordinaten („upper left corner", ULC) und die rechten unteren Eckkoordinaten („lower right corner", LRC)) und alle in Schritt S406 identifizierten, verwandten Bereiche gespeichert. Gemäß 6 entspricht Bereich 1 dem Bereich 41 gemäß 5, und enthält, wie in 6 gezeigt, einen Typ „Titel", obere linke Koordinaten von <0,0>, untere rechte Koordinaten von <5,40> und keine verwandten Bereiche. Die übrigen, in 6 gezeigten Bereiche folgen in gleicher Weise.
  • Es können auch Bereichsattribute 54 gespeichert werden, wie beispielsweise eine Schriftartauswahl und eine Schriftgröße, wie in 6 gezeigt. Es können auch andere Attribute gespeichert werden, wie die Anzahl der Textzeilen, die Anzahl der Absätze oder dergleichen.
  • In Schritt S408 wird das Dokumentenabbild gespeichert, vorzugsweise mit OCR-verarbeitetem Dokumententext. Der Dokumententext wird in dem Fall gespeichert, dass eine schnelle Anzeige von ASCII-Textzeichen anstelle der langsameren Anzeige von Abbildern der Textbereiche gewünscht ist. Entsprechend hat die CPU 11 am Ende von Schritt S408 die Dokumenten-Eingabeverarbeitung abgeschlossen und einen text-suchbaren Index für das Dokument, die Dokumentenstruktur, und OCR-verarbeiteten Text der Textbereiche des Dokuments gespeichert, falls gewünscht.
  • Gemäß 3 geht der Ablauf zu Schritt S305 zur Dokumenten-Auffindungsverarbeitung über, wenn der Anwender eine Dokumentenauffindung auswählt (Schritt S304). Die im bevorzugten Ausführungsbeispiel der Erfindung verwendete Dokumenten-Auffindungsverarbeitung ist ein wortbasiertes Auffinde- und Suchsystem auf der Grundlage einer durch den Anwender angegebenen Suchanfrage. Eine derartige Anfrage kann durch eine logische Folge angegeben sein, die in jedem Dokument gefunden werden muss (eine „boolesche" Suche), oder kann durch ein natürlich-sprachbasiertes Anfragesystem spezifiziert sein. Die Anfrage kann direkt durch einen lokalen Anwender, aus der Ferne durch einen Anwender mit Sprach- oder DTMF-Telefonzugriff oder durch von einem entfernten Computer über Modem oder LAN gegebene Befehle erfolgen.
  • Der Anwender kann auch angeben, dass Dokumente auf der Grundlage des Auftretens eines Worts in bestimmten Dokumentenbereichen, wie Titelbereiche oder Beschriftungen, aufgefunden werden. Mit der Anfrage übereinstimmende Dokumente werden aufgefunden, und es werden ihnen Wertungen auf der Grundlage des Grads der Übereinstimmung des Dokuments mit der Anfrage zugeordnet. Höhere Wertungen können für das Auftreten von Worten in bestimmten Dokumentenbereichen zugeordnet werden, wobei die Wertung genauso wie die vorstehende Auswahl der Indexierungsebene gewichtet wird. Dadurch kann beispielsweise dem Auftreten von Worten in Titelbereichen eine höhere Wertung zugeordnet werden als dem Auftreten von Worten in Textbereichen. Ist eine Vielzahl von Dokumenten aufgefunden, dann werden sie in der Reihenfolge ihrer Wertung angezeigt.
  • Wählt der Anwender die Dokumenten-Anzeigeverarbeitung (Schritt S306), dann geht der Ablauf für die CPU 11 zu Schritt S307 über, um die Dokumenten-Anzeigeverarbeitung auszuführen. 7 ist ein ausführliches Ablaufdiagramm, das die Dokumenten-Anzeigeverarbeitung zeigt.
  • In Schritt S701 ermöglicht die CPU 11 dem Anwender die Einstellung von Anzeigeoptionen, unter denen aufgefundene Dokumente angezeigt werden. Genauer gesagt, wählt der Anwender einen von zwei Modi aus, unter dem aufgefundene Dokumente angezeigt werden: voller Dokumentenabbild- oder Blättermodus. Ist der volle Dokumentenabbildmodus ausgewählt, dann werden volle Dokumentenabbilder der aufgefundenen Dokumente angezeigt. Ist der Suchmodus ausgewählt, dann wird lediglich eine abstrahierte Strukturansicht eines jeden Dokuments angezeigt, und dadurch wird dem Anwender ein schnelles Blättern durch alle aufgefundenen Dokumente ermöglicht. Im Suchmodus können drei weitere Parameter durch den Anwender eingestellt werden. Erstens kann der Anwender auswählen, ob ASCII-Textzeichen OCR-verarbeiteter Textbereiche oder Dokumentenabbilder der Textbereiche angezeigt werden sollen. Zweitens kann der Anwender die Abstraktionsebene auswählen, auf der die Strukturansicht angezeigt wird. Neun Abstraktionsebenen sind bei diesem Ausführungsbeispiel der Erfindung möglich, obwohl andere Anordnungen möglich sind:
    Ebene 1: Lediglich Struktur
    Ebene 2: Titel
    Ebene 3: Auffindeparameter
    Ebene 4: Erste Textzeile
    Ebene 5: Voller Text
    Ebene 6: Tabellen
    Ebene 7: Line-Art
    Ebene 8: Halbton
    Ebene 9: Farbe
  • Gemäß der ausgewählten Abstraktionsebene zeigt die CPU 11 Strukturansichten des Dokuments gemischt mit Bereichen voller Dokumentenabbilder an. Ist Abstraktionsebene 1 ausgewählt, wird lediglich eine Struktur angezeigt. Ist aber Abstraktionsebene 2 oder höher ausgewählt, werden Strukturinformationen gemischt mit Bereichen voller Dokumentenabbilder angezeigt. Auf Abstraktionsebene 2 beispielsweise werden die Strukturinformationen gemischt mit Abbildern (oder ASCII-Text, falls ausgewählt) von Titelbereichen des Dokuments angezeigt. Die erforderlichen Abbildbereiche werden aus dem vollen Dokumentenabbild gemäß der mit der Struktur gespeicherten ULC- und LRC-Koordinaten gewonnen. Ist Abstraktionsebene 3 ausgewählt, dann werden die Strukturinformationen gemischt mit Abbildern der Titel (oder ASCII-Text, falls ausgewählt) und mit den Auffindeparametern angezeigt, durch die das Dokument aufgefunden wurde. Auf Abstraktionsebene 4 werden die Strukturinformationen gemischt mit Abbildern der Titelbereiche, Auffindeparametern und der ersten Textzeile der Textabbilder in jedem Textblock angezeigt. Ist eine ASCII-Textanzeige ausgewählt, dann wird wie zuvor der ASCII-Text anstelle der Textabbilder angezeigt. Höhere Abstraktionsebenen zeigen zunehmend mehr und mehr des vollen Dokumentenabbilds gemäß der ausgewählten Abstraktionsebene an.
  • Zusätzlich zum Abstraktionsebenenparameter kann der Anwender im Suchmodus auch auswählen, ob eine manuell oder automatische Abbildverbesserung zugelassen werden soll. Genauer gesagt, kann bei der manuellen Abbildverbesserung, wenn die Struktur eines aufgefundenen Dokuments angezeigt wird, der Anwender einen bestimmten Bereich des Dokuments, beispielsweise mit einer Maus 19, anvisieren und von der CPU 11 die Ersetzung des angezeigten Bereichs durch das volle Dokumentenabbild anfordern. Ist eine automatische Verbesserung ausgewählt, dann ersetzt die CPU 11 automatisch gerade angezeigte Strukturinformationen durch volle Dokumentenabbilder. Die automatische Verbesserung arbeitet während ruhiger Zeitspannen des CPU-Betriebs, das heißt wenn die CPU genügend Bearbeitungszeit aufweist, um das Abbild zu verbessern. Die Verbesserung schreitet in der vorstehend angegebenen Reihenfolge der Abstraktionsebenen voran. Dadurch beginnt die CPU während ruhiger Bearbeitungszeitspannen mit der Ersetzung erstens der Titelbereiche durch volle Abbilder der Titelbereiche, zweitens der Auffindeparameterbereiche durch volle Abbilder der Auffindeparameter, drittens der ersten Zeilen der Textbereiche durch volle Abbilder der ersten Textzeilen, usw.
  • Nachdem in Schritt S701 die Anzeigeoptionen eingestellt wurden, geht der Ablauf zu Schritt S702 über, in dem die CPU 11 bestimmt, ob der volle Abbildmodus ausgewählt wurde. Wurde der volle Abbildmodus ausgewählt, verzweigt sich der Ablauf zu Schritt S703, in dem volle Abbilder der vollen Abbilder angezeigt werden.
  • Wurde andererseits der Suchmodus ausgewählt, geht der Ablauf zu Schritt S704 über, in dem die Dokumentenstruktur auf der ausgewählten Abstraktionsebene angezeigt wird. Eine repräsentative Anzeige der Strukturinformationen ist in 8 gezeigt.
  • In 8 hat der Anwender den Suchmodus und ASCII-Textanzeige bei Abstraktionsebene 2 ausgewählt, das heißt „Titel". Dadurch wird dem Anwender die in 8 gezeigte abstrahierte Strukturansicht des Dokuments mit ASCII-Textentsprechungen der Titelbereiche dargereicht. Die übrigen Bereiche werden einfach mit dem Bereichstyp benannt, wie im Bereichstypengebiet gemäß 6 angegeben ist. Die Benennung kann durch eine Farbcodierung des Bereichs oder, wie in 8 gezeigt, durch Anwendung einer Textmarke erfolgen. Jeder der Bereiche wird durch eine Rechteckform umfahren, deren Koordinaten aus den ULC- und LRC-Koordinaten gemäß 6 angegeben werden. Es werden ASCII-Textentsprechungen der Titelbereiche an den entsprechenden ULC- und LRC-Koordinaten angezeigt. Dadurch wird dem Anwender eine abstrahierte Strukturansicht des Dokuments mit auswählbarer Abstraktionsebene dargestellt. Dies ermöglicht dem Anwender die schnelle Suche durch aufgefundene Dokumente, um bestimmte Dokumente von Interesse zu finden.
  • Der Ablauf geht zu Schritt S705 über, in dem die CPU 11 bestimmt, ob der manuelle Verbesserungsparameter ausgewählt wurde. Wurde der manuelle Verbesserungsparameter nicht ausgewählt, dann verzweigt sich der Ablauf zu Schritt S706, in dem die CPU 11 automatisch strukturell angezeigte Bereiche des Dokuments während ruhiger Betriebszeiten der CPU durch die vollen Abbilder (oder ASCII-Text, falls gewählt) dieser Bereiche ersetzt. Wurde unter der Annahme der Verfügbarkeit von genügend ruhiger Rechenzeit der automatische Verbesserungsmodus ausgewählt, dann wird dem Anwender schließlich das volle Dokument dargestellt, da die CPU die strukturell dargestellten Bereiche dieses Dokuments ersetzt. Der Anwender kann zu jedem Zeitpunkt während dieses Vorgangs die Anzeige (Schritt S710) des nächsten aufgefundenen Dokuments auswählen, worauf der Ablauf zu Schritt S702 zurückkehrt, um das nächste aufgefundene Dokument anzuzeigen.
  • Wurde der manuelle Verbesserungsmodus ausgewählt, dann geht der Ablauf weiter zu Schritt S707, in dem die CPU 11 bestimmt, ob ein Dokumentenbereich vom Anwender anvisiert wurde. Wurde kein Dokumentenbereich vom Anwender anvisiert, tut die CPU 11 nichts oder beginnt vorzugsweise mit dem Ersetzen von Strukturbereichen des Dokuments durch volle Dokumentenabbilder, wie in Schritt S708 gezeigt. Wieder kann dieser Vorgang zu jedem Zeitpunkt durch eine Anwenderauswahl des nächsten Dokuments (Schritt S710) unterbrochen werden.
  • Hat der Anwender andererseits in Schritt S707 einen Bereich zur Ersetzung anvisiert, geht der Ablauf zu Schritt S709 weiter, in dem die CPU 11 das entsprechende Dokumentenabbild aus der Dokumentenabbildsdatei auffindet und den strukturell dargestellten Bereich des angezeigten Dokuments durch das volle Dokumentenabbild ersetzt. Der Anwender hat dadurch, wie in 9 gezeigt, das Gebiet 54 anvisiert, das ein Textbereich ist. Daraufhin findet die CPU 11 das zu dem rechteckigen, durch die ULC- und LRC-Koordinaten umbeschriebenen Gebiet entsprechende Dokumentenabbild oder die ASCII-Textentsprechung auf, wenn diese Option ausgewählt wurde, und ersetzt das Gebiet in 8 mit dem entsprechenden Dokumentenabbild, wie in 9 gezeigt. Der Ablauf kehrt dann zu Schritt S707 zurück, um weitere Anwendernominierungen abzuwarten.
  • In 9 passt die ASCII-Textentsprechung für Gebiet 54 nicht in das zugeteilte Gebiet. In dieser Situation zeigt die CPU 11 nur die passende Textmenge an, aber die CPU 11 ermöglicht das Bildschirmrollen innerhalb des Gebiets, um dem Anwender die Ansicht des gesamten Texts zu ermöglichen.
  • Wie ferner in 9 gezeigt, hat der Anwender die Anzeige der ersten Zeile des Texts von Bereich 44 angefordert und die ASCII-Textentsprechung dieses Texts wird bei 55 angezeigt. Wurde natürlich der Abbildmodus ausgewählt, dann wäre das Abbild der ersten Textzeile angezeigt worden.
  • Visiert der Anwender in Schritt S709 einen Dokumentenbereich an, der einen verwandten Bereich aufweist, wie Bereich 42 oder 43, dann ersetzt die CPU 11 nicht lediglich den anvisierten Bereich, sondern auch den verwandten Bereich. Visiert der Anwender entsprechend Bereich 42 an, der ein Titelbereich ist, ersetzt die CPU 11 den Titelbereich 42 mit dem vollen Abbild (oder Text) des Bereichs 42, und ersetzt auch den Textbereich 43 mit dem vollen Abbild (oder Text) des Textbereichs 43. Durch die Wirkung dieses Merkmals wird dem Anwender ein schneller Zugriff auf gewünschte Informationen bereitgestellt, ohne dem Anwender die Ausführung zusätzlicher Tastenbetätigungen oder dergleichen abzuverlangen.
  • 10 zeigt eine Situation, in der der Anwender die Anzeige als Abbilder anstelle als ASCII-Text für bestimmte Bereiche ausgewählt hat. Genauer gesagt, hat der Anwender die vollen Abbilder der Bereiche 46 bzw. 48 angefordert und diese Bereiche wurden bereitgestellt, wie bei 56 bzw. 57 gezeigt ist.

Claims (47)

  1. Verfahren zur Anzeige von Dokumenten, mit den Schritten: Bereitstellen eines Abbildes eines Dokuments, Anlegen eines Auffindungsindex durch ein Verfahren, das die Schritte aufweist: Verarbeiten des Abbildes des Dokuments (S402) zur Identifikation von Textbereichen in dem Dokument und Nicht-Textbereichen im Dokument auf Basis regelbasierter Entscheidungen, und Umwandeln des Abbildes des Dokuments innerhalb von Textbereichen in Text (S405), gekennzeichnet durch die Schritte: Bestimmen eines Bereichstyps für jeden Textbereich (43, 44, 48) im Dokument unter Verwendung regelbasierter Entscheidungen, die automatisch auf das Abbild des Textbereichs ohne Rücksicht auf die Position des Textbereichs im Dokument und ohne Rücksicht auf ein vorbestimmtes Format für das Dokument angewendet werden, wobei der Bereichstyp einer mehrerer verschiedener vordefinierter Bereichstypen ist, die durch Regeln umspannt werden, Indexieren des umgewandelten Texts (S406), um Auffinden durch Bezugnahme auf den umgewandelten Text zu ermöglichen, Indexieren des bestimmten Bereichstyps, um das Auffinden durch Bezugnahme auf einen der vorbestimmten Bereichstypen zu ermöglichen, Speichern des Abbildes des Dokuments (S408), damit das gespeicherte Dokumentenabbild durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage in den indexierten Bereichstypen erscheint, aufgefunden werden kann, zum Bereitstellen von entsprechenden Zusammensetzungsinformationen für das Dokument, wobei die Zusammensetzungsinformationen für jeden von bis zu mehreren Bereichen des Dokuments Bereichstypinformationen enthalten, Anzeigen einer abstrahierten Ansicht des Dokuments (S704) durch Verwendung der Zusammensetzungsinformationen und Ersetzen zumindest eines Bereichs der abstrahierten Ansicht durch ein entsprechendes Abbild im Dokument (S706, S708, S709) innerhalb der abstrahierten Ansicht selbst, so dass Zusammensetzungsinformationen und Abbildinformationen gemischt angezeigt werden.
  2. Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Zuordnen des Abbildes des Dokuments mit dem indexierten Text, damit das Abbild des Dokuments durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage im indexierten Bereichstyp erscheint, aufgefunden werden kann.
  3. Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Festlegen einer Indexebene, die angibt, welche Bereichstypen indexiert werden sollen, und wobei der Umwandlungsschritt Textbereiche (43, 44, 48) gemäß der festgelegten Indexebene umwandelt.
  4. Verfahren gemäß Patentanspruch 1, wobei die Bereichstypen für Textbereiche (43, 44, 48) aus einer Gruppe vorbestimmter Bereichstypen ausgewählt werden, die Titelbereiche und Haupttextbereiche enthalten.
  5. Verfahren gemäß Patentanspruch 1, wobei der Bereichstyp für Nicht-Textbereiche aus einer Gruppe vorbestimmter Bereichstypen ausgewählt wird, die Line-Art-Bereiche, Halbtonbereiche und Tabellenbereiche enthält.
  6. Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt schrittweises Ersetzen von Bereichen innerhalb der abstrahierten Ansicht des Dokuments durch entsprechende Vollabbilder der Bereiche des Dokuments.
  7. Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Festlegen einer Abstraktionsebene auf der Grundlage der Zusammensetzungsinformationen zur Anzeige der abstrahierten Ansicht, wobei in dem Anzeigeschritt die abstrahierte Ansicht mit gemischten Bereichen aus Zusammensetzungsinformationen und Dokumentenabbild gemäß festgelegter Abstraktionsebene angezeigt wird.
  8. Verfahren gemäß Patentanspruch 1, wobei im Bereitstellungsschritt eine Vielzahl von Dokumentenabbildern und entsprechenden Dokumenten-Zusammensetzungsinformationen bereitgestellt werden, und weiterhin mit dem Schritt Auffinden von einem aus der Vielzahl der Dokumentenabbilder und entsprechender Dokumenten-Zusammensetzungsinformationen zur Anzeige.
  9. Verfahren gemäß Patentanspruch 8, wobei den aufgefundenen Dokumenten eine Wertung gemäß dem Grad der Übereinstimmung mit den Auffindeparametern zugeordnet wird und wobei die aufgefundenen Dokumente in einer von der Wertung bestimmten Reihenfolge angezeigt werden.
  10. Verfahren gemäß Patentanspruch 8, wobei im Anzeigeschritt die abstrahierte Ansicht gemischt mit Auffindeparametern angezeigt wird.
  11. Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Benennen der Bereiche der abstrahierten Ansicht gemäß den Zusammensetzungsinformationen für die Bereiche.
  12. Verfahren gemäß Patentanspruch 1, wobei der Anzeigeschritt eine sprachliche Mitteilung der Dokumentenstruktur durch Text-zu-Sprache-Umwandlung der Zusammensetzungsinformationen darstellt.
  13. Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Identifizieren des Dokumententyps basierend auf den Zusammensetzungsinformationen.
  14. Verfahren gemäß Patentanspruch 1, weiterhin mit dem Schritt Identifizieren verwandter Bereiche im Dokument und wobei im Ersetzungsschritt auch verwandte Bereiche innerhalb der abstrahierten Ansicht ersetzt werden, wenn ein Bereich innerhalb der abstrahierten Ansicht ersetzt wird.
  15. Verfahren gemäß Patentanspruch 1, wobei im Bereitstellungsschritt das Abbild des Dokuments von einer entfernten Quelle über ein Modem oder über ein lokales Netzwerk (LAN) bereitgestellt wird.
  16. Verfahren gemäß Patentanspruch 15, wobei im Bereitstellungsschritt Abbilder der Bereiche des Dokuments über das Modem oder LAN aufgefunden werden, wenn genügend Zeit zur Verfügung steht und wobei der Ersetzungsschritt schrittweise vorgeht, so dass Bereiche in der abstrahierten Ansicht schrittweise innerhalb der abstrahierten Ansicht durch die aufgefundenen Bereiche des Dokuments ersetzt werden.
  17. Verfahren gemäß Patentanspruch 16, wobei die schrittweise Ersetzung in einer von der Priorität unter den zahlreichen verschiedenen vorbestimmten Bereichstypen bestimmten Reihenfolge voranschreitet.
  18. Vorrichtung zur Dokumentenanzeige mit: einer Einrichtung (31) zur Bereitstellung eines Abbildes eines Dokuments und einer Vorrichtung zum Anlegen eines Auffindeindex, wobei die Vorrichtung zum Anlegen eines Auffindeindex aufweist: eine erste Speichereinrichtung zur Speicherung eines Dokumentenabbildes und eines Auffindeindex, eine zweiten Speichereinrichtung zur Speicherung der Verarbeitungsschritte zur Verarbeitung des Dokumentenabbildes, um Textbereiche (43, 44, 48) im Dokument und Nicht-Textbereiche im Dokument auf der Grundlage regelbasierter Entscheidungen zu identifizieren und um das Dokumentenabbild in Textbereichen (43, 44, 48) in Text umzuwandeln, eine Verarbeitungseinrichtung (11) zur Ausführung der im zweiten Speicher gespeicherten Verarbeitungsschritte, dadurch gekennzeichnet, dass der Prozessor eingerichtet ist (11) zur Ausführung der Verarbeitungsschritte: Bestimmen eines Bereichstyps für jeden Textbereich im Dokument unter Verwendung regelbasierter Entscheidungen, die automatisch auf das Abbild des Textbereichs ohne Rücksicht auf die Position des Textbereichs im Dokument und ohne Rücksicht auf ein vorbestimmtes Format für das Dokument angewendet werden, wobei der Bereichstyp einer der Vielzahl an verschiedenen vordefinierten Bereichstypen ist, die durch Regeln umspannt werden, Indexieren des umgewandelten Texts, um Auffinden durch Bezugnahme auf den umgewandelten Text zu ermöglichen, Indexieren des bestimmten Bereichstyps, um Auffinden durch Bezugnahme auf einen der vorbestimmten Bereichstypen zu ermöglichen, und wobei die erste Speichereinrichtung eingerichtet ist, das Dokumentenabbild zu speichern, so dass das gespeicherte Dokumentenabbild durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage in den indexierten Bereichstypen erscheint, aufgefunden werden kann, zur Bereitstellung entsprechender Zusammensetzungsinformationen (34) für das Dokument, wobei die Zusammensetzungsinformationen Bereichstypeninformationen für jede der bis zu einer Vielzahl von Bereichen im Dokument enthalten, wobei die Anzeigevorrichtung, weiterhin aufweist: eine Einrichtung (17) zur Anzeige einer abstrahierten Ansicht des Dokuments unter Verwendung der Zusammensetzungsinformationen, und einer Ersetzungseinrichtung zur Ersetzung zumindest eines Bereichs der abstrahierten Ansicht durch ein entsprechendes Abbild im Dokument innerhalb der abstrahierten Ansicht selbst, so dass Zusammensetzungsinformationen und Abbildinformationen gemischt angezeigt werden.
  19. Vorrichtung gemäß Patentanspruch 18, ferner mit einer Anzeigeschnittstelle, wobei der zweite Speicherbereich mit Befehlen zum Auffinden eines Dokuments und zur Übertragung einer abstrahierten Ansicht zu der Anzeigeschnittstelle programmiert ist, wobei Dokumentenbereiche gemäß entsprechender Bereichstypen identifiziert werden.
  20. Vorrichtung gemäß Patentanspruch 19, wobei der zweite Speicherbereich mit Befehlen zur Ersetzung von Bereichen innerhalb der abstrahierten Ansicht aufgefundener Dokumente durch entsprechende Bereiche aus dem Dokumentenabbild programmiert sind.
  21. Vorrichtung gemäß Patentanspruch 19, weiterhin mit einer Wertungseinrichtung zur Zuordnung einer Wertung zu aufgefundenen Dokumenten gemäß dem Grad der Übereinstimmung mit den Auffindeparametern, wobei die aufgefundenen Dokumente in einer von der Wertung bestimmten Reihenfolge angezeigt werden.
  22. Vorrichtung gemäß Patentanspruch 18, wobei die Verarbeitungsschritte weiterhin die Zuordnung des Dokumentenabbildes zu dem indexierten Text umfassen, damit das Dokumentenabbild durch Bezugnahme darauf, ob Text in einer Textabfrage im indexierten Text erscheint und durch Bezugnahme darauf, ob der Text in der Textabfrage im indexierten Bereichstyp erscheint, aufgefunden werden kann.
  23. Vorrichtung gemäß Patentanspruch 18, wobei die Verarbeitungsschritte die Festlegung einer Indexebene umfassen, die angibt, welche Bereichstypen indexiert werden sollen, und wobei der Verarbeitungsschritt zur Umwandlung Textbereiche gemäß der festgelegten Indexebene umwandelt.
  24. Vorrichtung gemäß Patentanspruch 18, bei der die Bereichstypen für Textbereiche aus einer Gruppe vorbestimmter Bereichstypen ausgewählt werden, die Titelbereiche und Haupttextbereiche enthält.
  25. Vorrichtung gemäß Patentanspruch 18, bei der der Bereichstyp für Nicht-Textbereiche aus einer Gruppe vorbestimmter Bereichstypen, die Line-Art-Bereiche, Halbtonbereiche und Tabellenbereiche enthält, ausgewählt wird.
  26. Vorrichtung gemäß Patentanspruch 19, weiterhin mit einer ein Modem (21) oder durch eine Schnittstelle (15) zu einem lokalen Netzwerk (LAN) umfassende Datenübertragungseinrichtung, wobei Dokumente über die Datenübertragungseinrichtung aufgefunden werden.
  27. Vorrichtung gemäß Patentanspruch 26, weiterhin mit einer Auffindeeinrichtung zum Auffinden von Abbildern von Bereichen des Dokuments über das Modem (21) oder LAN (16), wenn genügend Zeit zur Verfügung steht, und einer Ersetzungseinrichtung zur schrittweisen Ersetzung von Bereichen innerhalb der abstrahierten Ansicht durch die aufgefundenen Abbilder der Bereiche des Dokuments.
  28. Vorrichtung gemäß Patentanspruch 20 oder 27, wobei die schrittweise Ersetzung in einer von der Priorität unter einer Vielzahl von verschiedenen vorbestimmten Bereichstypen bestimmten Reihenfolge voranschreitet.
  29. Vorrichtung gemäß Patentanspruch 18, weiterhin mit einer Festlegungseinrichtung zur Festlegung einer Abstraktionsebene auf der Grundlage von Zusammensetzungsinformationen zur Anzeige der abstrahierten Ansicht des Dokuments, wobei die abstrahierte Ansicht mit gemischten Bereichen von Zusammensetzungsinformationen und Dokumentenabbild gemäß der festgelegten Abstraktionsebene angezeigt wird.
  30. Vorrichtung gemäß Patentanspruch 18, wobei eine Vielzahl von Dokumentenbildern und entsprechenden Dokumenten-Zusammensetzungsinformationen bereitgestellt werden, und die weiterhin eine Auffindeeinrichtung zum Auffinden von einem aus der Vielzahl von Dokumentenabbildern und entsprechenden Dokumenten-Zusammensetzungsinformationen zur Anzeige umfasst.
  31. Vorrichtung gemäß Patentanspruch 30, weiterhin mit einer zur Zuordnung von Werten zu aufgefundenen Dokumenten gemäß dem Grad der Übereinstimmung mit den Auffindeparametern eingerichteten Wertungseinrichtung, wobei die aufgefundenen Dokumente in einer von der Wertung bestimmten Reihenfolge angezeigt werden.
  32. Vorrichtung gemäß Patentanspruch 30, wobei die Anzeigeeinrichtung zur Anzeige der mit Auffindeparametern gemischten abstrahierten Ansicht eingerichtet ist.
  33. Vorrichtung gemäß Patentanspruch 18, weiterhin mit einer Benennungseinrichtung zur Benennung von Strukturbereichen der abstrahierten Ansicht gemäß den Zusammensetzungsinformationen für die Bereiche.
  34. Vorrichtung gemäß Patentanspruch 18, wobei die Anzeigeeinrichtung zur Bereitstellung einer sprachlichen Mitteilung der Dokumentenstruktur durch Text-zu-Sprache-Umwandlung der Zusammensetzungsinformationen eingerichtet ist.
  35. Vorrichtung gemäß Patentanspruch 18, weiterhin mit einer Identifikationseinrichtung zur Identifikation des Dokumententyps basierend auf den Zusammensetzungsinformationen.
  36. Vorrichtung gemäß Patentanspruch 18, weiterhin mit einer Identifikationseinrichtung zur Identifikation verwandter Bereiche im Dokument, und wobei im Ersetzungsschritt auch verwandte Bereiche innerhalb der abstrahierten Ansicht ersetzt werden, wenn ein Bereich innerhalb der abstrahierten Ansicht ersetzt wird.
  37. Vorrichtung gemäß Patentanspruch 18, wobei Textbereiche des Dokuments durch Textbereiche des Dokuments oder durch Textentsprechungen gemäß einer manuellen Auswahl ersetzt werden.
  38. Vorrichtung gemäß Patentanspruch 18, wobei das Abbild des Dokuments von einer entfernten Quelle über ein Modem (21) oder ein lokales Netzwerk (LAN) (16) bereitgestellt wird.
  39. Vorrichtung gemäß Patentanspruch 38, wobei Abbilder von Bereichen des Dokuments über das Modem (21) oder LAN (16) aufgefunden werden, wenn genügend Zeit zur Verfügung steht, und wobei die Ersetzung schrittweise vorgeht, so dass Bereiche der abstrahierten Ansicht schrittweise innerhalb der abstrahierten Ansicht durch die aufgefundenen Abbildern der Bereiche des Dokuments ersetzt werden.
  40. Vorrichtung gemäß Patentanspruch 39, bei der die schrittweise Ersetzung in einer von der Priorität unter den zahlreichen verschiedenen vorbestimmten Bereichstypen bestimmten Reihenfolge voranschreitet.
  41. Vorrichtung zur Dokumentenanzeige gemäß Patentanspruch 18, wobei die Ersetzungseinrichtung aufweist: einen ersten Speicherbereich, aus dem ein Abbild eines Dokuments und entsprechende Zusammensetzungsinformationen für das Dokument aufgefunden werden können, einen zweiten Speicherbereich zur Speicherung der Verarbeitungsschritte und einen Prozessor (11) zur Ausführung der im zweiten Speicher gespeicherten Verarbeitungsschritte, wobei der zweite Speicher mit Befehlen zur Anzeige der abstrahierten Ansicht eines aufgefundenen Dokuments gemäß den Zusammensetzungsinformationen auf einer Anzeigeeinheit und zur Ersetzung eines ausgewählten Bereichs der abstrahierten Ansicht durch ein entsprechendes Dokumentenabbild innerhalb der abstrahierten Ansicht selbst programmiert wurde, so dass Zusammensetzungsinformationen und Abbildinformationen gemischt angezeigt werden.
  42. Vorrichtung gemäß Patentanspruch 41, weiterhin mit einer Eingabeeinrichtung zur Eingabe von Bedienerfestlegungen, und wobei der zweite Speicher Verarbeitungsschritte enthält, um die Festlegung einer Abstraktionsebene, auf der die abstrahierte Ansicht angezeigt wird, zu ermöglichen, in welcher gemischte Bereiche von Zusammensetzungsinformationen und Dokumentenabbild gemäß der festgelegten Abstraktionsebene angezeigt werden.
  43. Vorrichtung gemäß Patentanspruch 41, wobei der erste Speicher eine Vielzahl von Dokumentenabbildern und eine Vielzahl von entsprechenden Zusammensetzungsinformationen enthält, und wobei der zweite Speicher Verarbeitungsschritte zum Auffinden von einem aus der Vielzahl von gespeicherten Dokumentenabbilder und entsprechenden Dokumenten-Zusammensetzungsinformationen zur Anzeige enthält.
  44. Datenspeichermedium zur Beförderung des Informationsinhalts einer Vielzahl von Dokumenten und weiterhin zur Beförderung des durch das Verfahren gemäß Patentanspruch 1 erstellten Auffindeindex, so dass die Gesamtstruktur eines Dokuments für die Anzeige ohne die Auffindung des gesamten Informationsinhalts des Dokuments aufgefunden werden kann.
  45. Computerprogramm, das computerausführbare Befehle zur Durchführung aller Schritte eines jeden Verfahrens gemäß einem der Patentansprüche 1 bis 17 enthält.
  46. Computerlesbares Speichermedium zur Speicherung eines Computerprogramms gemäß Patentanspruch 45.
  47. Signal zur Beförderung des Informationsinhalts einer Vielzahl von Dokumenten und ferner zur Zuführung des durch das Verfahren gemäß Patentanspruch 1 erstellten Auffindeindex, so dass die Gesamtstruktur eines Dokuments für die Anzeige ohne die Auffindung des gesamten Informationsinhalts des Dokuments aufgefunden werden kann.
DE69434620T 1993-01-19 1994-01-19 Verfahren und Gerät zum Herstellen, Indexieren und Anschauen von zusammengefassten Dokumenten Expired - Lifetime DE69434620T2 (de)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/005,444 US6002798A (en) 1993-01-19 1993-01-19 Method and apparatus for creating, indexing and viewing abstracted documents
US5444 1993-01-19

Publications (2)

Publication Number Publication Date
DE69434620D1 DE69434620D1 (de) 2006-04-20
DE69434620T2 true DE69434620T2 (de) 2006-08-03

Family

ID=21715899

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69434620T Expired - Lifetime DE69434620T2 (de) 1993-01-19 1994-01-19 Verfahren und Gerät zum Herstellen, Indexieren und Anschauen von zusammengefassten Dokumenten

Country Status (6)

Country Link
US (1) US6002798A (de)
EP (1) EP0609996B1 (de)
JP (1) JPH06325084A (de)
DE (1) DE69434620T2 (de)
SG (1) SG75792A1 (de)
TW (1) TW229290B (de)

Families Citing this family (111)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6578027B2 (en) * 1996-08-20 2003-06-10 Business Objects, Sa Relational database access system using semantically dynamic objects
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US6496841B1 (en) * 1996-06-26 2002-12-17 Sun Microsystems, Inc. Techniques for identifying and manipulating quoted or reproduced material using a quote bar
US5802533A (en) * 1996-08-07 1998-09-01 Walker; Randall C. Text processor
US6279017B1 (en) * 1996-08-07 2001-08-21 Randall C. Walker Method and apparatus for displaying text based upon attributes found within the text
US7484172B2 (en) * 1997-05-23 2009-01-27 Walker Digital, Llc System and method for providing a customized index with hyper-footnotes
US6353840B2 (en) * 1997-08-15 2002-03-05 Ricoh Company, Ltd. User-defined search template for extracting information from documents
JP4100746B2 (ja) * 1998-01-09 2008-06-11 キヤノン株式会社 画像処理装置及び方法
US6269188B1 (en) 1998-03-12 2001-07-31 Canon Kabushiki Kaisha Word grouping accuracy value generation
US6240407B1 (en) 1998-04-29 2001-05-29 International Business Machines Corp. Method and apparatus for creating an index in a database system
US6243501B1 (en) * 1998-05-20 2001-06-05 Canon Kabushiki Kaisha Adaptive recognition of documents using layout attributes
JP2000137728A (ja) * 1998-11-02 2000-05-16 Fujitsu Ltd 文書解析装置及びプログラム記録媒体
WO2000034845A2 (en) * 1998-12-08 2000-06-15 Mediadna, Inc. A system and method of obfuscating data
US7062707B1 (en) * 1998-12-08 2006-06-13 Inceptor, Inc. System and method of providing multiple items of index information for a single data object
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
US6631373B1 (en) * 1999-03-02 2003-10-07 Canon Kabushiki Kaisha Segmented document indexing and search
US6397213B1 (en) * 1999-05-12 2002-05-28 Ricoh Company Ltd. Search and retrieval using document decomposition
US6522790B1 (en) * 1999-09-28 2003-02-18 Motorola, Inc. Method and apparatus for merging images
JP2001236287A (ja) * 2000-02-24 2001-08-31 Matsushita Electric Ind Co Ltd 画像表示方法及び該方法により画像を表示する携帯端末
WO2001086390A2 (en) 2000-05-08 2001-11-15 Walker Digital, Llc Method and system for providing a link in an electronic file being presented to a user
JP2002007413A (ja) * 2000-06-20 2002-01-11 Fujitsu Ltd 画像検索装置
US7054509B2 (en) * 2000-10-21 2006-05-30 Cardiff Software, Inc. Determining form identification through the spatial relationship of input data
JP2002182815A (ja) * 2000-12-12 2002-06-28 Fujitsu Ltd 表示装置および表示制御プログラムを記録したコンピュータ読取可能な記録媒体
DE10110275A1 (de) * 2001-03-02 2002-09-19 Daimler Chrysler Ag Verfahren zur Kennzeichnung von gespeicherter Information
US20020126902A1 (en) * 2001-03-08 2002-09-12 Konica Corporation Character information collating correction apparatus
US6735329B2 (en) * 2001-05-18 2004-05-11 Leonard S. Schultz Methods and apparatus for image recognition and dictation
ES2201871B1 (es) * 2001-08-30 2005-05-16 Cultura Y Solidaridad, S.L. Sistema de busquedas bibliograficas mediante consultas de indices.
US20030042319A1 (en) * 2001-08-31 2003-03-06 Xerox Corporation Automatic and semi-automatic index generation for raster documents
JP5339657B2 (ja) * 2001-09-11 2013-11-13 キヤノン株式会社 文書登録システム、方法、プログラム及び記憶媒体
US6678699B2 (en) 2001-10-09 2004-01-13 International Business Machines Corporation Visual indexing of displayable digital documents
JP3624186B2 (ja) * 2002-03-15 2005-03-02 Tdk株式会社 スイッチング電源装置用の制御回路及びこれを用いたスイッチング電源装置
JP3941624B2 (ja) * 2002-07-30 2007-07-04 コニカミノルタビジネステクノロジーズ株式会社 ファイル保存装置
JP2004139484A (ja) * 2002-10-21 2004-05-13 Hitachi Ltd 帳票処理装置、該装置実行のためのプログラム、及び、帳票書式作成プログラム
US7045377B2 (en) * 2003-06-26 2006-05-16 Rj Mears, Llc Method for making a semiconductor device including a superlattice and adjacent semiconductor layer with doped regions defining a semiconductor junction
US8442331B2 (en) 2004-02-15 2013-05-14 Google Inc. Capturing text from rendered documents using supplemental information
US7707039B2 (en) * 2004-02-15 2010-04-27 Exbiblio B.V. Automatic modification of web pages
US10635723B2 (en) 2004-02-15 2020-04-28 Google Llc Search engines and systems with handheld document data capture devices
US7812860B2 (en) 2004-04-01 2010-10-12 Exbiblio B.V. Handheld device for capturing text from both a document printed on paper and a document displayed on a dynamic display device
WO2005084282A2 (en) * 2004-02-27 2005-09-15 Akron Special Machinery, Inc. Load wheel drive
US20050210048A1 (en) * 2004-03-18 2005-09-22 Zenodata Corporation Automated posting systems and methods
US8146156B2 (en) 2004-04-01 2012-03-27 Google Inc. Archive of text captures from rendered documents
US9116890B2 (en) 2004-04-01 2015-08-25 Google Inc. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US20060081714A1 (en) 2004-08-23 2006-04-20 King Martin T Portable scanning device
US20060098900A1 (en) 2004-09-27 2006-05-11 King Martin T Secure data gathering from rendered documents
US8081849B2 (en) 2004-12-03 2011-12-20 Google Inc. Portable scanning and memory device
US7990556B2 (en) 2004-12-03 2011-08-02 Google Inc. Association of a portable scanner with input/output and storage devices
US7894670B2 (en) 2004-04-01 2011-02-22 Exbiblio B.V. Triggering actions in response to optically or acoustically capturing keywords from a rendered document
US9143638B2 (en) 2004-04-01 2015-09-22 Google Inc. Data capture from rendered documents using handheld device
WO2008028674A2 (en) 2006-09-08 2008-03-13 Exbiblio B.V. Optical scanners, such as hand-held optical scanners
US9008447B2 (en) 2004-04-01 2015-04-14 Google Inc. Method and system for character recognition
US8713418B2 (en) 2004-04-12 2014-04-29 Google Inc. Adding value to a rendered document
US8874504B2 (en) 2004-12-03 2014-10-28 Google Inc. Processing techniques for visual capture data from a rendered document
US8489624B2 (en) 2004-05-17 2013-07-16 Google, Inc. Processing techniques for text capture from a rendered document
US8620083B2 (en) 2004-12-03 2013-12-31 Google Inc. Method and system for character recognition
US7788258B1 (en) * 2004-06-21 2010-08-31 Google Inc. Automatic determination of whether a document includes an image gallery
US8346620B2 (en) 2004-07-19 2013-01-01 Google Inc. Automatic modification of web pages
JP4477468B2 (ja) * 2004-10-15 2010-06-09 富士通株式会社 組み立て図面の装置部品イメージ検索装置
US20060200464A1 (en) * 2005-03-03 2006-09-07 Microsoft Corporation Method and system for generating a document summary
KR100664311B1 (ko) * 2005-11-18 2007-01-04 삼성전자주식회사 자동 인덱스 생성이 가능한 화상형성장치 및 그 자동인덱스 생성방법
US7433548B2 (en) * 2006-03-28 2008-10-07 Amazon Technologies, Inc. Efficient processing of non-reflow content in a digital image
US8023738B1 (en) 2006-03-28 2011-09-20 Amazon Technologies, Inc. Generating reflow files from digital images for rendering on various sized displays
US7788580B1 (en) * 2006-03-28 2010-08-31 Amazon Technologies, Inc. Processing digital images including headers and footers into reflow content
US7966557B2 (en) * 2006-03-29 2011-06-21 Amazon Technologies, Inc. Generating image-based reflowable files for rendering on various sized displays
US7715635B1 (en) 2006-09-28 2010-05-11 Amazon Technologies, Inc. Identifying similarly formed paragraphs in scanned images
US7810026B1 (en) 2006-09-29 2010-10-05 Amazon Technologies, Inc. Optimizing typographical content for transmission and display
US8631012B2 (en) * 2006-09-29 2014-01-14 A9.Com, Inc. Method and system for identifying and displaying images in response to search queries
US7986843B2 (en) 2006-11-29 2011-07-26 Google Inc. Digital image archiving and retrieval in a mobile device system
US20080162602A1 (en) * 2006-12-28 2008-07-03 Google Inc. Document archiving system
US20080162603A1 (en) * 2006-12-28 2008-07-03 Google Inc. Document archiving system
CN101246475B (zh) * 2007-02-14 2010-05-19 北京书生国际信息技术有限公司 一种基于版面信息的检索方法
JP5063151B2 (ja) * 2007-03-19 2012-10-31 株式会社リコー 情報検索システム及び情報検索方法
WO2008140721A2 (en) 2007-05-09 2008-11-20 Lexisnexis Group Systems and methods for analyzing documents
CN101308494A (zh) * 2007-05-15 2008-11-19 国际商业机器公司 演示内容的方法与设备
US8160306B1 (en) * 2007-06-06 2012-04-17 Neustel Michael S Patent analyzing system
US9256594B2 (en) 2007-06-06 2016-02-09 Michael S. Neustel Patent analyzing system
CN101354705B (zh) * 2007-07-23 2012-06-13 夏普株式会社 文档图像处理装置和文档图像处理方法
US8290272B2 (en) * 2007-09-14 2012-10-16 Abbyy Software Ltd. Creating a document template for capturing data from a document image and capturing data from a document image
US20090109031A1 (en) 2007-10-25 2009-04-30 Calvin Duane A Method of and System for Finding Physical Locations of Servers
US8782516B1 (en) 2007-12-21 2014-07-15 Amazon Technologies, Inc. Content style detection
DE102008010264A1 (de) * 2008-02-19 2009-08-20 Bookrix Gmbh & Co. Kg Verfahren und Vorrichtung zur seitenweisen Bereitstellung eines elektronischen Dokumentes als Computergrafik
JP4875024B2 (ja) * 2008-05-09 2012-02-15 株式会社東芝 画像情報伝送装置
US8572480B1 (en) 2008-05-30 2013-10-29 Amazon Technologies, Inc. Editing the sequential flow of a page
US8131720B2 (en) 2008-07-25 2012-03-06 Microsoft Corporation Using an ID domain to improve searching
US9390321B2 (en) 2008-09-08 2016-07-12 Abbyy Development Llc Flexible structure descriptions for multi-page documents
US8547589B2 (en) * 2008-09-08 2013-10-01 Abbyy Software Ltd. Data capture from multi-page documents
US9229911B1 (en) 2008-09-30 2016-01-05 Amazon Technologies, Inc. Detecting continuation of flow of a page
US8499046B2 (en) * 2008-10-07 2013-07-30 Joe Zheng Method and system for updating business cards
CN105930311B (zh) 2009-02-18 2018-10-09 谷歌有限责任公司 执行与再现文档关联的动作的方法、移动设备和可读介质
JP4725658B2 (ja) * 2009-03-03 2011-07-13 ブラザー工業株式会社 画像合成出力プログラム、画像合成出力装置及び画像合成出力システム
WO2010105245A2 (en) 2009-03-12 2010-09-16 Exbiblio B.V. Automatically providing content associated with captured information, such as information captured in real-time
US8447066B2 (en) 2009-03-12 2013-05-21 Google Inc. Performing actions based on capturing information from rendered documents, such as documents under copyright
US20110126113A1 (en) * 2009-11-23 2011-05-26 c/o Microsoft Corporation Displaying content on multiple web pages
US9081799B2 (en) 2009-12-04 2015-07-14 Google Inc. Using gestalt information to identify locations in printed information
US9323784B2 (en) 2009-12-09 2016-04-26 Google Inc. Image search using text-based elements within the contents of images
JP4935891B2 (ja) * 2009-12-21 2012-05-23 ブラザー工業株式会社 画像合成装置及び画像合成プログラム
DE102010004166A1 (de) * 2010-01-08 2011-07-14 Giesecke & Devrient GmbH, 81677 Verfahren zum Konfigurieren einer graphischen Benutzerschnittstelle einer Vorrichtung zur Bearbeitung von Wertdokumenten
US8499236B1 (en) 2010-01-21 2013-07-30 Amazon Technologies, Inc. Systems and methods for presenting reflowable content on a display
CN101853297A (zh) * 2010-05-28 2010-10-06 英华达(南昌)科技有限公司 一种在电子设备中快速获得期望图像的方法
US9836460B2 (en) * 2010-06-11 2017-12-05 Lexisnexis, A Division Of Reed Elsevier Inc. Systems and methods for analyzing patent-related documents
US9223769B2 (en) 2011-09-21 2015-12-29 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
US8687886B2 (en) 2011-12-29 2014-04-01 Konica Minolta Laboratory U.S.A., Inc. Method and apparatus for document image indexing and retrieval using multi-level document image structure and local features
WO2013099038A1 (ja) * 2011-12-29 2013-07-04 楽天株式会社 画像検索システム、画像検索方法、画像検索装置、プログラム、及び情報記憶媒体
US8971630B2 (en) 2012-04-27 2015-03-03 Abbyy Development Llc Fast CJK character recognition
US8989485B2 (en) 2012-04-27 2015-03-24 Abbyy Development Llc Detecting a junction in a text line of CJK characters
US10269063B2 (en) * 2013-01-11 2019-04-23 Capital One Financial Corporation Systems and methods for managing a loan application
KR102103277B1 (ko) * 2013-04-12 2020-04-22 삼성전자주식회사 이미지를 관리하는 방법 및 그 전자 장치
US9454696B2 (en) 2014-04-17 2016-09-27 Xerox Corporation Dynamically generating table of contents for printable or scanned content
US11151108B2 (en) * 2016-11-21 2021-10-19 International Business Machines Corporation Indexing and archiving multiple statements using a single statement dictionary
US20220027419A1 (en) * 2018-12-28 2022-01-27 Shenzhen Sekorm Component Network Co., Ltd Smart search and recommendation method for content, storage medium, and terminal
US11263325B2 (en) * 2019-01-31 2022-03-01 Mcafee, Llc System and method for application exploration
US10984168B1 (en) * 2020-02-10 2021-04-20 International Business Machines Corporation System and method for generating a multi-modal abstract

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4408181A (en) * 1979-04-10 1983-10-04 Tokyo Shibaura Denki Kabushiki Kaisha Document data filing/retrieval system
JPS56168263A (en) * 1980-05-30 1981-12-24 Hitachi Ltd Program making device
DE3107655A1 (de) * 1981-02-27 1982-09-16 Siemens AG, 1000 Berlin und 8000 München Verfahren zum auffinden und abgrenzen von textbereichen auf einer vorlage, die text-, graphik- und/oder bildbereiche enthalten kann
DE3113555A1 (de) * 1981-04-03 1982-10-21 Siemens AG, 1000 Berlin und 8000 München Verfahren zum automatischen erkennen von weissbloecken sowie text-, graphik- und/oder graubildbereichen auf druckvorlagen
JPH0748795B2 (ja) * 1982-07-09 1995-05-24 富士写真フイルム株式会社 画像入出力装置
GB2126054A (en) * 1982-08-11 1984-03-14 Philips Electronic Associated Display system with nested information display
JPS60134357A (ja) * 1983-12-21 1985-07-17 Hitachi Ltd 画像フアイル登録・検索方式
US4907285A (en) * 1984-08-24 1990-03-06 Hitachi, Ltd. Image understanding system
US5235653A (en) * 1984-08-31 1993-08-10 Hitachi, Ltd. Document analysis system
JPS6176144A (ja) * 1984-09-21 1986-04-18 オリンパス光学工業株式会社 医用画像フアイル装置
EP0382321B1 (de) * 1984-11-14 1999-02-03 Canon Kabushiki Kaisha Bildverarbeitungssystem
US5265242A (en) * 1985-08-23 1993-11-23 Hiromichi Fujisawa Document retrieval system for displaying document image data with inputted bibliographic items and character string selected from multiple character candidates
DE3642220A1 (de) * 1985-12-11 1987-06-19 Sharp Kk Einrichtung zum aufzeichnen und wiederauffinden aufgezeichneter information
JPH0740269B2 (ja) * 1986-01-24 1995-05-01 日本電信電話株式会社 文書フアイリング装置
JPH0785248B2 (ja) * 1986-03-14 1995-09-13 株式会社東芝 デ−タフアイルシステム
US4764867A (en) * 1986-06-03 1988-08-16 Banner Blue Software Incorporated Display system and method for constructing and editing a hierarchical arrangement of information
US4760606A (en) * 1986-06-30 1988-07-26 Wang Laboratories, Inc. Digital imaging file processing system
JPS6324419A (ja) * 1986-07-17 1988-02-01 Toshiba Corp 複合文書処理装置
US5144679A (en) * 1987-06-29 1992-09-01 Hitachi, Ltd Graphic data searching and storage method
US4803643A (en) * 1987-08-10 1989-02-07 Oclc Online Computer Library Center Incorporated System and method for creating memory-retained, formatted pages of text, tabulation, and graphic data
US5113492A (en) * 1987-09-16 1992-05-12 Canon Kabushiki Kaisha Apparatus for processing character and image data
US4949392A (en) * 1988-05-20 1990-08-14 Eastman Kodak Company Document recognition and automatic indexing for optical character recognition
US4933880A (en) * 1988-06-15 1990-06-12 International Business Machines Corp. Method for dynamically processing non-text components in compound documents
US5038381A (en) * 1988-07-11 1991-08-06 New Dest Corporation Image/text filtering system and method
JP2509303B2 (ja) * 1988-07-13 1996-06-19 株式会社日立製作所 情報検索方法および装置
US5131053A (en) * 1988-08-10 1992-07-14 Caere Corporation Optical character recognition method and apparatus
DE3881392T2 (de) * 1988-09-12 1993-10-21 Oce Nederland Bv System und Verfahren für automatische Segmentierung.
US5021976A (en) * 1988-11-14 1991-06-04 Microelectronics And Computer Technology Corporation Method and system for generating dynamic, interactive visual representations of information structures within a computer
JPH032979A (ja) * 1989-05-31 1991-01-09 Toshiba Corp 画像修正方法及び装置
JP2890482B2 (ja) * 1989-06-13 1999-05-17 富士ゼロックス株式会社 文書画像再配置ファイリング装置
US5369716A (en) * 1989-08-31 1994-11-29 Kabushiki Kaisha Toshiba Document reader and reading processing method therefor
JPH0743718B2 (ja) * 1989-10-13 1995-05-15 株式会社日立製作所 マルチメディア文書構造化方式
JPH03132874A (ja) * 1989-10-19 1991-06-06 Fuji Facom Corp 文書のファイリング方法
JPH03202967A (ja) * 1989-12-28 1991-09-04 Toshiba Corp 電子ファイリング装置
JPH03202958A (ja) * 1989-12-28 1991-09-04 Toshiba Corp 画像情報記憶検索装置
US5048099A (en) * 1990-05-21 1991-09-10 Eastman Kodak Company Polygon-based method for automatic extraction of selected text in a digitized document
US5050222A (en) * 1990-05-21 1991-09-17 Eastman Kodak Company Polygon-based technique for the automatic classification of text and graphics components from digitized paper-based forms
US5109439A (en) * 1990-06-12 1992-04-28 Horst Froessl Mass document storage and retrieval system
US5396588A (en) * 1990-07-03 1995-03-07 Froessl; Horst Data processing using digitized images
JPH0490054A (ja) * 1990-08-03 1992-03-24 Toshiba Corp 画像記憶検索装置
US5133051A (en) * 1990-12-13 1992-07-21 Handley George E Automatic high speed publishing system
US5237628A (en) * 1991-06-03 1993-08-17 Nynex Corporation System and method for automatic optical data entry
FR2681454B1 (fr) * 1991-09-16 1995-08-18 Aerospatiale Procede et dispositif de traitement d'informations alphanumeriques et graphiques pour la constitution d'une banque de donnees.
US5359673A (en) * 1991-12-27 1994-10-25 Xerox Corporation Method and apparatus for converting bitmap image documents to editable coded data using a standard notation to record document recognition ambiguities
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
US5553277A (en) * 1992-12-29 1996-09-03 Fujitsu Limited Image search method for searching and retrieving desired image from memory device

Also Published As

Publication number Publication date
SG75792A1 (en) 2000-10-24
EP0609996B1 (de) 2006-02-08
TW229290B (de) 1994-09-01
EP0609996A2 (de) 1994-08-10
JPH06325084A (ja) 1994-11-25
US6002798A (en) 1999-12-14
EP0609996A3 (de) 1995-02-15
DE69434620D1 (de) 2006-04-20

Similar Documents

Publication Publication Date Title
DE69434620T2 (de) Verfahren und Gerät zum Herstellen, Indexieren und Anschauen von zusammengefassten Dokumenten
DE10162156B4 (de) Die Benutzernavigation durch Multimedia-Dateiinhalte unterstützendes System und Verfahren
DE60116442T2 (de) System zur Zuordnung von Schlüsselwörtern zu Dokumenten
DE10135445B4 (de) Integriertes Verfahren für das Schaffen einer aktualisierbaren Netzabfrage
DE69933404T2 (de) System und Verfahren zum gemeinsamen Benutzen von Fonts und Speichermedium für das Programm zum Ausführen des Verfahrens
DE3901485C2 (de) Verfahren und Vorrichtung zur Durchführung des Verfahrens zur Wiedergewinnung von Dokumenten
DE69724755T2 (de) Auffinden von Titeln und Photos in abgetasteten Dokumentbildern
DE69631457T2 (de) Vorrichtung und verfahren zum übertragbaren indexieren von dokumenten gemäss einer n-gram-wortzerlegung
DE69637125T2 (de) Optimaler zugriff auf elektronische dokumente
DE602004005216T2 (de) Dokumentenscanner
DE60208604T2 (de) Automatisches Verfahren zur Erzeugung von Image-buttons
DE60216802T2 (de) Verfahren und vorrichtung zur sprachenübersetzung eines produktionsjob-output
DE19708265B4 (de) Verfahren zum Durchsuchen einer Dokument-Bilddatenbank und Dokumentbild-Durchstöberungssystem sowie Verfahren zum Extrahieren eines Merkmalsvektors aus einem elektronisch gespeicherten Bild
DE69731418T2 (de) Such- und Wiederauffindungssystem für Dokumente mit Suchverfahren von teilweise passenden, benutzergezeichneten Anmerkungen
DE60129652T2 (de) Bildwiederauffindungssystem und Methode mit semantischer und eigenschaftenbasierter Relevanzrückmeldung
DE69930903T2 (de) Archivierungssystem und Verfahren mit der Fähigkeit, das Archivieren von identischen Dokumenten zu vermeiden
DE69133362T2 (de) Dokumentenverarbeitungs-verfahren und -gerät, entsprechende Program und Speichereinheit
DE102005032734B4 (de) Indexextraktion von Dokumenten
DE19751570A1 (de) Dokumentmanagementsystem, Verfahren zum Betreiben eines solchen Systems und Digitalkopierer
DE4430369A1 (de) Verfahren und Einrichtung zum Erzeugen eines Dokumenten-Layouts
DE3411939A1 (de) Verfahren und vorrichtung zur bildwiedergewinnung unter verwendung von annotationen als leitinformation
DE102011005579A1 (de) Bildverarbeitungsvorrichtung, Bildverarbeitungsverfahren und Speichermedium
DE10308014A1 (de) System und Verfahren zum Lokalisieren eines nichttextlichen Bereichs eines elektronischen Dokumentes oder Bildes, der mit einer benutzerdefinierten Beschreibung des Bereichs übereinstimmt
DE19715696A1 (de) Verfahren und Apparat zum Suchen nach und zum Wiederfinden von Dokumenten, indem ein Faxgerät verwendet wird
DE102005032744A1 (de) Indexextraktion von Dokumenten

Legal Events

Date Code Title Description
8364 No opposition during term of opposition