DE19709968C2 - Verfahren und System zum Übersetzen eines Dokumentes - Google Patents

Verfahren und System zum Übersetzen eines Dokumentes

Info

Publication number
DE19709968C2
DE19709968C2 DE19709968A DE19709968A DE19709968C2 DE 19709968 C2 DE19709968 C2 DE 19709968C2 DE 19709968 A DE19709968 A DE 19709968A DE 19709968 A DE19709968 A DE 19709968A DE 19709968 C2 DE19709968 C2 DE 19709968C2
Authority
DE
Germany
Prior art keywords
document
translation
language
selecting
translation resource
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE19709968A
Other languages
English (en)
Other versions
DE19709968A1 (de
Inventor
Tetsuro Motoyama
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Publication of DE19709968A1 publication Critical patent/DE19709968A1/de
Application granted granted Critical
Publication of DE19709968C2 publication Critical patent/DE19709968C2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/221Parsing markup language streams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/45Example-based machine translation; Alignment
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/47Machine-assisted translation, e.g. using translation memory
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/55Rule-based translation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation

Description

Die Erfindung betrifft ein Verfahren und ein System zum Übersetzen eines Dokuments aus einer ersten Sprache in eine zweite Sprache.
Das Konzept einer maschinellen Übersetzung, mit welcher ein Dokument von einer menschlichen Sprache in eine andere übersetzt wird, ist umfangreich untersucht worden. In den Anfängen der maschinellen Übersetzung in den frühen Vierzigerjahren (1940) erdachte Warren Weaver von der Rockefeller Foundation ein Übersetzungskonzept, das analog dem Decodieren in der Weise ist, daß eine Eins-zu-Eins-Substitution angewendet wird. Jedoch wurde bald klar, dass dieser Weg eine allzu vereinfachende Analogie war, und dass die Feinheiten der menschlichen Sprache beim Entwickeln von Übersetzungssystemen beachtet werden müssen. Beispielsweise ist die Bedeutung bestimmter Worte im Kontext zu bestim­ men, da spezifische Redewendungen Bedeutungen haben können, die aus den einzelnen Worten nicht offensichtlich sind, und einige Worte verschiedene Bedeutungen in verschie­ denen Kontexten haben.
Eine Lösungsmöglichkeit, die maschinelle Übersetzung eines Dokuments zu verbessern, besteht darin, einschränkende Vorschriften bei den Worten und Redewendungen vorzuse­ hen, die in dem Quellendokument enthalten sind, welches zu übersetzen ist. Auf diese Wei­ se können perfekte Übersetzungen erhalten werden, jedoch auf Kosten einer drastischen Beschränkung auf das, was ein Autor sagen will. Die Grundidee, die Sprache einzuschrän­ ken, welche in dem Quellendokument verwendet werden kann, welches zu übersetzen ist, ist ähnlich wie das Benutzen eines Übersetzungsbuches für Redewendungen, das oft von Touristen verwendet worden ist, welches den Benutzer mit einer Sammlung von zu benut­ zenden "stereotypen" Redewendungen versorgt. Dies ist in Ordnung, vorausgesetzt die ste­ reotypen Phrasen enthalten das, was der Benutzer sagen will. Jedoch ist dies in vielen Fäl­ len nicht passend.
Aus der EP 0 568 319 ist bereits ein Übersetzungssystem bekannt, bei welchem ein Text in einem Analysemodul analysiert wird unter Verwendung von Grammatikregeln, Wörterbü­ chern und anderen Quellen, um eine Information bezüglich der Verwendung und Bedeutung der Worte des Quellentextes zu erhalten. Anschließend werden die Worte des Quellentextes mit einem Satz von Äquivalenzaussagen abgeglichen, welche in einem Wörterbuch gespei­ chert sind, und eine Ziel-Wort-Information, welche durch das Abgleichverfahren erhalten wurde, wird an ein Erzeugungsmodul (generation module) ausgegeben, welches einen oder mehrere Versionen eines Textes ausgibt, welcher dem Quellentext entsprechen soll. Dieses "generation module" weist zwei getrennte funktionale Bestandteile auf. Der erste Teil des "generation module" bezieht sich auf die Verarbeitung einer Information, welche nicht von der Reihenfolge der Worte in dem Zieltext abhängt, wobei sich der zweite Teil auf die Kon­ struktion von Strukturen berücksichtigen, welche Beschränkungen hinsichtlich der Wortrei­ henfolge und der Zuordnung zwischen den Zeichen bezieht, wobei der zweite Teil mit dem ersten Teil kommuniziert, um die Analysen zu synchronisieren.
Es muss also ein erster Teil des Textes übersetzt werden, wobei auf eine herkömmliche Art ein Wörterbuch und andere Quellen verwendet werden und es muss ein zweiter Teil des Textes übersetzt werden unter Berücksichtigung der Konstruktion der Strukturen, welche Beschränkungen hinsichtlich der Wortreihenfolge und der Zuordnung zwischen den Zeichen berücksichtigen. Ein Text muss also mit dem bekannten System in zwei unterschiedlichen Schritten übersetzt werden.
Es ist daher Aufgabe der Erfindung, die Nachteile des vorgenannten Standes der Technik zu überwinden und die Notwendigkeit von zwei Übersetzungen zu vermeiden.
Diese Aufgabe wird durch die Merkmale der Ansprüche 1 und 13 gelöst.
Damit kann gemäß der Erfindung insbesondere das maschinelle Übersetzen von Dokumen­ ten mit Hilfe von Ressourcen, wie Wörterbüchern and Vorschriftendatenbasen ausgeführt werden. Dazu können verschiedene Wörterbücher and Datenbasen verwendet werden, um verschiedene Teile eines Dokuments zu übersetzen. Es kann auch ein Dokument geschaffen werden, das mit Hilfe von Hinweissymbolen, wie einer verallgemeinerten Stan­ dard-Markup-Sprache (Standard Generalized Markup Language (SGML)) zu übersetzen ist, um verschiedene Abschnitte des Dokuments anzuzeigen, bei welchem unterschiedliche Übersetzungsressourcen verwendet sind.
Mit der Erfindung kann maschinell eine genauere Übersetzung als durch herkömmliche ma­ schinelle Übersetzungssysteme geschaffen werden, aber nicht allzu einschränkend hinsicht­ lich der Worte oder Redewendungen, die in dem Quellenelement enthalten sind. Gemäß der Erfindung können verschiedene Übersetzungsressourcen bzw. -informationen, wie Wörter­ bücher und Vorschriften-Datenbasen, für verschiedene Teile eines Dokuments verwendet werden, um genauere Übersetzungen zu erzeugen und um ein nach dem Übersetzen vorzu­ nehmendes Redigieren zu minimieren. Auch können gemäß der Erfindung Symbole bzw. Hinweissymbole, wie SGML-Hinweissymbole benutzt werden, um den inneren Aufbau des zu übersetzenden Dokuments festzulegen, um die Wörterbücher und/oder Vorschriften aus­ zuwählen, die für den Übersetzungsprozess zu verwenden sind.
Die Erfindung ermöglicht es auch, ein interaktives Übersetzungssystem zu schaffen, das es einem Benutzer erlaubt, sowohl das Quellendokument als auch das maschinell übersetzte Dokument nebeneinander darzustellen, so dass der Benutzer interaktiv das übersetzte Do­ kument ändern kann, um so eine vorzüglichere Übersetzung zu erhalten. Mit der Erfindung können auch Wörterbücher und/oder Übersetzungsvorschriften aktualisiert werden, die auf den Änderungen basieren, welche der Benutzer an der automatischen Übersetzung vorge­ nommen hat.
Im Gegensatz zur EP 0 568 319 wird nach der Erfindung zunächst eine Information, welche in dem zu übersetzenden Dokument enthalten ist, analysiert. Der Übersetzungsvorgang selbst wird jedoch in einem einzigen Schritt durchgeführt, wobei zum Übersetzen des Do­ kuments eine ausgewählte Übersetzungsressource verwendet wird. Die Erfindung weist also keinen ersten und zweiten Übersetzungsschritt auf, wie in der EP 0 568 319, sondern analy­ siert zunächst das übersetzende Dokument, wählt eine geeignete Übersetzungsressource in Abhängigkeit von dem Analyseergebnis aus, und übersetzt das Dokument dann in einem einzigen Übersetzungsschritt.
Bevor eine Übersetzung durchgeführt werden kann, muss eine Dokumenten-Typ-Definition (DTD) geschaffen werden, welche die zulässigen Hinweissymbole und den zulässigen Auf­ bau eines Dokuments definiert. Beispielsweise kann ein Dokument, das eine Vorrichtung, wie einen Scanner beschreibt, größere Abschnitte, wie einen Überblick, eine Beschreibung der Hardware des Scanners, eine Beschreibung der in dem Scanner benutzten Software, und zusätzliche Angaben oder Optionen haben, die in Verbindung mit dem Scanner benutzt werden können. Der Übersichtsabschnitt kann den Namen oder die Beschreibung der Vorrichtung, eine Abbildung, die den Scanner zeigt, und eine Merkmalsliste des Scanners ent­ halten.
Nachdem die Dokumententyp-Definition festgesetzt worden ist, müssen das Wörterbuch und die Vorschriften-Datenbasen, welche bei dem Übersetzungsprozess zu verwenden sind, festgelegt werden. Eine Art, die Wörterbücher und Vorschriften zu schaffen, die für das Übersetzen der verschiedenen Abschnitte des Dokuments verwendet worden sind, besteht darin, Dokumente mit einer bekannten Übersetzung einzugeben. Auf diese Weise kann das System automatisch die Wörterbuch- und Übersetzungsvorschriften bilden, so dass die Übertragung des Dokuments auf eine richtige bekannte Übersetzung hinausläuft. Zusätzlich oder alternativ zu der Übersetzung bekannter Dokumente kann ein Benutzer ein Dokument selbst übersetzen, so dass Wörterbücher und Vorschriften basierend auf der Eingabe eines Benutzers gebildet werden. Ferner kann eine Kombination von automatischer und "manu­ eller" Übersetzung durchgeführt werden, was dem Benutzer ermöglicht, die automatisch durchgeführten Übersetzungen zu korrigieren, so dass die sich ergebende Übersetzung ge­ nauer ist. Als eine weitere Alternative können die Vorschriften und Wörterbücher "manu­ ell" geschaffen werden. Bei einer bevorzugten Arbeitsweise der Erfindung wird eine ge­ sonderte Datenstruktur für jeden der verschiedenen Abschnitte des Dokuments benutzt. Die Datenstruktur speichert Information, welche Information, wie Namen und (Speicher-)Stel­ len weiterer Wörterbücher und Vorschriften anzeigt, welche bei dem entsprechenden Ab­ schnitt oder anderen Abschnitten des Dokuments benutzt werden können. Das Benutzen der Datenstruktur, um die Wörterbücher und Vorschriften zu verfolgen, erlaubt es, die ver­ schiedenen Wörterbücher und Vorschriften in einer Hierarchie anzuordnen, welche einer Hierarchie der Struktur des Dokuments entspricht. Wenn das Übersetzungssystem ausrei­ chend entwickelt und trainiert ist, kann der Übersetzungsprozess mit Hilfe der spezifischen Wörterbuchinformation und der Übersetzungsvorschriften, welche einem ganz bestimmten Abschnitt des Dokuments entsprechen, automatisch erfolgen. Durch Verwenden der spezi­ fischen Wörterbuchinformation und Vorschriften für die verschiedenen Teile des Doku­ ments wird die Übersetzung genauer und kommt einer Eins-zu-Eins-Entsprechung zwischen dem Quellendokument und dem übersetzten Dokument ohne irgendwelche Belastungen oder Schwierigkeiten näher, welche von einem Verwenden von Übersetzungssystemen herrüh­ ren, welche auf das Benutzen stereotyper Redewendungen beschränkt sind.
Nachfolgend wird die Erfindung anhand von bevorzugten Ausführungsformen unter Bezug­ nahme auf die anliegenden Zeichnungen im einzelnen erläutert. Es zeigen:
Fig. 1 eine hierarchische Struktur eines beispielhaften Doku­ ments;
Fig. 2 das Codieren eines Teils eines Dokuments mit Hilfe von SGML-Hinweisen;
Fig. 3 das Nebeneinanderdarstellen eines Quellendokuments und eines übersetzten Dokuments;
Fig. 4 ein bei der Erfindung benutztes Wörterbuchsystem;
Fig. 5 Übersetzungsvorschriften, wie Grammatik- und Sprachvor­ schriften, welche von der Erfindung benutzt werden;
Fig. 6 eine hierarchische Organisation von Datenstrukturen, die verwendet werden, um die Wörterbücher und Vorschriftenda­ tenbasen auszuwählen, die von den verschiedenen Abschnit­ ten des Dokuments benutzt werden;
Fig. 7 ein Ablaufdiagramm eines Prozesses zum Erzeugen einer Do­ kumententyp-Definition;
Fig. 8 ein Datenflußdiagramm der generellen Arbeitsweise der Er­ findung;
Fig. 9A bis 9C einen Prozeß, der zum Trainieren des Systems ver­ wendet worden ist, um eine richtige Übersetzung durchzu­ führen, und auch eine Ausführungsform zum Durchführen der Übersetzung;
Fig. 10 einen Prozeß, um eine existierende, niedrigere hierarchi­ sche Ebene zu bewegen oder um eine neue niedrigere hierar­ chische Ebene in den Datenstrukturen zu erzeugen, um In­ formation der Wörterbücher- und der Vorschriftendatenbasen zu speichern;
Fig. 11 einen Prozeß zum Durchführen einer automatischen Überset­ zung, nachdem das System aufgebaut und trainiert ist;
Fig. 12 einen Prozeß zum automatischen Übersetzen von Hinweissym­ bolen eines Dokuments;
Fig. 13 einen Prozeß zum Ändern von hierarchischen Ebenen in einem Dokument;
Fig. 14 eine Hardware-Ausführungsform der Erfindung;
Fig. 15 ein Blockdiagramm von Software-Komponenten der Erfindung, und
Fig. 16 ein detaillierteres Datenflußdiagramm der Arbeitsweise der Erfindung.
Anhand der Figuren, in welchen mit den gleichen Bezugszeichen identische oder einander entsprechende Teile in den verschiedenen Ansichten bezeichnet sind, und insbesondere anhand von Fig. 1 wird der Aufbau eines beispielhaften Dokuments erläutert, das zu über­ setzen ist. Der Aufbau des in Fig. 1 dargestellten Dokuments kann für Vorrichtungen, wie einem Kopierer, einem Faksimilegerät, einem Drucker/Printer, einem Scanner oder anderen Vorrichtungen verwendet werden. Das Dokument 30 setzt sich aus vier größeren Abschnitten zusammen, nämlich einer Übersicht 32 der in dem Dokument beschriebenen Vorrichtung, einer Beschreibung der in der Vorrichtung verwendeten Hardware 40, einer Beschreibung der in der Vorrichtung verwendeten Software 42 und einem Abschnitt, in welchem die zusätzlichen Möglichkeiten oder Optionen 44 der Vor­ richtung beschrieben sind. Jeder der Abschnitte kann erforderli­ chenfalls Unterabschnitte aufweisen, welche das Dokument noch weiter in detailliertere Abschnitte unterteilen. Beispielsweise enthält die Übersicht 32 einen Vorrichtungsabschnitt 34, welcher eine absatzweise Beschreibung der Vorrichtung ent­ hält, einen Abbildungsabschnitt 36, welcher eine Darstellung ei­ ner (Speicher-)Stelle enthält, wo eine Darstellung der Vorrich­ tung gefunden werden kann, und eine Merkmalsliste 38 der Vorrich­ tung.
Bei der vorliegenden Erfindung wird nicht die in einer Abbildung enthaltende Information übersetzt, obwohl es möglich ist, eine abweichende Abbildung in dem übersetzten Dokument zu übersetzen, welche ein Bild enthält, welches geeigneter ist für die Sprache, in welcher das Dokument übersetzt worden ist. Beispielsweise zeigt eine Abbildung eines Automobils, welches in den Vereinigten Staaten von Amerika benutzt werden soll, einen Namen, welcher in den Vereinigten Staaten nicht verwendet werden soll, während das entsprechende Bild, das in einem japanischen Dokument verwendet worden ist, den Namen zeigt, welcher in Japan verwendet werden soll. Ebenso können Abbildungen, welche Text in einer anderen Sprache enthalten, verwendet werden.
Bevor erläutert wird, wie das Dokument, das die verschiedenen strukturellen in Fig. 1 dargestellten Abschnitte hat, übersetzt wird, wird ein Beispiel eines Quellendokuments, welches zu über­ setzen ist, anhand von Fig. 2 beschrieben. In Fig. 2 ist die Struk­ tur und der Inhalt eines Teils eines zu übersetzenden Dokuments dargestellt. Das Dokument ist mit Hilfe von Hinweisen codiert werden, wie beispielsweise Hinweisen, welche in der generalisier­ ten Standard-Markup-Sprache (SGML) gebildet worden sind, welches eine bekannte Codierart ist und die im einzelnen in der interna­ tionalen Norm-ISO 8879: 1986 beschrieben ist, die mit "Standard Generalized Markup Language (SGML)" betitelt ist und in dem Buch "Das SGML-Handbuch" von C. F. Goldfarb von Oxford: Clarendon Press, 1990 beschrieben ist, welche beide hiermit als Referenz eingeführt sind. Jedoch ist die Erfindung nicht auf die Verwen­ dung gerade von SGML-Hinweisen beschränkt, es kann auch andere Formattierung, wie beispielsweise Hinweise, die entsprechend der "Hyper Text Markup Language (HTML) oder auf irgendeine andere Weise erzeugt worden sind, oder ein Codieren eines Dokuments oder ein Markieren eines Dokuments, um verschiedene strukturelle Ab­ schnitte anzuzeigen, welche bei verschiedenen Übersetzungsres­ sourcen zu verwenden sind, von dem Übersetzungssystem benutzen. Ein Dokumentensystem, das Formulare benutzt, kann die vorliegende Erfindung bei jedem Abschnitt eines Formulars benutzt werden, das als ein Äquivalent zu einem mit Hinweisen versehenen Element be­ handelt worden ist. Gemäß der SGML-Sprache beginnen Hinweise üblicherweise mit einem "kleiner als"-Zeichen (<); hierauf folgt der Name des Hinweises und Hinweise enden mit einem "größer als"- Zeichen (<). Jedes der Elemente in Fig. 2, welche mit einem "klei­ ner als"-Zeichen beginnen und mit einem "größer als"-Zeichen en­ den, sind Hinweissymbole. Auf den Hinweis können Daten folgen, welche das Hinweissymbol beschreiben. Beispielsweise folgt auf den Hinweis <LANG< in Zeile 3 von Fig. 2 das Wort "english", was anzeigt, daß das Dokument in de englischen Sprache abgefaßt ist.
Auf Hinweise folgen, wenn überhaupt, ein Endhinweis nach den den Hinweis beschreibenden Daten oder die Hinweise haben nicht einen ausdrücklichen Endhinweis, sondern enden stillschweigend durch den Beginn eines nachfolgenden Hinweises. Das Weglassen eines Hinweises ist nur erlaubt, wenn die Syntax der in der DT-Defini­ tion definierten Dokumentenstruktur unzweideutig ist und ein Weg­ lassen eines Hinweises zuläßt. Der Endhinweis beginnt mit dem "kleiner als"-Zeichen, auf das ein Schrägstrich folgt, der von unten links nach oben rechts verläuft; hierauf folgt der Name des Hinweises und er endet mit einem "größer als"-Zeichen (</ . . . <). Das implizite Ende an einem Hinweis ist aus Fig. 2 zu ersehen. Ein Beispiel ist in den Zeilen 3 und 4 gegeben, in welchen auf den Hinweis <LANG< die Daten "ENGLISH" folgen, was anzeigt, daß das Dokument in englischer Sprache abgefaßt ist. Dort gibt es keinen ausdrücklichen Hinweis für den <LANG< Starthinweis, sondern Zeile 4 beginnt mit einen neuen Hinweis <DIVISION<, welcher verwendet ist, um die Abteilung einer Gesellschaft anzuzeigen, von welcher ein Dokument stammt. Das Vorkommen des Hinweises <DIVISION< zeigt implizit an, daß der Hinweis <LANG< beendet ist.
Zeile 1 von Fig. 2 beginnt mit einer Beschreibung !DOCTYPE des Do­ kuments. "DOCTYPE" erklärt eine vorher definierte Dokumententyp- Definition (DTD), zu welcher das zu übersetzende Dokument paßt. OURDOC in Zeile 1 ist die generelle Identifizierung des Dokumen­ tenelements. Die Information zwischen Anführungszeichen zeigt den SGML-Parser der Stelle der DT-Definition an. Dies ist Standard- SGML-Syntax, die verwendet worden ist, um den Dokumententyp anzu­ zeigen. Zeile 2 von Fig. 2 ist ein Hinweis, welcher den Beginn des Dokuments anzeigt; Zeile 3 zeigt an, daß die Sprache des Doku­ ments englisch ist, und Zeile 4 zeigt an, daß das Dokument von einer Abteilung XYZ einer Gesellschaft stammt. Die vorliegende Erfindung kann sehr nützlich für internationale Gesellschaften sein, bei welchen die Notwendigkeit besteht, Dokumente eines ganz bestimmten Formats regelmäßig zu übersetzen. Erforderlichenfalls kann das Dokument nicht nur die Abteilung anzeigen, von welcher das Dokument stammt, oder von welcher das Produkt herrührt, son­ dern das Dokument kann auch eine Identifizierungsinformation der Gesellschaft enthalten.
Zeile 5 von Fig. 2 zeigt an, daß der zu beschreibende Vorrich­ tungstyp ein Scanner ist. Dies ist zweckdienlich, um den Bereich von Wörterbücher-, und Übersetzungs-Vorschriftendaten-Basen ein­ zuengen, welche verwendet werden, um das Wörterbuch anhand von Wörterbüchern und Übersetzungsvorschriften zu übersetzen, welche in Verbindung mit Scannern verwendet werden. Zeile 6 zeigt an, daß das Dokument eine Produktspezifizierung ist, und daß der Name oder die Modellnummer des Scanners, welche auch der Titel des Do­ kuments ist, RS2200-EF ist.
Zeile 8 zeigt den Beginn des Übersichtabschnitts des Dokuments an, welcher in der in Fig. 1 dargestellten, hierarchischen Struk­ tur als 32 bezeichnet ist. Der Übersichtsabschnitt beginnt mit einer Beschreibung der Vorrichtung in Zeile 10, welches ein Ab­ schnitt (<P<) ist, welcher mit den Worten beginnt "Dieser Scanner . . .". Zeile 10 zeigt an, daß eine Abbildung als nächstes in dem Dokument enthalten ist, die der Abbildung 36 in der Struktur der Fig. 1 entspricht. Als nächstes zeigt Zeile 11 an, daß die Merkma­ le der Vorrichtung die folgenden sind; Zeile 12 zeigt, daß die Merkmale aufgelistet sind, und die Einzelheiten der Liste (<IT<) sind anschließend in den Zeilen 13 bis 15 aufgelistet. Das Dokument kann weitergehen; jedoch sind deren Einzelheiten nicht wichtig und sind der Kürze halber weggelassen, um den Leser nicht zu verwirren, indem ein allzu spezielles Beispiel präsentiert wird.
Fig. 3 veranschaulicht ein Bildschirmdisplay 50, das einen Ab­ schnitt (Bereich) 52A, welcher die englische Sprachenversion des in Fig. 2 dargestellten Dokuments wiedergibt, und einen mit 52B bezeichneten Bereich der die übersetzte Version des Dokuments auf der rechten Seite darstellt. Die linke Seite der Fig. 2 veranschaulicht, daß nicht jeder Hin­ weis angezeigt ist, wenn das Dokument der Fig. 2 gedruckt ist oder auf einem elektronischen Display erzeugt worden ist, wie einer Kathodenstrahlröhre oder einem LCD-Display. In dem Abschnitt 52A ist der Titel oder Name der Vorrichtung mit 54A bezeichnet; hier­ auf folgt eine Überschrift "Vorrichtungsübersicht" 56A und hier­ auf ein Absatz (Bereich) 58A, welcher die Information beschreibt. Eine Ab­ bildung ist dann in einem Bereich 60A dargestellt, auf den eine Merkmalsliste der Vorrichtung folgt, die mit 62A, 64A und 66A be­ zeichnet ist. Gemäß der Erfindung ist es möglich, nebeneinander ein Display sowohl mit der Originalsprache des Dokuments als auch der übersetzten Form des Dokuments zu haben, so daß ein Benutzer ohne weiteres das übersetzte Dokument mit dem Originaldokument vergleichen kann und erforderlichenfalls Änderungen machen kann.
Die Bereiche des übersetzten Dokuments 52B haben eine darin ent­ haltene diagonale Schraffierung; während eines tatsächlichen Be­ triebs gemäß der Erfindung würden sie die aktuelle Übersetzung des Originaldokuments 52A haben. Es ist jedoch keine Übersetzung in dem Bereich 52B dargestellt, da es zum Verständnis der Ar­ beitsweise der Erfindung nicht notwendig ist, und nur zu Verwir­ rungen führen würde, beispielsweise wenn fremdsprachige Worte oder Zeichen im Abschnitt (Bereich) 52B enthalten wären.
Es ist nicht kritisch, daß jeder Hinweis oder Daten gemäß der Er­ findung übersetzt werden. Beispielsweise kann der Titel oder Name des Scanners, welcher mit 54A bezeichnet ist, denselben Titel oder Namen in der Fremdsprache haben. Die Kopfleiste "Vorrich­ tungsübersicht" 56A resultiert aus der Übersetzung des Hinweises <OVERVIEW< (<ÜBERSICHT<) in Zeile 8 von Fig. 2. Die Übertragung der Kopfzeile "Vorrichtungsübersicht" ist eine direkte Überset­ zung des Hinweises und kann in einem Wörterbuch oder in einer Ta­ belle gespeichert werden, die der Dokumententyp-Definition zuge­ ordnet ist, welche anzeigt, welche Kopfleiste bei dem Hinweis <OVERVIEW< benutzt werden sollte. Wenn der Hinweis, beispielswei­ se der Hinweis <LANG< in Zeile 3 von Fig. 2 nicht angezeigt wird, besteht keine Notwendigkeit, den Hinweis zu übersetzen, obwohl dies erforderlichenfalls durchgeführt werden kann.
Fig. 3 veranschaulicht, daß dieselbe Abbildung sowohl der das Ori­ ginaldokument darstellende Bereich 52A als auch der das übersetzte Dokument darstellende Bereich 52B ent­ halten ist. Jedoch kann erforderlichenfalls eine gesonderte Ab­ bildung verwendet werden, welche von einem Benutzer bestimmt wor­ den ist oder automatisch ausgewählt wird, um der übersetzten Sprache zu entsprechen. Die in den Bereichen 58A, 62A, 64A und 66A enthaltende Information wird mit Hilfe der entsprechenden Wörterbuch- und Vorschriftsdatenbasis übersetzt.
Der mittels der Erfindung durchgeführte Übersetzungsvorgang be­ faßt sich hauptsächlich mit dem Hin- und Herübersetzen zwischen verschiedenen menschlichen Kommunikationssprachen, wie englisch, japanisch, deutsch, französisch, spanisch, chinesisch, russisch und anderen menschlichen Sprachen. Es sind jedoch auch die Lehren anzuwenden, die bei anderen Sprachtypen und Kommunikationen ent­ halten sind, wie Übersetzungen beispielsweise zwischen verschie­ denen Computersprachen.
Wenn ein Textabschnitt, wie der im Bereich 58A der Fig. 3 darge­ stellte Text, übersetzt wird, werden ein Wörterbuch, das ein Vo­ kabular enthält, und Übersetzungsvorschriften einschließlich Grammatik- und Sprachvorschriften benutzt. Das Benutzen eines Wörterbuchs und Sprachvorschriften bei Übersetzungsprozessen ist herkömmlich. Eine Informationsquelle, wie herkömmliche maschinel­ le Übersetzungssysteme arbeiten, ist in dem Buch "Maschinelle Übersetzung. Eine Einführung" von D. Arnold et al. von Blackwell Publishers, 1994 vorgesehen. Zusätzlich zu dem Vorsehen einer gu­ ten Einleitung in die maschinelle Übertragung sieht dieses Buch auch ein Auflisten von zahlreichen anderen Quellen vor, die her­ kömmliche maschinelle Übersetzungsoperationen beschreiben; auf das Buch von Arnold et al und die anderen hier angeführten Publi­ kationen wird hiermit Bezug genommen. Ein Unterscheidungsmerkmal der vorliegenden Erfindung von den in diesem Buch und den zitier­ ten Referenzen offenbarten Systemen ist die Verwendung eines spe­ zifischen Wörterbuchs oder eines spezifischen Abschnitts eines Wörterbuchs und/oder die Benutzung spezifischer Vorschriftendatenbasen oder eines Abschnitts oder einer Vorschriftsdatenbasis in Abhängigkeit davon, welcher Abschnitt eines Dokuments oder welcher Dokumententyp zu übersetzen ist.
Fig. 4 veranschaulicht ein beispielhaftes Wörterbuch, welches in Verbindung mit der Erfindung verwendet werden kann. In Fig. 4 ist ein Wörterbuch 70 in Englisch-Japanisch/Japanisch-Englisch wie­ dergegeben, das vier gesonderte Abschnitte, nämlich ein Kopierer- Wörterbuch 72, ein Scanner-Wörterbuch 84, ein Printer/Drucker- Wörterbuch 86 und ein allgemeines Wörterbuch 88 für englisches und japanisches Vokabular aufweist. Das Kopierer-Wörterbuch 72 wird verwendet, wenn ein zu übersetzendes Dokument ein Kopierer ist. Ferner wird, wenn der Abschnitt des Dokuments, welcher zu übersetzen ist, ein Kopierer-Benutzer-Handbuch enthält, der Ab­ schnitt 74 des Kopierer-Wörterbuchs 72 verwendet. Wenn eine tech­ nische Beschreibung des Kopierers zu übersetzen ist, wird der technische Beschreibungsabschnitt 76 verwendet, welcher spezifi­ sche Abschnitte 78, 80 und 82 enthält, welche Wörterbuch-Informa­ tion für die Software-, Hardware- und mechanischen Merkmale des Dokuments enthalten, welches den Kopierer beschreibt. Die Einzel­ heiten des Scanner-Wörterbuchs 84 und des Printer-Wörterbuchs 86 sind nicht dargestellt; sie können jedoch in ähnlicher Weise wie das Kopierer-Wörterbuch unterteilt sein. Ferner wird der allge­ meine Wörterbuchabschnitt 78 für englisches und japanisches Voka­ bular benutzt, um allgemeine Worte zu übersetzen, welche nicht spezifisch sind oder nicht in einem der anderen Wörterbücher ent­ halten sind.
Wörterbücher und Vorschriftendaten-Basen können auf der höchsten hierarchischen Ebene in verschiedene Gebiete unterteilt werden. Beispielsweise kann es ein Kopierer-, ein Scanner- und ein Prin­ ter-Gebiet sein. Wenn Dokumente, welche übersetzt werden, in einem dieser Gebiete enthalten sind, werden die Wörterbücher und Vorschriften, welche benutzt werden, um die Übersetzung durchzu­ führen, aus dem entsprechenden Gebiet genommen.
Die Information, die in den Wörterbüchern und in den spezifischen Wörterbuchabschnitten enthalten ist, wird erforderlichfalls in jeder gewünschten Weise einschließlich einer herkömmlichen Art und Weise gespeichert. Ein wichtiges Merkmal der Erfindung liegt darin, daß verschiedene Wörterbuch-Information in Verbindung mit verschiedenen Abschnitten verschiedener Dokumententypen verwendet wird. Jedoch können auch im Vergleich zu dem, was in Fig. 4 darge­ stellt ist, auch andere Zusammenstellungen von Wörterbüchern be­ nutzt werden. Beispielsweise können gesonderte Wörterbücher für verschiedene Abschnitte oder verschiedene Dokumententypen verwen­ det werden; es kann jedoch auch ein Wörterbuch zwischen verschie­ denen Dokumententypen gemeinsam benutzt werden und es können er­ forderlichenfalls verschiedene Abschnitte desselben Wörterbuchs benutzt werden. Die verschiedenen Wörterbücher oder Abschnitte können über die Benutzung von Zeigern oder Merkern ausgewählt werden, die anzeigen, welches Wörterbuch zu benutzen ist. Wenn die Wörterbücher einzurichten, zu modifizieren oder zu verwenden sind, kann die Information in einem Wörterbuch erforderlichen­ falls in ein anderes Wörterbuch kopiert werden.
Fig. 5 zeigt eine beispielhafte Anordnung einer Grammatik- und Sprachvorschriften-Datenbasis 90, welche in dem Übersetzungs­ prozeß der Erfindung verwendet wird. Die Datenbasis enthält japa­ nische Grammatik- und Sprachvorschriften 92, welche Grammatik- und Sprachregeln, die benutzt worden sind, wenn Gesellschafts- Richtlinien übersetzt werden, und Vorschriften 94 enthalten, wenn Benutzer-Handbücher übersetzt werden, einschließlich-Benutzer- Handbücher, die Printer/Drucker, Scanner oder Kopierer betreffen, die jeweils ihre eigenen Vorschriften 98, 100 bzw. 102 haben, und sie enthält einen Abschnitt 104, der zum Übersetzen von techni­ schen Dokumenten verwendet wird, einschließlich Dokumenten, die Printer 106, Scanner 108 und Kopierer 110 betreffen. Die Datenba­ sis 90 enthält auch englische Grammatik- und Sprachvorschriften 120, welche auch Vorschriften zum Übersetzen von Gesellschafts- Richtlinien und Vorschriften 122, 124 zum Übersetzen von Benut­ zerhandbüchern einschließlich Vorschriften 126, 128 und 130 zum Übersetzen von Benutzer-Handbüchern für Printer, Scanner bzw. Ko­ pierer sowie Vorschriften 132 zum Übersetzen technischer Dokumen­ te, einschließlich Vorschriften 134, 136, 138 zum Übersetzen technischer Dokumente, enthalten, welche Printer/Drucker, Scanner und Kopierer betreffen.
Die Grammatik- und Sprachvorschriften, welche in der Datenbasis 90 gespeichert sind, sind herkömmliche Grammatik- und Sprachre­ geln für maschinelles Übersetzen, und ein Fachmann weiß folglich, wie derartige Regeln und Vorschriften gestaltet sind. Jedoch sind die Vorschriften bei der vorliegenden Erfindung spezifisch zuge­ schnitten und haben verschiedene Abschnitte oder verschiedene spezifische Regeln, um verschiedene Teile des Dokuments zu über­ setzen.
Fig. 6 erläutert eine bevorzugte Art und Weise, Information hin­ sichtlich Speicherstelle und hierarchischer Struktur der Wörter­ buch- und Vorschriftendaten-Basen zu speichern, so daß sie bequem ausgewählt und von den verschiedenen Abschnitten eines Dokuments benutzt werden können. Jede der Datenstrukturen 150A bis 150G hat dieselbe Struktur, weshalb die einzelnen Felder der Datenstruktu­ ren 150B bis 150G nicht dargestellt worden sind. Ein Schlüssel- Feld 152 ist eine eindeutige Identifizierung für die Datenstruk­ tur. Beispielsweise kann der Schlüssel einfach eine Zahl sein; andererseits könnte er auch ein Name sein. Für die höchste hie­ rarchische Ebene der Datenstruktur 150A ist es absolut nicht notwendig, einen Schlüssel zu haben, und der Schlüssel kann gleich null einge­ stellt werden. Die Datenstruktur 150A enthält einen Zeiger 154 zu einer Elterndaten-Struktur, so daß es möglich ist, ohne weiteres den hierarchischen Baum von Datenstrukturen zu durchwandern. Wenn jedoch die Datenstruktur 150A auf der höchsten hierarchischen Ebene liegt, dann hat sie keinen Elternteil, und, der Zeiger 154 in der Elterndaten-Struktur wird gleich null gesetzt. Das Wör­ terbuch, das für die Übersetzung des entsprechenden hierarchi­ schen Pegels des Dokuments benutzt worden ist, ist an der Adresse festgelegt, die in dem Zeiger zu dem Wörterbuch 156 enthalten ist. Dementsprechend ist die Adresse der Vorschriftendatenbasis, die zum Übersetzen des entsprechenden Abschnitts des Dokuments verwendet worden ist, an einer Adresse angeordnet, die dem Zeiger auf die Vorschriftendatenbasis 158 entspricht.
Ein Feld enthält einen Zeiger zu einer Schlüsselinformation 160.
Dies kann ein Zeiger auf eine Tabelle sein, die einen Schlüssel enthält, welcher der Struktur des Schlüsselelements im Schlüsselfeld 152 entspricht, und kann ein gesondertes Feld für Eingangsinformation sein. Beispielsweise enthält eine unten wiedergegebene Tabelle I eine Spalte Eingangsinformation, welche den Namen eines Hinweises beschreibt, der die Auswahl des Wörterbuchs und der Vorschrift bewirkt, und eine Spalte, die Schlüssel enthält, die der Ein­ gangsinformation entsprechen.
Tabelle I
Die Datenstruktur 150A enthält ferner ein Feld 162, welches die Anzahl von Kinderdaten-Strukturen aufweist. Beispielsweise ent­ hält die Datenstruktur 150A vier Kinderdaten-Strukturen 150B bis 150E. Schließlich enthält das Feld 164 eine Anordnung von Zeigern zu den verschiedenen Kinderdaten-Strukturen 150B bis 150E.
Wenn gewünscht wird, auf eine nächst niedrigere Ebene in der Hie­ rarchie zu gehen, wird ein Hinweis in dem zu übersetzenden Dokument gelesen, welcher die Wörterbuch- und Vorschriftendaten- Basis anzeigt, welche zu benutzen ist. Beispielsweise wird bei Verarbeiten von Zeile 5 in Fig. 2, welche anzeigt, daß das Dokument einen Scanner beschreibt, Tabelle I aufgesucht, um den Eintrag Scanner zu finden, welcher einen Schlüssel 12 hat. Die Datenstrukturen in der nächst niedrigeren hierarchischen Ebene werden mit Hilfe der Anzahl Kinder und einer Anordnung von Zei­ gern zu Kindern aufgesucht, um das Wörterbuch festzulegen, wel­ ches den Schlüssel 12 hat. Auf diese Weise ist es möglich, wirk­ sam eine Spur von Wörterbuch- und Vorschriftsdaten-Basisinforma­ tion zu suchen, welche der hierarchischen Ebene und dem Dokumen­ tentyp entspricht, der zu übersetzen ist.
Gemäß der Erfindung werden Dokumente übersetzt, welche Hinweise von verschiedenen Abschnitte enthalten, welche hierarchische Ebe­ nen des Dokuments sein können. Um für die maschinelle Überset­ zungseinrichtung zu wissen, wann die Abschnitte oder hierarchi­ schen Ebenen beginnen und enden, muß das zu übersetzende Dokument einen Hinweis auf den Anfang jedes Abschnitts enthalten. Eine be­ queme Art und Weise, auf die verschiedenen Abschnitte eines Doku­ ments hinzuweisen, ist das Verwenden von Hinweissymbolen. Die Hinweissymbole werden vorzugsweise entsprechend der SGML-Sprache angeordnet; es kann jedoch auch eine andere Art und Weise benutzt werden, die verschiedenen Abschnitte des Dokuments erforderli­ chenfalls anzuzeigen. Die SGML-Hinweissymbole, welche bei der Er­ findung verwendet werden, um die verschiedenen Abschnitte anzu­ zeigen, müssen mit einer spezifischen Dokumententyp-Definition (DTD) entsprechend den Vorschriften der SGML-Sprache übereinstim­ men. Es ist wahrscheinlich, daß eine neue DT-Definition erzeugt werden muß, damit die Erfindung effizient arbeitet. Es gibt be­ kannte DT-Definitionen, welche vorhanden sind und ein auf diesem Gebiet tätiger Fachmann könnte eine neue DT-Definition, die auf den hier gegebenen Lehren basieren, ohne übermäßiges Experimen­ tieren entwickeln. Eine beispielshafte SGML-Dokumententyp-Defini­ tion, die wahrscheinlich bei der vorliegenden Erfindung nicht un­ mittelbar benutzt werden könnte, aber zeigt, wie eine DT-Defini­ tion strukturiert ist, ist die DT-Definition im Anhang E der in­ ternationalen Norm ISO 8879-1986(E), die auf Seite 136 beginnt.
Fig. 7 erläutert einen Prozeß, um eine Dokumententyp-Definition zu schaffen. Nach einem Starten wird beim Schritt 172 die Struktur einer Anzahl von Dokumenten analysiert, welche in demselben Ge­ biet liegen. Dies kann automatisch, von einer Person oder durch eine Kombination aus einer Maschine und einer Person vorgenommen werden. Beim Schritt 174 werden dann die gemeinsamen strukturel­ len Elemente (einschließlich den semantischen) sowie eindeutige Strukturelemente für die verschiedenen Dokumente bestimmt. Basie­ rend auf den gemeinsamen Strukturelementen und eindeutigen Struk­ turelementen sowie auch den semantischen Elementen wird beim Schritt 176 eine neue Struktur festgelegt, welche eine Dokumen­ tentyp-Definition (DTD) für das Gebiet ist. Beispielsweise kann die Struktur eines Scanner beschreibenden Dokuments, wie in Fig. 1 dargestellt ist, vier Hauptabschnitte haben, nämlich die Über­ sichts 32, den Hardware-Abschnitt 40, den Software-Ab­ schnitt 42 und den Zusatzelemente enthaltenden Abschnitt 44. Fer­ ner kann die Übersicht 32 einen Abschnitt enthalten, welcher die Vorrichtung, eine Abbildung und eine Merkmalsliste festlegt. Beim Schritt 178 wird dann bestimmt, ob die neue Struk­ tur, welche festgelegt worden ist (z. B. die DTD) im Gebiet ge­ nügt, was bedeutet, daß die Dokumente mit Hilfe der DT-Definition dargestellt werden können. Wenn sie es nicht können, wird in dem Ablaufdiagramm auf Schritt 176 zurückgegangen, um die DT-Defini­ tion erneut zu definieren oder zu ändern. Wenn die Struktur ak­ zeptabel ist und dem Gebiet genügt, wird beim Schritt 180 die Struktur in eine SGML-Dokumententyp-Definition geschrieben, und der Prozeß in Fig. 7 ist beendet.
Fig. 8 ist ein Datenablaufdiagramm, das die generelle Arbeitsweise der Erfindung zeigt. In Fig. 8 und auch in dem Datenablaufdiagramm der Fig. 16 zeigen die Kreise einen Prozeß an; die Information, die in zwei horizontalen Linien enthalten ist, zeigt einen Daten­ typ an, und die Blöcke oder Quadrate geben einen Benutzer oder eine andere Vorrichtung an, welche eine Operation durchführt. In dem Datenablaufdiagramm der Fig. 8 erstellt ein Dokumentenerstel­ ler (creator) 202 ein Dokument mit Hilfe eines Dokumentenaufbe­ reitungs-/Erstellungsprozesses 204. Eine Eingabe von dem Dokumen­ tenersteller 202 wird in dem Prozeß 204 zusammen mit einer vorher erstellten Dokumententyp-Definition 206 benutzt. Wenn bei dem Dokumentenaufbereitungs-/Erstellungsprozeß 204 ein Problem mit dem zu erstellenden oder aufzuberei­ tenden Dokument festgestellt wird, ist ein Rückkoppeln zu dem Do­ kumentenersteller 202 vorgesehen. Beispiele von Problemen schlie­ ßen eine Verletzung von Gesellschaftsrichtlinien und unklaren An­ gaben ein. Das Ergebnis des Dokumentenaufbereitungs-/Erstellungs­ prozesses 204 ist das Originaldokument 208.
Das Datenablaufdiagramm der Fig. 8 enthält einen Übersetzungs- und Systemtrainer 210, welcher verwendet wird, um die Übersetzungs- und Wörterbuchvorschriften zu entwickeln. Ein Wörterbuch- und Vorschriften-Entwicklungsprozeß 210 erhält die Dokumententyp-Definition 206, das Originaldokument 208 und eine Eingabe von dem Übersetzungs- und System­ trainer 210 und entwickelt die Wörterbuch- und Vorschriftendaten­ basis. Das Originaldokument 208 wird in den Wörterbuch- und Vor­ schriften-Entwicklungsprozeß 212 und/oder den Zuordner/Übersetzer 214 von einer Platte, einem RAM oder einem anderen Speichermedium oder von einer Übertragungsleitung aus, wie einem Netz, oder von einem Modem aus eingegeben. Ferner sorgt der Wörterbuch- und Vor­ schriftenentwicklungsprozeß 212 für ein Rückkoppeln zu dem Über­ setzungs- und Systemtrainer 210. Während des Trainings- und des Übersetzungsprozesses benutzt erforderlichenfalls der Übersetzungs- und Systemtrainer 210 eine Wörterbuchdatenbasis 216 und eine Vorschriftendatenbasis 218, um ein übersetztes Dokument 220 zu erzeugen. Das Wörterbuch oder die Wörterbücher und/oder Vorschriftendatenbasen, die für den Übersetzungsprozeß verwendet worden sind, werden als Überset­ zungsinformation oder Übersetzungsressourcen betrachtet. Jedoch sind die Übersetzungsinformationen oder die Übersetzungsressour­ cen nicht auf reine Wörterbücher oder Vorschriftendatenbasen be­ schränkt, sondern andere Ressourcen und Informationen, welche ei­ nen Übersetzungsprozeß unterstützen oder durchführen, sind eben­ falls Übersetzungsinformationen oder Übersetzungsressourcen.
Das Datenablaufdiagramm enthält auch einen automatischen Zuordner/Überset­ zer 214, welcher die Dokumententyp-Definition 206, das Original­ dokument 208, die Wörterbuchdatenbasis 216 und die Vorschriften­ datenbasis benutzt, um automatisch das übersetzte Dokument 220 zu erzeugen. Das übersetzte Dokument wird in einem Speicher, wie beispielsweise einer Diskette, einem RAM oder einer anderen Art Speicher gesichert, mittels eines Printers gedruckt und/oder an einen anderen Computer über ein Netz, ein Modem oder eine andere Übertragungsleitung abgegeben und/oder auf einem Printer ge­ druckt.
Fig. 9A bis 9C und 10 veranschaulichen einen Prozeß, welcher dem Wörterbuch- und Vorschriftenentwicklungsprozeß 212 entspricht, der in Fig. 8 dargestellt ist. Dieser Prozeß wird benutzt, um nicht nur das Wörterbuch und Vorschriften zu entwickeln, sondern wird auch dazu verwendet, einen Übersetzungsprozeß durchzuführen. Nach einem Starten in Fig. 9A wird beim Schritt 230 der nächste Token des zu übersetzenden Dokuments gelesen. Wenn gerade erst gestartet worden ist, ist dies der erste Token des Dokuments, der ein Hinweis oder ein Abschnitt von zu übersetzenden Daten sein kann. Beim Schritt 232 wird dann bestimmt, ob der Token ein Hin­ weis ist. Wenn dies der Fall ist, wird im Ablaufdiagramm auf den Schritt 234 übergegangen, bei welchem bestimmt wird, ob der Token ein Starthinweis ist. Wenn festgestellt wird, daß der Token ein Starthinweis ist, wird beim Schritt 240 festgestellt, ob die vor­ herige hierarchische Ebene des Dokuments ohne einen Endhinweis endete. Wie vorstehend bereits erläutert, kann ein Endhinweis weggelassen werden, und das Ende eines bestimmten Hinweises kann automatisch gefühlt werden, wenn die Dokumententyp-Definition be­ kannt ist. Wenn folglich beim Schritt 240 festgestellt wird, daß die vorher hierarchische Ebene ohne einen Endhinweis geendet hat, wird Schritt 242 durchgeführt, welcher auf eine hierarchische Ebene oder mehrere hierarchische Ebenen geht, da der Starthin­ weis, auf den gerade gestoßen worden ist, bedeutet, daß ein vor­ heriger Hinweis oder mehrere Hinweise geendet haben. Wenn die Feststellung beim Schritt 240 negativ ist oder nach dem Durchfüh­ ren des Schrittes 244 geht das Ablaufdiagramm beim dem in Fig. 9B dargestellten Prozeß weiter.
In Fig. 9B wird beim Schritt 248 der Starthinweis verarbeitet, um, wenn überhaupt, die Attribute des Starthinweises festzulegen (siehe beispielsweise Zeilen 4, 10, usw. von Fig. 2). Beim Schritt 250 wird der Prozeß aufgerufen, sich eine hierarchisches Ebene nach unten zu bewegen, welche in Fig. 10 dargestellt ist. Das zu übersetzende Dokument wird dann in verschiedenen hierarchischen Ebenen angeordnet, und wenn eine neue hierarchische Ebene aufge­ treten ist, welche durch einen neuen Starthinweis angezeigt wird, ist es notwendig, die Datenstrukturen, wie beispielsweise die in Fig. 6 dargestellten Datenstrukturen einzustellen, so daß die richtige Wörterbuch- und Vorschriftendatenbasis, falls es erfor­ derlich ist, geschaffen und benutzt werden.
In Fig. 10 wird nach dem Start beim Schritt 280 festgestellt, ob es das erste Mal ist daß diese ganz bestimmte hierarchische Ebene und strukturelle Hinweise zu verwenden sind. Wenn beispielsweise der Hinweis niemals verwendet worden ist, sind die Datenstruktu­ ren zum Speichern der hierarchischen Information erzeugt worden, welche die Wörterbücher und Vorschriften anzeigt, welche zu ver­ wenden sind, wie beispielsweise die in Fig. 6 dargestellten Daten­ strukturen. Wenn die hierarchische Ebene oder der Hinweis vorher verwendet worden sind, sollte die neue Datenstruktur nicht redun­ dant zugeordnet werden, wenn sie vorher zugeordnet worden ist. Beim Schritt 280 wird festgestellt, ob dies das erste Mal ist, daß die hierarchische Ebene zu verwenden ist, und eine Daten­ struktur zum Speichern von Information eines Wörterbuchs und von Übersetzungsvorschriften, wie beispielsweise die in Fig. 6 darge­ stellte Datenstruktur 150A wird zugeordnet. Beim Schritt 284 wer­ den die Felder dieser erzeugten Datenstruktur initialisiert, um die notwendige Information zu erhalten. Beispielsweise muß eine eindeutige Identifikation für das Schlüsselfeld 152 erzeugt werden; der Zeiger zu dem Wörterbuch 156 und der Zeiger zu der Vorschrif­ tendatenbasis 158 müssen gesetzt werden; die neue Wörterbuch- und Vorschriftendatenbasis, welche benutzt werden, müssen erzeugt oder kopiert werden, und der Zeiger zu der Schlüsselinformation 160 muß initialisiert werden, um in der Zukunft den Schlüssel be­ stimmen zu können. Auch ist es notwendig, die Tabelle zu aktuali­ sieren, welche den Schlüssel und die Schlüsselinformation ent­ hält. Ferner muß der Zeiger auf den Elternteil 154 eingestellt werden, um auf die Elterndatenstruktur in der nächst höheren hierarchischen Ebene zu zeigen; die Anzahl Kinder ist null zu setzen, und die Zeigeranordnung zu den Kindern ist auf null zu stellen, wenn es zu diesem Zeitpunkt keine Kinder für die gerade erzeugte Datenstruktur gibt. Beim Schritt 286 muß die Elternda­ tenstruktur aktualisiert werden, so daß die Anzahl Kinder und die Anordnung von Zeigern auf die Kinder genau das Erstellen des neuen Wörterbuchs reflektieren.
Wenn beim Schritt 280 festgestellt wird, daß dies nicht das erste Mal ist, daß die hierarchische Ebene verwendet wird, wird beim Schritt 288 die Schlüsselinformation von dem Hinweissymbol aus erhalten. Sobald die Schlüsselinformation bekannt ist, kann der Schlüssel mit Hilfe einer Tabelle, wie beispielsweise der Tabelle I, gefunden werden. Beim Schritt 290 wird dann die Datenstruktur gefunden, die der Schlüsselinformation entspricht, welche die Da­ tenstruktur mit dem Schlüssel ist, welcher der Schlüsselinforma­ tion entspricht. Diese Datenstruktur wird als die derzeit gültige Datenstruktur gesetzt, die für den Übersetzungsprozeß des derzeit gültigen Hinweises verwendet worden ist. Von den Schritten 290 und 286 kehrt das Ablaufdiagramm auf den Aufrufprozeß zurück, welcher in diesem Fall ein Zurück auf den Schritt 252 in Fig. 9B ist.
Beim Schritt 252 der Fig. 9B wird festgestellt, ob der Hinweis eine direkte Übersetzung hat. Wenn der Hinweis nicht eine direkte Übersetzung hat, ist es nicht notwendig, das Hinweissymbol zu übersetzen, wenn es dem Benutzer niemals angezeigt wird. Das Hin­ weissymbol kann für Dokumentenstrukturierzwecke verwendet werden, wird aber nicht tatsächlich angezeigt und folglich ist es nicht von Bedeutung, für welche Sprache der Hinweis ist, solange der Prozeß, der verwendet worden ist, um das Dokument darzustellen, die Form des Hinweises erkennt. Wenn der Hinweis nicht eine direkte Übersetzung hat, kehrt das Ablaufdiagramm auf den Aufruf­ prozeß zurück. Anschließend kann der Prozeß der Fig. 9A wiederholt werden, um den nächsten Token des Dokuments zu lesen.
Wenn beim Schritt 252 in Fig. 9B festgestellt wird, daß das Hin­ weissymbol eine direkte Übersetzung hat, wird das Hinweissymbol mit Hilfe des Wörterbuchs und von Vorschriften der aktuellen hierarchischen Ebene übersetzt. Andererseits kann die Übersetzung des Hinweises in einer Tabelle festgelegt sein, die der DT-Defi­ nition zugeordnet ist, und kann mit Hilfe dieser Tabelle einfach Eins-zu-Eins übersetzt werden. Als eine weitere Alternative kann die Übersetzung des Hinweises von einer vorherigen Übersetzung des Dokuments erhalten werden und dazu verwendet werden, das Sy­ stem zu trainieren. Als nächstes wird beim Schritt 256 das Hin­ weissymbol in dessen Originalsprache und auch die Übersetzung des Hinweissymbols angezeigt. Dies entspricht der Darstellung der in Fig. 3 dargestellten Abschnitte 56A und 56B. Beim Schritt 258 wird der Benutzer gefragt, ob es gewünscht wird, die Übersetzung zu ändern. Wenn die Übersetzung zu ändern ist, werden das Wörterbuch und die Vorschriften erforderlichenfalls aktualisiert, um bei zukünftigen Übersetzungen den Wunsch des Benutzers zu reflektieren. Das Ablaufdiagramm kehrt dann auf den Aufrufprozeß zurück, um mit Hilfe weiterer Information, die in dem Dokument enthalten ist, zu übersetzen und zu trainieren.
In Fig. 9A wird, wenn beim Schritt 234 festgestellt wird, daß das zu verarbeitende Token nicht ein Starthinweis ist, beim Schritt 256 bestimmt, ob der Token ein Endhinweis ist. Wenn dies nicht der Fall ist, wird ein Fehler angezeigt, da der Token entweder ein Start- oder ein Endhinweis sein muß, da beim Schritt 232 festgestellt worden ist, daß der Token ein Hinweissymbol ist. Wenn beim Schritt 236 festgestellt wird, daß der Token ein End­ hinweis ist, wird beim Schritt 238 die in Fig. 6 dargestellte hie­ rarchische Struktur eingestellt, so daß die entsprechende Daten­ struktur für zukünftige Übersetzungen verwendet wird. Durch ein Bewegen auf eine hierarchische Ebene oder mehrere hierarchische Ebenen des Dokuments wird dann die nächste höchste Datenstruktur in Richtung zu dem oberen Ende der Seite in Fig. 6 ausgewählt. Wenn ein Endhinweis (oder dessen Weglassen) anzeigt, daß mehr als eine hierarchische Ebene geendet hat, wird die entsprechende An­ zahl hierarchischer Ebenen nach oben gegangen. Das Ablaufdiagramm kehrt dann auf den Aufrufprozeß zurück und kann zusätzliche In­ formationen, die in dem Dokument enthalten ist, wenn es vorhanden ist, zum Trainieren und Übersetzen verwenden, indem der Prozeß von Fig. 9A bis 9C wiederholt wird.
Wenn beim Schritt 232 festgestellt wird, daß der Token nicht ein Hinweissymbol ist, muß der Token Daten sein, und das Ablaufdia­ gramm geht bei dem in Fig. 9C dargestellten Prozeß A weiter. In Fig. 9C wird beim Schritt 264 festgestellt, wenn die Daten die Hierarchie manipulieren. Ein Beispiel für die Daten, welche die Hierarchie manipulieren, kann in Zeile 5 von Fig. 2 gesehen wer­ den, wo die Daten ein "Scanner" sind. Die Daten "Scanner" zeigen an, daß die Hierarchie, welche zu verwenden ist, für das Scanner­ gebiet ist. Wenn die Daten die Hierarchie manipulieren, geht das Ablaufdiagramm auf Schritt 266 über, was bewirkt, daß der Prozeß auf eine hierarchische Ebene heruntergeht, welche mit Hilfe des Prozesses von Fig. 10 durchgeführt wird. Fig. 10 ist bereits bezüglich des Schrittes 250 in Fig. 9B erläutert worden, so daß er hier nicht wieder erläutert wird, um dadurch Redundanz zu vermeiden. Von dem Schritt 260 aus, oder wenn die Daten die Hierarchie nicht manipulieren, wird der Originalsatz, welcher zu übersetzen ist, beim Schritt 268 hervorgehoben (beispielsweise wenn er in einer Weise angezeigt wird, wie in Fig. 3 dargestellt ist, und dadurch hervorgehoben wird). Eine Übersetzung des hervorgehobenen Satzes wird ebenfalls mit Hilfe des Wörterbuchs und Vorschriften der ak­ tuellen hierarchischen Ebene beim Schritt 270 angezeigt. Dies läuft darauf hinaus, daß das Original und die übersetzte Informa­ tion unmittelbar nebeneinander angezeigt werden, wie die in Fig. 3 dargestellten Bereichen 58A und 58B.
Beim Schritt 272 wird dann festgestellt, ob der Benutzer wünscht, die Übersetzung zu ändern. Wenn der Benutzer dies nicht will, kehrt das Ablaufdiagramm zurück, so daß zusätzliche Information in dem Originaldokument übersetzt werden kann. Wenn der Benutzer wünscht, die Übersetzung zu ändern, gibt der Benutzer die kürz­ lich übermittelte Information beim Schritt 274 ein, und das Ori­ ginal und die vorher übersetzten Sätze werden analysiert, um die Unterschiede zwischen der Übersetzung, die von dem Benutzer ge­ wünscht worden ist, und der automatisch durchgeführten Überset­ zung festzustellen. Anschließend werden das Wörterbuch und die Vorschriften der aktuellen hierarchischen Ebene beim Schritt 276 aktualisiert, so daß zukünftige Übersetzungen derselben oder ähn­ licher Ausdrücke bzw. Redewendungen zu der gewünschten Überset­ zung führen. Der Prozeß in Fig. 9C kehrt dann auf den Aufrufprozeß zurück.
Zu beachten ist, daß, wenn ein Wörterbuch und Übersetzungsregeln nicht vorhanden oder nicht vollständig sind, wenn der Schritt 270 durchgeführt wird, um eine vollständige oder entsprechende Über­ setzung durchzuführen, es nicht wesentlich ist, daß die Überset­ zung dargestellt wird, sondern es kann eine Anzeige gegeben wer­ den, daß eine ausreichende Information nicht vorhanden ist, die Übersetzung durchzuführen. Ferner wird, wenn der Trainingsprozeß des Übersetzers mit Hilfe eines zu übersetzenden Originalsdoku­ ments und einer vorher angefertigten Übersetzung des Dokuments durchgeführt wird, beim Schritt 270 die vorher angefertige Über­ setzung angezeigt, und wenn der Benutzer die Übersetzung nicht ändern will, werden das Wörterbuch und die Vorschriften der ak­ tuellen hierarchischen Ebene überprüft und erforderlichenfalls geändert, damit zukünftige automatische Übersetzungen des Origi­ naldokuments auf eine Übersetzung hinauslaufen, welche dieselbe ist wie die vorher durchgeführte Übersetzung.
Während des Trainierens, das mittels der Ablaufdiagramme der Fig. 9A bis 10 durchgeführt worden ist, kann eine Datenstruktur, wie sie in Fig. 6 dargestellt ist, für jedes Hinweissymbol oder für jede der verschiedenen hierarchischen Ebenen des Dokuments geschaffen werden. Dies kann zu einer sehr großen Anzahl von Da­ tenstrukturen und entsprechenden Wörterbüchern und Vorschriften­ datenbasen führen. Um jedoch die Anzahl Datenstrukturen 150 und die Anzahl an Wörterbüchern und Vorschriftendatenbasen zu verrin­ gern, werden gemäß der Erfindung, falls es gewünscht wird, die verschiedenen Wörterbücher und die Vorschriftendatenbasen mitein­ ander verglichen, um die Ähnlichkeiten zu sehen. Wenn Ähnlichkei­ ten gefunden werden, können die Datenstrukturen und/oder die Wör­ terbücher oder Vorschriftendatenbasen zusammengelegt oder verein­ igt werden. Es ist auch möglich, die Wörterbücher und die Vor­ schriftendatenbasen einfach zu kombinieren, um deren Anzahl zu verringern. Die Kombination der verschiedenen Wörterbücher und/oder Vorschriftendatenbasen kann auch vorzuziehen sein, wenn man eine geringe Anzahl von Einträgen erhält, welche sich nicht widersprechen oder sich nicht von anderen Übersetzungsressourcen unterscheiden. Durch Kombinieren der Wörterbücher kann die Anzahl an Wörterbüchern und Vorschriftendatenbasen und/oder die Anzahl an Datenstrukturen verringert werden, die verwendet werden, um die Wörterbücher zu verfolgen. Ein Reduzieren von Wörterbüchern und Vorschriften erlaubt es auch, die hierarchischen Strukturen zu konsolidieren und zu vereinfachen. Es ist jedoch nicht notwen­ dig, die verschiedenen Übersetzungsressourcen einschließlich der Datenstrukturen zu kombinieren, wenn dies nicht gewünscht wird. Durch Verwenden einer spezifischen Wörterbuchinformation und von Vorschriften für die verschiedenen Abschnitte des Dokuments wird die Übersetzung genauer und kommt einer Eins-zu-Eins-Entsprechung zwischen dem Quellendokument und dem übersetzten Dokument ohne Belastungen und Schwierigkeiten näher, welche sich durch das Ver­ wenden von Übersetzungssystemen ergeben, welche auf das Benutzen stereotyper Redewendungen beschränkt sind.
In Fig. 11 ist ein Prozeß dargestellt, welcher von dem automati­ schen Übersetzer 214 der Fig. 8 durchgeführt wird. Nach dem Star­ ten wird beim Schritt 294 die Dokumententyp-Definition (DTD) ge­ lesen, welche die zulässige Struktur des Dokuments festlegt. Beim Schritt 296 wird dann der nächsten Token des Dokuments gelesen, welcher zu übersetzen ist. Dieser Token ist entweder ein Hinweis­ symbol oder zu übersetzende Daten. Beim Sehritt 298 wird festge­ stellt, wenn das Ende des Dokuments erreicht worden ist. Wenn dies der Fall ist, endet der automatische Übersetzungsprozeß. Wenn das Ende nicht erreicht worden ist, wird beim Schritt 300 festgestellt, ob der Token ein Hinweissymbol ist. Wenn er nicht ein Hinweissymbol ist, entspricht der Token Daten und der Token wird mit Hilfe des aktuellen Wörterbuchs und der Vorschriftsda­ tenbasis übersetzt, welche mit Hilfe der aktuellen Datenstruktur, wie beispielsweise eine der in Fig. 6 dargestellten Datenstruktu­ ren, bestimmt wird. Wenn der Token ein Hinweissymbol ist, geht das Ablaufdiagramm von dem Schritt 300 auf den Schritt 304 über, bei welchem das Hinweissymbol einen in Fig. 12 dargestellten Pro­ zessor aufruft.
In Fig. 12 wird beim Schritt 310 bestimmt, wenn eine direkte Über­ setzung des Hinweissymbols benötigt wird. Eine direkte Überset­ zung des Hinweissymbols wird benötigt, wenn das übersetze Hin­ weissymbol in dem Dokument dargestellt wird und nicht einfach für Dokumenten-Strukturierprozesse ist. Wenn eine Übersetzung benö­ tigt wird, wird beim Schritt 312 festgestellt, ob die direkte Übersetzung vorhanden ist. Wenn dies der Fall ist, wird der Hin­ weis mit Hilfe des aktuellen Wörterbuchs und der Vorschriftsda­ tenbasis übersetzt. Wenn eine direkte Übersetzung nicht vorhanden ist, wird eine Übersetzung nicht durchgeführt, wenn die notwendi­ ge Information nicht vorhanden ist. Zu diesem Zeitpunkt kann eine Fehlermeldung dem Benutzer erforderlichenfalls dargestellt wer­ den, die anzeigt, daß eine direkte Übersetzung nicht existiert.
Beim Schritt 316 wird bestimmt, ob das Hinweissymbol in der rich­ tigen Folge der DT-Definition lokalisiert wird. Wenn dies nicht der Fall ist, wird eine Fehlerbehandlungs-Routine bei dem Schritt 318 aufgerufen; dann endet der Prozeß. Als nächstes wird beim Schritt 320 der Hierarchie-Prozessor, welcher in Fig. 13 darge­ stellt ist, zusammen mit der notwendigen Hinweisinformation auf­ gerufen.
In Fig. 13, welche den Hierarchie-Prozessor darstellt, wird beim Schritt 330 festgelegt, wenn eine höhere hierarchische Ebene in dem Dokument zu verarbeiten ist. Wie in Fig. 6 dargestellt, liegt eine höhere hierarchische Ebene näher bei dem oberen Ende der Ab­ bildung. Wenn eine höhere hierarchische Ebene nicht zu übersetzen ist, was bedeutet, daß der Prozeß in der Hierarchie tiefer wei­ tergeht, geht das Ablaufdiagramm auf den Schritt 322 über, wel­ cher (wenn überhaupt) die neue hierarchische Ebene festlegt, wel­ che zu verwenden ist. Als ein Beispiel für den Hinweis <DEVTYPE<, welcher in Zeile 5 von Fig. 2 enthalten ist, zeigt das Hinweissym­ bol an, daß die hierarchische Ebene zu ändern ist, und die Daten "Scanner", welche folgen zeigen an, daß die hierarchische Ebene für den Scanner gilt. Die Schlüsselinformation wird gesucht, um einen dem Scanner entsprechenden Schlüssel zu finden. Sobald der Schlüssel festgelegt ist, werden die Datenstrukturen gesucht, um eine Datenstruktur mit einem entsprechenden Schlüssel zu finden. Ein entsprechender Prozeß wird auch durchgeführt, bei welchem der Hinweis allein die Schlüsselinformation anzeigt, welche zu suchen ist. Es ist möglich, daß das Hinweissymbol nicht anzeigt, daß eine neue hierarchische Ebene vorhanden ist. Anschließend wird der neue Schlüssel oder eine Anzeige, Schlüssel nicht ändern zu­ rückgegeben.
Wenn beim Schritt 320 festgestellt wird, daß die neue Datenstruk­ tur, die für ein Verfolgen von Übersetzungsinformation oder -ressourcen einschließlich Wörterbüchern und Vorschriften verwen­ det worden ist, in der Hierarchie höher liegt, wird beim Schritt 334 mit Hilfe der Hinweis- und Dokumenten-Hierarchie-Information, die Anzahl hierarchischer Ebenen bestimmt, die hinaufzugehen ist. Anschließend wird auf die Anzahl Ebenen zurückgegangen, um in der Hierarchie hinaufzugehen. Es ist auch möglich, daß, wenn auf den Starthinweis getroffen wird, wobei der entsprechend Endhinweis weggelassen ist, das System zuerst die Schritte 330 und 334 durchführt, um in der Hierarchie hinaufzugehen, und dann die Schritte 330 und 332 durchführt, um in der Hierarchie nach unten zu gehen. Der Prozeß in Fig. 12 und 13 endet dann.
Gemäß der Erfindung kann auf einem Universalrechner gearbeitet werden, welche entsprechend den Lehren der Erfindung programmiert ist oder es kann ein anderer Gerätetyp verwendet werden, wie bei­ spielsweise ein spezieller Computer. Ein Computer, der bei der Erfindung verwendbar ist, ist eine Workstation, beispielsweise eine Workstation 348. Die Workstation 348 weist eine Zentralein­ heit (CPU) 350, einen RAM 352, einen ROM 354 zum Speichern von Programminformation und eine Eingabesteuereinheit 356 auf, die mit einem Tastenfeld 358 und einer Maus 360 verbunden ist. Ferner ist ein Printerinterface 364 vorgesehen, welches einen Prin­ ter/Drucker steuert, wie einen Printer, der Videosteuersignale benutzt. Ein Systembus 366 verbindet die verschiedenen Elemente, die in der Workstation 348 enthalten sind. Es gibt eine Disket­ tensteuereinheit 372, die mit einem Diskettenlaufwerk 370 und einem Festplattenlaufwerk 368 verbunden ist. Eine Datenübertra­ gungssteuerung 374 ist mit einem Netz 375 verbunden, welches ein Ethernet-Netz sein kann. Eine Ein/Ausgabe-Steuereinheit 376 ist mit einem Festplattenlaufwerk 380, wie beispielsweise einem ex­ ternen Festplattenlaufwerk, über einen SCSI-Bus verbunden. Ebenso ist mit der Ein-/Ausgabe-Steuereinheit 376 ein Printer/Drucker 378 verbunden, welcher über eine RS-232-Verbindung oder als Al­ ternative hierzu durch einen Parallelanschluß angeschlossen ist. Die Workstation enthält auch eine Display-Steuereinheit 382, wel­ che mit einer Kathodenstrahlröhre (CRT) 384 oder einer anderen Anzeigevorrichtung verbunden ist.
In Fig. 15 sind die Software-Komponenten dargestellt, die bei der Erfindung benutzt werden. Ein Systemsteuermodul 402 wird verwen­ det, um den Betrieb und die Verbindung jeder der Software-Kompo­ nenten zu steuern. Ein SGML-Parser wird verwendet, um das Origi­ naldokument zu bestimmen. Zusätzlich zu dem SGML-Parser 404 ist auch ein Originalsprachen-Parser/Syntax-Analysierer 422 und ein Zielsprachen-Parser/Syntax-Analysierer 418 vorgesehen. Ein Wör­ terbuch-Manager verwaltet eine Vielzahl von Wörterbüchern, die gemäß der Erfindung verwendet werden und dementsprechend verwal­ tet ein Übersetzungsvorschriften-Manager die verschiedenen Über­ setzungsvorschriften-Datenbasen, die von der Erfindung benutzt werden. Das Management, das von diesen Managern durchgeführt wird, schließt auch ein Überwachen der Zuordnung zwischen Syntax und Semantik ein, die der DT-Definition zugeordnet ist. Ein Voka­ bular-Ersteller 408 erstellt das Vokabular von Wortpaaren aus den Original- und Zielsprachen. Der Zielsprachenteil dieses Paars kann eine verknüpfte Liste sein, um eine Vielzahl Worte zu behan­ deln, die einem einzigen Originalwort zugeordnet sind. Jedes Wör­ terbuch kann entsprechend aufgebaut werden, um einen Zeiger zu den Paaren zu enthalten, da verschiedene Wörterbücher dieselben Wörter gemeinsam nutzen. Der Ersteller 410 der Wörterbuchauswahl­ vorschrift und der Ersteller 420 der Sprachenübersetzungsvor­ schrift schaffen die Regeln, die verwendet werden, um die Über­ setzungen entsprechend den hier beschriebenenprozessen durchzu­ führen. Ein Eingabemanager 412 und ein Display-Manager 414 verar­ beiten die jeweiligen Wechselwirkungen mit einem Benutzer.
Fig. 16 veranschaulicht ein anderes Datenablaufdiagramm der Erfin­ dung, das während des automatischen Übersetzungsprozesses verwen­ det wird. In diesem Diagramm liest der SGML-Prozessor 456 das Originaldokument 454 zusammen mit der DT-Definition 452 und er­ zeugt eine Dokumentenhierarchie-Information 458 und trennt die Hinweise 460 und die Daten 462 des Originaldokuments 454. Ein Ge­ bietsabbildungsprozeß 464 liest die Hinweise und Daten und er­ zeugt einen Gegenstandsbereich 466. Das Gegenstandsgebiet zeigt beispielsweise an, ob die Gegenstandssache des zu übersetzenden Dokuments für einen Scanner, einen Printer/Drucker oder ein tech­ nisches Dokument für ein Benutzerhandbuch oder andere Gegen­ standsgebiete ist. Die Gebiete können auch erforderlichenfalls schmaler sein. Der Übersetzungs-Vorschriften-Manager 468 benutzt die Dokumentenhierarchie-Information 458, die Hinweise 460, den Gegenstandsbereich 466 und die Daten 462, um eine Auswahlvor­ schrift(n) 472 zu erzeugen, welche das spezifische Wörterbuch und Übersetzungsvorschriften anzeigt, welche zu benutzen sind. Ein Auswahlprozeß 476 erhält die Auswahlvorschrift 472 und wählt die entsprechende Wörterbuchinformation und die Übersetzungsvor­ schriftinformation von der Wörterbuchdatenbasis 470 und der Über­ setzungsvorschriften-Datenbasis 474 aus, um die Wörterbuch- und Übersetzungsvorschriften zu erzeugen (oder zu kopieren oder zu benutzen), welche von dem Übersetzer 480 benutzt werden. Der Übersetzer 480 liest die Hinweise 460 des Dokuments, die Daten 462 des Dokuments und die Wörterbuch- und Übersetzungsvorschrif­ ten 478, welche ausgewählt worden sind, um das übersetzte Dokument 482 entsprechend dem erfindungsgemäßen Prozeß zu erzeu­ gen.
Nachdem die Erfindung richtig trainiert ist und arbeitet, um den Übersetzungsvorgang durchzuführen, kann das eingegebene Original­ sprachen-Dokument mit Hilfe der Wörterbuch-Datenbasis und der Übersetzungssvorschriften analysiert werden, so daß unklare Ein­ gaben in Zweifel gezogen werden. Wenn beispielsweise das automa­ tische Übersetzungssystem Schwierigkeiten beim Übersetzen eines Dokumentes hat, kann eine Nachricht dargestellt werden, die an­ zeigt, daß das Originalsprachen-Dokument einige Fehler haben kann. Es gibt viele Japaner, die japanische Sprachdokumente er­ zeugen, die schwierig zu übersetzen sind. Ein Grund für diese Schwierigkeit liegt darin, daß die japanische Bedeutung selbst nicht klar ist. Wenn die Bedeutung in der Originalsprache nicht klar ist, ist es schwierig oder unmöglich, ein Gerät zu benutzen, um eine klare Übersetzung zu schaffen. Durch Analysieren des ein­ gegebenen Dokuments kann der Urheber des Dokuments oder eine an­ dere Person von dem Problem informiert werden und/oder er(sie) kann gefordert werden, daß Ursprungsdokument deutlicher zu ma­ chen.
Die Erfindung kann bequem mit Hilfe eines herkömmlichen digitalen Universalrechners oder Mikroprozessors durchgeführt werden, der entsprechend den Lehren der vorliegenden Beschreibung program­ miert ist, was für den Fachmann auf dem Gebiet der Computertech­ nik offensichtlich ist. Ein entsprechendes Software-Codieren kann ohne weiteres von versierten Programmierern auf der Basis der Lehre der vorstehenden Beschreibung aufbereitet werden. Die Er­ findung kann auch durch das Aufbereiten von anwendungsspezifi­ schen integrierten Schaltungen oder durch Anschließen an ein ent­ sprechendes Netz aus herkömmlichen Komponentenschaltungen ausge­ führt werden.
Die Erfindung ist beschrieben worden, indem Hinweise bzw. Hin­ weissymbole verwendet werden, um die verschiedenen Abschnitte des Dokuments anzuzeigen, welche verschiedene Übersetzungsressourcen benutzen. Wenn jedoch die Computerleistungen stärker werden und die Software komplexer wird, ist es möglich, statt Hinweise zu ver­ wenden, um verschiedene Abschnitte eines Dokuments zu markieren, daß die verschiedenen Abschnitte von Dokumenten oder verschiedene Dokumententypen automatisch basierend auf einem darin enthaltenen Inhalt festgelegt werden. Beispielsweise können Worte oder Rede­ wendungen, die in dem Dokument enthalten sind, analysiert werden, um einen Abschnittstyp zu bestimmen, welcher in dem Quellendoku­ ment enthalten ist. Die Erfindung enthält ein Computerprogramm­ produkt, welches ein Speichermedium einschließlich Befehlen ist, die verwendet werden können, um einen Computer zu programmieren, um einen Prozeß gemäß der Erfindung durchzuführen. Das Speicher­ medium kann, ohne hierauf beschränkt zu sein, einen Diskettentyp einschließlich Floppy Disk, Bildplatten, CD-ROMs und magneto-op­ tische Platten, ROMs, RAMs, EPROMs, EEPROMs, magnetische oder op­ tische Karten oder jede Art von Medium sein, das geeignet ist, elektronische Befehle zu speichern.

Claims (29)

1. Verfahren zum Übersetzen eines Dokuments aus einer ersten Sprache in eine zweite Sprache, welches die Schritte aufweist:
Eingeben eines Dokuments, welches in einer ersten Sprache abge­ faßt ist;
Analysieren von Information, die in dem Dokument enthalten ist und Erzeugen eines Analyseergebnisses;
Auswählen einer Übersetzungsressource entsprechend dem Analyseer­ gebnis, welche zum Übersetzen des Dokuments verwendet wird, und
Übersetzen des Dokuments aus der ersten Sprache in eine zweite Sprache mit Hilfe der Übersetzungsressource, welche ausgewählt worden ist.
2. Verfahren nach Anspruch 1, bei welchem
der Schritt Auswählen der Übersetzungsressource ein Auswählen ei­ ner ersten Übersetzungsressource für einen ersten Teil eines Do­ kuments und ein Auswählen einer zweiten Übersetzungsressource für einen zweiten Teil des Dokuments einschließt, und
der Schritt Übersetzen ein Übersetzen des ersten Teils des Doku­ ments mit Hilfe der ersten Übersetzungsressource und Übersetzen des zweiten Teils des Dokuments mit Hilfe der zweiten Überset­ zungsressource einschließt.
3. Verfahren nach Anspruch 1, bei welchem der Schritt Analysieren ein Analysieren einer strukturellen In­ formation einschließt, die in dem Dokument enthalten ist.
4. Verfahren nach Anspruch 1, bei welchem der Schritt Analysieren ein Analysieren von Hinweisen umfaßt, die in dem Dokument enthalten sind.
5. Verfahren nach Anspruch 4, bei welchem der Schritt Analysieren ein Analysieren von SGML-Hinweisen einschließt, die in dem Dokument enthalten sind.
6. Verfahren nach Anspruch 1, bei welchem der Schritt, Auswählen der Übersetzungsressource, ein Auswählen einer Wörterbuchinforma­ tion umfaßt, welche zum Übersetzen des Dokuments verwendet wird.
7. Verfahren nach Anspruch 1, bei welchem der Schritt, Auswählen der Übersetzungsressource, ein Auswählen einer Vorschrifteninfor­ mation umfaßt, welche zum Übersetzen des Dokuments verwendet wird.
8. Verfahren nach Anspruch 1, bei welchem der Schritt, Auswählen der Übersetzungsressource, ein Auswählen einer Wörterbuchsinfor­ mation und einer Vorschrifteninformation einschließt, welche zum Übersetzen des Dokuments verwendet werden.
9. Verfahren nach Anspruch 1, bei welchem der Schritt Auswählen ein Auswählen einer Datenstruktur umfaßt, welche eine Stelle der Übersetzungsressource festlegt, die zum Übersetzen des Dokuments verwendet worden ist.
10. Verfahren nach Anspruch 1, bei welchem der Schritt Analysie­ ren ein Analyseergebnis schafft, das einen Schlüssel einschließt, welcher die Datenstruktur anzeigt, welche eine Stelle der Über­ setzungsressource festlegt, die zum Übersetzen verwendet wird, und der Schritt Auswählen ein Auswählen der Datenstruktur umfaßt, welche den Schlüssel enthält, welcher eine Stelle der Überset­ zungsressourcen festlegt, die zum Übersetzen des Dokuments ver­ wendet worden ist.
11. Verfahren nach Anspruch 1, bei welchem ein Abschnitt des Do­ kuments, welcher in der ersten Sprache abgefaßt ist, und ein ent­ sprechender Abschnitt des Dokuments, welcher in die zweite Spra­ che übersetzt worden ist, gleichzeitig dargestellt werden.
12. Verfahren nach Anspruch 1, bei welchem der Abschnitt des Do­ kuments, welcher in die zweite Sprache übersetzt worden ist, nach dem Darstellen geändert wird.
13. System zum Übersetzen eines Dokuments von einer ersten Spra­ che in eine zweite Sprache mit
einer Einrichtung zum Analysieren von Information, die in dem Dokument enthalten ist, und zum Erzeugen eines Analyseergebnis­ ses;
einer Einrichtung zum Auswählen einer Übersetzungsressource ent­ sprechend dem Analyseergebnis, welches zum Übersetzen des Doku­ ments verwendet wird, und
eine Einrichtung zum Übersetzen des Dokuments von der ersten Sprache in eine zweite Sprache mit Hilfe der Übersetzungsressour­ ce, welche ausgewählt worden ist.
14. System nach Anspruch 13, bei welchem die Einrichtung zum Aus­ wählen der Übersetzungsressource eine Einrichtung zum Auswählen einer ersten Übersetzungsressource für einen ersten Teil eines Dokuments und eine Einrichtung zum Auswählen einer zweiten Über­ setzungsressource für einen zweiten Teil des Dokuments aufweist, und die Einrichtung zum Übersetzen eine Einrichtung zum Übersetzen des ersten Teils des Dokuments mit Hilfe der ersten Übersetzungs­ ressource und eine Einrichtung zum Übesetzen des zweiten Teils der Einrichtung mit Hilfe der zweiten Übersetzungsressource auf­ weist.
15. System nach Anspruch 13, bei welchem die Analyseeinrichtung eine Einrichtung zum Analysieren einer strukturellen Information aufweist, die in dem Dokument enthalten ist.
16. Einrichtung nach Anspruch 13, bei welchem die Analyseeinrich­ tung eine Einrichtung zum Analysieren von Hinweisen aufweist, die in dem Dokument enthalten sind.
17. System nach Anspruch 16, bei welchem die Analyseeinrichtung eine Einrichtung zum Analysieren von verallgemeinerten Standard- Markiersprachen-(SGML-)Hinweisen aufweist, die in dem Dokument enthalten sind.
18. System nach Anspruch 13, bei welchem die Einrichtung zum Aus­ wählen der Übersetzungsressource eine Einrichtung zum Auswählen einer Wörterbuchinformation aufweist, welche zum Übersetzen des Dokuments verwendet wird.
19. System nach Anspruch 13, bei welchem die Einrichtung zum Aus­ wählen der Übersetzungsressource eine Einrichtung zum Auswählen von Vorschrifteninformation aufweist, welche zum Übersetzen des Dokuments verwendet wird.
20. System nach Anspruch 13, bei welchem die Einrichtung zum Aus­ wählen der Übersetzungsressourcen eine Einrichtung zum Auswählen von Wörterbuchinformation und von Vorschrifteninformation auf­ weist, welche zum Übersetzen des Dokuments verwendet werden.
21. System nach Anspruch 13, bei welchem die Auswähleinrichtung eine Einrichtung zum Auswählen einer Datenstruktur aufweist, wel­ che eine Stelle der Übersetzungsressource festlegt, die zum Über­ setzen des Dokuments verwendet worden ist.
22. System nach Anspruch 13, bei welchem die Analyseeinrichtung ein Analyseergebnis erzeugt, welches einen Schlüssel enthält, welches die Datenstruktur anzeigt, welche eine Stelle der Übersetzungsressource festlegt, die zum Übersetzen verwendet wor­ den ist, und die Auswähleinrichtung eine Einrichtung zum Auswählen der Daten­ struktur aufweist, welche den Schlüssel enthält, welcher eine Stelle der Übersetzungsressource festlegt, die zum Übersetzen des Dokuments verwendet worden ist.
23. System nach Anspruch 13, mit einer Einrichtung, um gleichzei­ tig einen Abschnitt des Dokuments, welches in der ersten Sprache abgefaßt ist, und einen entsprechenden Abschnitt des Dokuments gleichzeitig darzustellen, welches in die zweite Sprache über­ setzt worden ist.
24. System nach Anspruch 23, mit einer Einrichtung zum Ändern des Abschnitts des Dokuments, welches in die zweite Sprache übersetzt worden ist.
25. Computer-Programm-Produkt mit einem computerlesbaren Medium mit einer darauf aufgezeichneten Computerprogrammlogik, um ein Dokument von einer ersten Sprache in eine zweite Sprache zu über­ setzen, mit
einer Einrichtung zum Analysieren von Information, die in dem Dokument enthalten ist, und zum Erzeugen eines Analyseergebnis­ ses;
einer Einrichtung zum Auswählen einer Übersetzungsressource ent­ sprechend dem Analyseergebnis, welches zum Übersetzen des Doku­ ments verwendet wird, und
einer Einrichtung zum Übersetzen des Dokuments von der ersten Sprache in die zweite Sprache mit Hilfe der Übersetzungs­ ressource, welche ausgewählt worden ist.
26. Computer-Programm-Produkt nach Anspruch 25, bei welchem
die Einrichtung zum Auswählen der Übersetzungsressource eine Ein­ richtung zum Auswählen einer ersten Übersetzungsressource für ei­ nen ersten Teil eines Dokuments und eine Einrichtung zum Auswäh­ len einer zweiten Übersetzungsressource für einen zweiten Teil des Dokuments aufweist, und
die Übersetzungseinrichtung eine Einrichtung zum Übersetzen des ersten Teils des Dokuments mit Hilfe der ersten Übersetzungs­ ressource und eine Einrichtung zum Übersetzung des zweiten Teil des Dokuments mit Hilfe der zweiten Übersetzungsressource auf­ weist.
27. Computer-Programm-Produkt nach Anspruch 25, bei welchem die Analyseeinrichtung eine Einrichtung zum Analysieren einer struk­ turellen Information aufweist, die in dem Dokument enthalten ist.
28. Computer-Programm-Produkt nach Anspruch 25, bei welchem die Analyseeinrichtung eine Einrichtung zum Analysieren von in dem Dokument enthaltenen Hinweisen aufweist.
29. Computer-Programm-Produkt nach Anspruch 28, bei welchem die Analyseeinrichtung eine Einrichtung zum Analysieren von in dem Dokument enthaltenen SGML-Hinweisen aufweist.
DE19709968A 1996-05-28 1997-03-11 Verfahren und System zum Übersetzen eines Dokumentes Expired - Lifetime DE19709968C2 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US08/654,207 US5848386A (en) 1996-05-28 1996-05-28 Method and system for translating documents using different translation resources for different portions of the documents

Publications (2)

Publication Number Publication Date
DE19709968A1 DE19709968A1 (de) 1997-12-04
DE19709968C2 true DE19709968C2 (de) 2003-04-30

Family

ID=24623898

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19709968A Expired - Lifetime DE19709968C2 (de) 1996-05-28 1997-03-11 Verfahren und System zum Übersetzen eines Dokumentes

Country Status (3)

Country Link
US (2) US5848386A (de)
JP (2) JP3905179B2 (de)
DE (1) DE19709968C2 (de)

Families Citing this family (339)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7131070B1 (en) 1999-05-13 2006-10-31 Ricoh Company, Ltd. Application unit monitoring and reporting system and method
US5819110A (en) * 1995-06-05 1998-10-06 Ricoh Company, Ltd. System for determining whether connection or connectionless modes of communication should be used to transmit information between devices in accordance with priorities of events
US5818603A (en) 1996-03-29 1998-10-06 Ricoh Company, Ltd. Method and system for controlling and communicating with machines using multiple communication formats
US20020004812A1 (en) * 1997-06-26 2002-01-10 Tetsuro Motoyama Method and system for diagnosis and control of machines using connectionless modes having delivery monitoring and an alternate communication mode
US6044205A (en) * 1996-02-29 2000-03-28 Intermind Corporation Communications system for transferring information between memories according to processes transferred with the information
US6700958B2 (en) * 1995-04-10 2004-03-02 Starguide Digital Networks, Inc. Method and apparatus for transmitting coded audio signals through a transmission channel with limited bandwidth
US7185080B1 (en) 1995-06-05 2007-02-27 Ricoh Company, Ltd. Method and system for diagnosis and control of machines using connection and connectionless modes of communication
BR9610270A (pt) * 1995-08-16 1999-07-06 Starguide Digital Networks Inc Alocação dinâmica de largura de faixa para transmissão de sinais de audio e um sinal de vídeo
EP0847638A4 (de) * 1995-09-01 2002-08-21 Starguide Digital Networks Inc Vorrichtung zur erzeugung und verteilung einer audio-datei
US6073143A (en) * 1995-10-20 2000-06-06 Sanyo Electric Co., Ltd. Document conversion system including data monitoring means that adds tag information to hyperlink information and translates a document when such tag information is included in a document retrieval request
US6546406B1 (en) * 1995-11-03 2003-04-08 Enigma Information Systems Ltd. Client-server computer system for large document retrieval on networked computer system
US6470306B1 (en) * 1996-04-23 2002-10-22 Logovista Corporation Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens
US5848386A (en) * 1996-05-28 1998-12-08 Ricoh Company, Ltd. Method and system for translating documents using different translation resources for different portions of the documents
US6061697A (en) * 1996-09-11 2000-05-09 Fujitsu Limited SGML type document managing apparatus and managing method
CA2268303A1 (en) * 1996-10-09 1998-04-16 Starguide Digital Networks Aggregate information production and display system
JPH10198680A (ja) * 1997-01-07 1998-07-31 Hitachi Ltd 分散辞書管理方法及びそれを用いた機械翻訳方法
IL121071A0 (en) * 1997-03-27 1997-11-20 El Mar Software Ltd Automatic conversion server
IL121457A (en) * 1997-08-03 2004-06-01 Guru Internat Inc Computerized dictionary and thesaurus applications
US6154754A (en) * 1997-09-25 2000-11-28 Siemens Corporate Research, Inc. Automatic synthesis of semantic information from multimedia documents
US5960080A (en) * 1997-11-07 1999-09-28 Justsystem Pittsburgh Research Center Method for transforming message containing sensitive information
US6161082A (en) * 1997-11-18 2000-12-12 At&T Corp Network based language translation system
US6321244B1 (en) * 1997-12-04 2001-11-20 Siemens Corporate Research, Inc. Style specifications for systematically creating card-based hypermedia manuals
JPH11175527A (ja) * 1997-12-15 1999-07-02 Fujitsu Ltd 出力制御装置及び出力制御方法
US6009436A (en) * 1997-12-23 1999-12-28 Ricoh Company, Ltd. Method and apparatus for mapping structured information to different structured information
US8489980B2 (en) * 1998-02-23 2013-07-16 Transperfect Global, Inc. Translation management system
US10541973B2 (en) * 1998-02-23 2020-01-21 Transperfect Global, Inc. Service of cached translated content in a requested language
US6526426B1 (en) * 1998-02-23 2003-02-25 David Lakritz Translation management system
US7194757B1 (en) 1998-03-06 2007-03-20 Starguide Digital Network, Inc. Method and apparatus for push and pull distribution of multimedia
US8284774B2 (en) 1998-04-03 2012-10-09 Megawave Audio Llc Ethernet digital storage (EDS) card and satellite transmission system
US6160797A (en) 1998-04-03 2000-12-12 Starguide Digital Networks, Inc. Satellite receiver/router, system, and method of use
US7191393B1 (en) * 1998-09-25 2007-03-13 International Business Machines Corporation Interface for providing different-language versions of markup-language resources
US7281203B2 (en) * 1998-09-29 2007-10-09 Netscape Communications Corporation Selecting a DTD for transforming malformed layout expressions into wellformed ones
US6336214B1 (en) * 1998-11-10 2002-01-01 International Business Machines Corporation System and method for automatically generating browsable language grammars
US7376728B1 (en) * 2000-07-25 2008-05-20 Ricoh Company, Ltd. Method and system for monitoring, collecting information, diagnosing and servicing a remote system
US6964011B1 (en) * 1998-11-26 2005-11-08 Canon Kabushiki Kaisha Document type definition generating method and apparatus, and storage medium for storing program
US6535842B1 (en) * 1998-12-10 2003-03-18 Global Information Research And Technologies, Llc Automatic bilingual translation memory system
US6363337B1 (en) * 1999-01-19 2002-03-26 Universal Ad Ltd. Translation of data according to a template
US6480860B1 (en) * 1999-02-11 2002-11-12 International Business Machines Corporation Tagged markup language interface with document type definition to access data in object oriented database
US7287219B1 (en) 1999-03-11 2007-10-23 Abode Systems Incorporated Method of constructing a document type definition from a set of structured electronic documents
EP2336899A3 (de) * 1999-03-19 2014-11-26 Trados GmbH System zum Verwalten von Arbeitsabläufen
US6986101B2 (en) * 1999-05-06 2006-01-10 International Business Machines Corporation Method and apparatus for converting programs and source code files written in a programming language to equivalent markup language files
US6490548B1 (en) 1999-05-14 2002-12-03 Paterra, Inc. Multilingual electronic transfer dictionary containing topical codes and method of use
WO2000077609A1 (en) 1999-06-14 2000-12-21 The Thomson Corporation System for converting data to a markup language
US6901361B1 (en) * 1999-07-09 2005-05-31 Digital Esperanto, Inc. Computerized translator of languages utilizing indexed databases of corresponding information elements
US6993476B1 (en) * 1999-08-26 2006-01-31 International Business Machines Corporation System and method for incorporating semantic characteristics into the format-driven syntactic document transcoding framework
US6598015B1 (en) * 1999-09-10 2003-07-22 Rws Group, Llc Context based computer-assisted language translation
US7533344B1 (en) 1999-09-10 2009-05-12 Ricoh Company, Ltd. Application unit monitoring and reporting system and method
US20060116865A1 (en) 1999-09-17 2006-06-01 Www.Uniscape.Com E-services translation utilizing machine translation and translation memory
US7120863B1 (en) 1999-11-15 2006-10-10 International Business Machines Corporation Method, system, and program for interfacing with elements in a document
US6662225B1 (en) * 1999-11-16 2003-12-09 Ricoh Company, Ltd. Remote system usage monitoring with flexible packaging of data
US7743133B1 (en) 1999-11-16 2010-06-22 Ricoh Company, Ltd. Remote system usage monitoring with flexible encoding and decoding objects
US6948175B1 (en) 1999-11-16 2005-09-20 Ricoh Company, Ltd. Method and system of remote diagnostic, control and information collection using a dynamic linked library
US7054952B1 (en) * 1999-12-09 2006-05-30 International Business Machines Corp. Electronic document delivery system employing distributed document object model (DOM) based transcoding and providing interactive javascript support
JP2001195115A (ja) 2000-01-06 2001-07-19 Canon Inc 工数自動設定システム、工数自動設定方法、分散型クライアントサーバシステム及びコンピュータプログラムの記憶媒体
JP2001195462A (ja) * 2000-01-06 2001-07-19 Canon Inc 組立情報管理システムと組立情報管理のためのクライアントサーバ型分散システム
JP2001256333A (ja) * 2000-01-06 2001-09-21 Canon Inc 作業割付システム、作業割付方法、分散型クライアントサーバシステム及びコンピュータプログラム記憶媒体
JP2001195463A (ja) * 2000-01-06 2001-07-19 Canon Inc 作業標準作成システム、作業標準作成方法、分散型クライアントサーバシステム及びコンピュータプログラムの記憶媒体
US6915342B1 (en) 2000-02-04 2005-07-05 Ricoh Company Limited Method and system for maintaining the business office appliance through log files
US6915337B1 (en) 2000-03-07 2005-07-05 Ricoh Co. Ltd. Method and system for updating the device driver of a business office appliance
US8645137B2 (en) 2000-03-16 2014-02-04 Apple Inc. Fast, language-independent method for user authentication by voice
EP1139231A1 (de) * 2000-03-31 2001-10-04 Fujitsu Limited Anordnung und Verfahren zur Dokumentbearbeitung
US6785711B1 (en) 2000-04-04 2004-08-31 Ricoh Co., Ltd. Method and system for displaying various messages while performing tasks or while idling
JP4028154B2 (ja) 2000-04-07 2007-12-26 富士通株式会社 磁気記録媒体及び磁気記憶装置
US7120674B1 (en) 2000-05-17 2006-10-10 Ricoh Company, Ltd. Method and system of remote diagnostic, control and information collection using a dynamic linked library of multiple formats and multiple protocols with intelligent protocol processor
US6988141B1 (en) 2000-05-17 2006-01-17 Ricoh Company, Ltd. Method and system of remote diagnostic, control and information collection using a dynamic linked library of multiple formats and multiple protocols with restriction on protocol
US7287085B1 (en) 2000-05-17 2007-10-23 Ricoh Company, Ltd. Method and system of remote diagnostic, control and information collection using a dynamic linked library of multiple formats and multiple protocols with intelligent formatter
FR2809509B1 (fr) * 2000-05-26 2003-09-12 Bull Sa Systeme et procede d'internationalisation du contenu de documents a balises dans un systeme informatique
US6519557B1 (en) * 2000-06-06 2003-02-11 International Business Machines Corporation Software and method for recognizing similarity of documents written in different languages based on a quantitative measure of similarity
WO2002021413A2 (en) * 2000-09-05 2002-03-14 Zaplet, Inc. Methods and apparatus providing electronic messages that are linked and aggregated
US20040205671A1 (en) * 2000-09-13 2004-10-14 Tatsuya Sukehiro Natural-language processing system
US6857016B1 (en) 2000-09-25 2005-02-15 Ricoh Company Limited Method and system of data collection and mapping from a remote position reporting device
US20020083103A1 (en) * 2000-10-02 2002-06-27 Ballance Chanin M. Machine editing system incorporating dynamic rules database
US6782384B2 (en) 2000-10-04 2004-08-24 Idiom Merger Sub, Inc. Method of and system for splitting and/or merging content to facilitate content processing
WO2002029621A1 (en) * 2000-10-04 2002-04-11 Idiom Technologies, Incorporated Method of and system for splitting and/or merging content to facilitate content processing
US7669051B2 (en) * 2000-11-13 2010-02-23 DigitalDoors, Inc. Data security system and method with multiple independent levels of security
US9311499B2 (en) * 2000-11-13 2016-04-12 Ron M. Redlich Data security system and with territorial, geographic and triggering event protocol
WO2002069073A2 (en) * 2000-11-13 2002-09-06 Starguide Digital Networks, Inc. Ethernet digital storage (eds) card and satellite transmission system including faxing capability
WO2002046878A2 (en) * 2000-12-06 2002-06-13 American Express Travel Related Services Company, Inc. Layout generator system and method
DE50111786D1 (de) * 2000-12-15 2007-02-15 Siemens Ag Verschlüsselung von Steuerungsprogrammen
US20020099745A1 (en) * 2001-01-23 2002-07-25 Neo-Core, L.L.C. Method and system for storing a flattened structured data document
US20020103632A1 (en) * 2001-01-31 2002-08-01 International Business Machines Corporation Method, program, and tool for updating the national language versions of documents
US7392307B2 (en) * 2001-02-14 2008-06-24 Ricoh Co., Ltd. Method and system of remote diagnostic, control and information collection using a shared resource
US7533333B2 (en) 2001-02-14 2009-05-12 Ricoh Co., Ltd. Object-oriented method and system of remote diagnostic, control and information collection using multiple formats and multiple protocols
US7171670B2 (en) 2001-02-14 2007-01-30 Ricoh Co., Ltd. Method and system of remote diagnostic, control and information collection using multiple formats and multiple protocols with verification of formats and protocols
US7047293B2 (en) * 2001-02-14 2006-05-16 Ricoh Co., Ltd. Method and system of remote diagnostic, control and information collection using multiple formats and multiple protocols with delegating protocol processor
AUPR329501A0 (en) * 2001-02-22 2001-03-22 Worldlingo, Inc Translation information segment
US7860706B2 (en) * 2001-03-16 2010-12-28 Eli Abir Knowledge system method and appparatus
JP3475186B2 (ja) * 2001-03-21 2003-12-08 株式会社ニチベイ ブラインド、ブラインド用スラット、その製造方法及びその成形加工機
WO2002082289A1 (en) * 2001-04-06 2002-10-17 Agea Corporation Mobile presentation system
US20020147749A1 (en) * 2001-04-06 2002-10-10 Ortiz C. Enrique Mobile presentation system
US20030023584A1 (en) * 2001-04-27 2003-01-30 Brandin Christopher Lockton Universal information base system
JP2003022125A (ja) * 2001-05-02 2003-01-24 Ricoh Co Ltd 機器の定期診断装置及び機器の定期診断方法ならびに定期診断される顧客に配置された機器
US6993474B2 (en) * 2001-05-17 2006-01-31 Curry David G Interactive conversational speech communicator method and system
US20030004703A1 (en) * 2001-06-28 2003-01-02 Arvind Prabhakar Method and system for localizing a markup language document
US7016963B1 (en) 2001-06-29 2006-03-21 Glow Designs, Llc Content management and transformation system for digital content
US8214196B2 (en) 2001-07-03 2012-07-03 University Of Southern California Syntax-based statistical translation model
US7100108B2 (en) * 2001-08-31 2006-08-29 International Business Machines Corporation Software program utility that isolates translatable english text from machine code and merges the text into one file for review purposes
US7490146B1 (en) 2001-09-17 2009-02-10 Ricoh Company, Ltd. System, method, and computer program product for collecting and sending various types of information to a monitor using e-mail
US7302469B2 (en) * 2001-09-17 2007-11-27 Ricoh Company, Ltd. System, method, and computer program product for transferring remote device support data to a monitor using e-mail
US7536450B2 (en) * 2001-09-17 2009-05-19 Ricoh Company, Ltd. System, method, and computer program product for sending remote device configuration information to a monitor using e-mail
JP2003091344A (ja) * 2001-09-19 2003-03-28 Sony Corp 情報処理装置および情報処理方法、記録媒体、データ構造、並びにプログラム
JP3452558B2 (ja) * 2001-09-25 2003-09-29 インターナショナル・ビジネス・マシーンズ・コーポレーション 翻訳対象のリソースと分野別辞書を関連付けるための方法、システムおよびプログラム
US8438004B2 (en) * 2001-10-03 2013-05-07 Hewlett-Packard Development Company L.P. System and methods for language translation printing
US7343407B2 (en) * 2001-10-15 2008-03-11 Ricoh Company, Ltd. Method and system of remote monitoring and support of devices, including handling Email messages having message types specified within the Email message
US6839717B1 (en) 2001-10-15 2005-01-04 Ricoh Company, Ltd. Method and system of remote monitoring and support of devices, extracting data from different types of email messages, and storing data according to data structures determined by the message types
US6925571B1 (en) 2001-10-15 2005-08-02 Ricoh Company, Ltd. Method and system of remote monitoring and support of devices, using POP3 and decryption using virtual function
US20030101046A1 (en) * 2001-11-28 2003-05-29 Mark Krasnov Word, expression, and sentence translation management tool
US20030105621A1 (en) * 2001-12-04 2003-06-05 Philippe Mercier Method for computer-assisted translation
US20030131316A1 (en) * 2002-01-07 2003-07-10 Kyle Brown Internationalizing SGML documents
WO2004001623A2 (en) 2002-03-26 2003-12-31 University Of Southern California Constructing a translation lexicon from comparable, non-parallel corpora
US20030212962A1 (en) * 2002-05-08 2003-11-13 Amikai, Inc. Thin client-server architecture for automated machine translation
US7209915B1 (en) 2002-06-28 2007-04-24 Microsoft Corporation Method, system and apparatus for routing a query to one or more providers
US7185271B2 (en) * 2002-08-20 2007-02-27 Hewlett-Packard Development Company, L.P. Methods and systems for implementing auto-complete in a web page
US7113960B2 (en) * 2002-08-22 2006-09-26 International Business Machines Corporation Search on and search for functions in applications with varying data types
US20040078762A1 (en) * 2002-10-17 2004-04-22 Taiwan Semiconductor Manufacturing Co., Ltd. Multi-lingual information server apparatus and method for operation thereof
EP1574967A4 (de) * 2002-12-18 2009-05-27 Ricoh Kk Übersetzungshilfssystem und programm dafür
US7428699B1 (en) 2003-01-15 2008-09-23 Adobe Systems Incorporated Configurable representation of structured data
FR2850473A1 (fr) * 2003-01-28 2004-07-30 France Telecom Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web
US8170863B2 (en) * 2003-04-01 2012-05-01 International Business Machines Corporation System, method and program product for portlet-based translation of web content
US20040230898A1 (en) * 2003-05-13 2004-11-18 International Business Machines Corporation Identifying topics in structured documents for machine translation
US7558841B2 (en) * 2003-05-14 2009-07-07 Microsoft Corporation Method, system, and computer-readable medium for communicating results to a data query in a computer network
JP3765798B2 (ja) * 2003-05-27 2006-04-12 沖電気工業株式会社 文書対応関係検査装置、翻訳処理装置、文書対応関係検査方法、翻訳処理方法、および文書対応関係検査プログラム
US20040243391A1 (en) * 2003-05-28 2004-12-02 Nelson David D. Apparatus, system, and method for multilingual regulation management
US20100070265A1 (en) * 2003-05-28 2010-03-18 Nelson David D Apparatus, system, and method for multilingual regulation management
JP2004362249A (ja) * 2003-06-04 2004-12-24 Advanced Telecommunication Research Institute International 翻訳知識最適化装置、翻訳知識最適化のためのコンピュータプログラム、コンピュータ及び記憶媒体
US8548794B2 (en) 2003-07-02 2013-10-01 University Of Southern California Statistical noun phrase translation
US7657832B1 (en) 2003-09-18 2010-02-02 Adobe Systems Incorporated Correcting validation errors in structured documents
US7983896B2 (en) 2004-03-05 2011-07-19 SDL Language Technology In-context exact (ICE) matching
US8296127B2 (en) 2004-03-23 2012-10-23 University Of Southern California Discovery of parallel text portions in comparable collections of corpora and training using comparable texts
US8666725B2 (en) 2004-04-16 2014-03-04 University Of Southern California Selection and use of nonstatistical translation components in a statistical machine translation framework
US7853473B2 (en) 2004-08-31 2010-12-14 Revionics, Inc. Market-based price optimization system
JP5452868B2 (ja) 2004-10-12 2014-03-26 ユニヴァーシティー オブ サザン カリフォルニア トレーニングおよび復号のためにストリングからツリーへの変換を使うテキスト‐テキスト・アプリケーションのためのトレーニング
US7680646B2 (en) * 2004-12-21 2010-03-16 Xerox Corporation Retrieval method for translation memories containing highly structured documents
US7818666B2 (en) 2005-01-27 2010-10-19 Symyx Solutions, Inc. Parsing, evaluating leaf, and branch nodes, and navigating the nodes based on the evaluation
JP2006276915A (ja) * 2005-03-25 2006-10-12 Fuji Xerox Co Ltd 翻訳処理方法、文書翻訳装置およびプログラム
JP4311365B2 (ja) * 2005-03-25 2009-08-12 富士ゼロックス株式会社 文書処理装置およびプログラム
JP2006277103A (ja) * 2005-03-28 2006-10-12 Fuji Xerox Co Ltd 文書翻訳方法および文書翻訳装置
US9245032B2 (en) * 2005-06-02 2016-01-26 Oracle International Corporation Globalization framework for providing locale-specific services using client-side scripting languages
US8886517B2 (en) 2005-06-17 2014-11-11 Language Weaver, Inc. Trust scoring for language translation systems
US8676563B2 (en) 2009-10-01 2014-03-18 Language Weaver, Inc. Providing human-generated and machine-generated trusted translations
US20070010989A1 (en) * 2005-07-07 2007-01-11 International Business Machines Corporation Decoding procedure for statistical machine translation
US20070043553A1 (en) * 2005-08-16 2007-02-22 Microsoft Corporation Machine translation models incorporating filtered training data
US8677377B2 (en) 2005-09-08 2014-03-18 Apple Inc. Method and apparatus for building an intelligent automated assistant
US20070067154A1 (en) * 2005-09-22 2007-03-22 International Business Machines Corporation Language translation system
US7992085B2 (en) 2005-09-26 2011-08-02 Microsoft Corporation Lightweight reference user interface
US7788590B2 (en) 2005-09-26 2010-08-31 Microsoft Corporation Lightweight reference user interface
US10319252B2 (en) 2005-11-09 2019-06-11 Sdl Inc. Language capability assessment and training apparatus and techniques
US9411781B2 (en) 2006-01-18 2016-08-09 Adobe Systems Incorporated Rule-based structural expression of text and formatting attributes in documents
EP2511833B1 (de) 2006-02-17 2020-02-05 Google LLC Kodierung und adaptiver, skalierbarer zugang zu verteilten übersetzungsmodellen
US8943080B2 (en) 2006-04-07 2015-01-27 University Of Southern California Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections
WO2007124109A2 (en) * 2006-04-21 2007-11-01 Scomm, Inc. Interactive conversational speech communicator method and system
US7873641B2 (en) * 2006-07-14 2011-01-18 Bea Systems, Inc. Using tags in an enterprise search system
US8886518B1 (en) 2006-08-07 2014-11-11 Language Weaver, Inc. System and method for capitalizing machine translated text
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8521506B2 (en) 2006-09-21 2013-08-27 Sdl Plc Computer-implemented method, computer software and apparatus for use in a translation system
US8433556B2 (en) 2006-11-02 2013-04-30 University Of Southern California Semi-supervised training for statistical word alignment
US9122674B1 (en) * 2006-12-15 2015-09-01 Language Weaver, Inc. Use of annotations in statistical machine translation
JP2008165415A (ja) * 2006-12-27 2008-07-17 Oki Electric Ind Co Ltd 文書処理装置、文書処理方法およびプログラム
US8468149B1 (en) 2007-01-26 2013-06-18 Language Weaver, Inc. Multi-lingual online community
US8615389B1 (en) 2007-03-16 2013-12-24 Language Weaver, Inc. Generation and exploitation of an approximate language model
US8326598B1 (en) * 2007-03-26 2012-12-04 Google Inc. Consensus translations from multiple machine translation systems
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8831928B2 (en) 2007-04-04 2014-09-09 Language Weaver, Inc. Customizable machine translation service
US20080288239A1 (en) * 2007-05-15 2008-11-20 Microsoft Corporation Localization and internationalization of document resources
US9361294B2 (en) * 2007-05-31 2016-06-07 Red Hat, Inc. Publishing tool for translating documents
US8205151B2 (en) * 2007-05-31 2012-06-19 Red Hat, Inc. Syndication of documents in increments
US10296588B2 (en) * 2007-05-31 2019-05-21 Red Hat, Inc. Build of material production system
US8825466B1 (en) 2007-06-08 2014-09-02 Language Weaver, Inc. Modification of annotated bilingual segment pairs in syntax-based machine translation
US20080313291A1 (en) * 2007-06-12 2008-12-18 Smartmicros Usa, Llc Method and apparatus for encoding data
US20090013268A1 (en) * 2007-07-02 2009-01-08 Universal Ad Ltd. Creation Of Visual Composition Of Product Images
JP5105513B2 (ja) * 2007-07-20 2012-12-26 インターナショナル・ビジネス・マシーンズ・コーポレーション 処理対象として適切なテキストを選択する技術
US9418061B2 (en) * 2007-12-14 2016-08-16 International Business Machines Corporation Prioritized incremental asynchronous machine translation of structured documents
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
JP5423398B2 (ja) * 2008-01-10 2014-02-19 日本電気株式会社 機械翻訳装置および機械翻訳方法
US8849665B2 (en) * 2008-01-30 2014-09-30 At&T Intellectual Property I, L.P. System and method of providing machine translation from a source language to a target language
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US10496753B2 (en) 2010-01-18 2019-12-03 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
WO2010067118A1 (en) 2008-12-11 2010-06-17 Novauris Technologies Limited Speech recognition involving a mobile device
DE102009009123A1 (de) 2009-02-16 2010-08-19 Marius Gevers Verfahren und ein System zum Übersetzen eines Textes aus einer ersten Sprache in zumindest eine weitere Sprache sowie ein Computer-Programm-Produkt
GB2468278A (en) 2009-03-02 2010-09-08 Sdl Plc Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation
US9262403B2 (en) 2009-03-02 2016-02-16 Sdl Plc Dynamic generation of auto-suggest dictionary for natural language translation
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US20120311585A1 (en) 2011-06-03 2012-12-06 Apple Inc. Organizing task items that represent tasks to perform
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
US9858925B2 (en) 2009-06-05 2018-01-02 Apple Inc. Using context information to facilitate processing of commands in a virtual assistant
US9431006B2 (en) 2009-07-02 2016-08-30 Apple Inc. Methods and apparatuses for automatic speech recognition
US8990064B2 (en) 2009-07-28 2015-03-24 Language Weaver, Inc. Translating documents based on content
JP4935869B2 (ja) * 2009-08-07 2012-05-23 カシオ計算機株式会社 電子機器及びプログラム
US8380486B2 (en) 2009-10-01 2013-02-19 Language Weaver, Inc. Providing machine-generated translations and corresponding trust levels
US8508787B2 (en) * 2009-11-23 2013-08-13 Xerox Corporation System and method for automatic translation of documents scanned by multifunctional printer machines
WO2011075762A1 (en) * 2009-12-22 2011-06-30 Health Ewords Pty Ltd Method and system for classification of clinical information
US10276170B2 (en) 2010-01-18 2019-04-30 Apple Inc. Intelligent automated assistant
US10553209B2 (en) 2010-01-18 2020-02-04 Apple Inc. Systems and methods for hands-free notification summaries
US10705794B2 (en) 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
US10679605B2 (en) 2010-01-18 2020-06-09 Apple Inc. Hands-free list-reading by intelligent automated assistant
WO2011089450A2 (en) 2010-01-25 2011-07-28 Andrew Peter Nelson Jerram Apparatuses, methods and systems for a digital conversation management platform
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
US10417646B2 (en) 2010-03-09 2019-09-17 Sdl Inc. Predicting the cost associated with translating textual content
US8280954B2 (en) 2010-03-25 2012-10-02 Scomm, Inc. Method and system for providing live real-time communication via text between mobile user devices
WO2011146934A2 (en) 2010-05-21 2011-11-24 Western Standard Publishing Company, Inc. Apparatus, system, and method for computer aided translation
US9002696B2 (en) * 2010-11-30 2015-04-07 International Business Machines Corporation Data security system for natural language translation
US10762293B2 (en) 2010-12-22 2020-09-01 Apple Inc. Using parts-of-speech tagging and named entity recognition for spelling correction
US9128929B2 (en) 2011-01-14 2015-09-08 Sdl Language Technologies Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself
US9262612B2 (en) 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US9760920B2 (en) 2011-03-23 2017-09-12 Audible, Inc. Synchronizing digital content
US8855797B2 (en) 2011-03-23 2014-10-07 Audible, Inc. Managing playback of synchronized content
US8862255B2 (en) 2011-03-23 2014-10-14 Audible, Inc. Managing playback of synchronized content
US9706247B2 (en) 2011-03-23 2017-07-11 Audible, Inc. Synchronized digital content samples
US9703781B2 (en) 2011-03-23 2017-07-11 Audible, Inc. Managing related digital content
US9734153B2 (en) 2011-03-23 2017-08-15 Audible, Inc. Managing related digital content
US8948892B2 (en) 2011-03-23 2015-02-03 Audible, Inc. Managing playback of synchronized content
US11003838B2 (en) 2011-04-18 2021-05-11 Sdl Inc. Systems and methods for monitoring post translation editing
US8538742B2 (en) * 2011-05-20 2013-09-17 Google Inc. Feed translation for a social network
US10057736B2 (en) 2011-06-03 2018-08-21 Apple Inc. Active transport based notifications
US8694303B2 (en) 2011-06-15 2014-04-08 Language Weaver, Inc. Systems and methods for tuning parameters in statistical machine translation
US8706472B2 (en) * 2011-08-11 2014-04-22 Apple Inc. Method for disambiguating multiple readings in language conversion
US8994660B2 (en) 2011-08-29 2015-03-31 Apple Inc. Text correction processing
US8886515B2 (en) 2011-10-19 2014-11-11 Language Weaver, Inc. Systems and methods for enhancing machine translation post edit review processes
US10134385B2 (en) 2012-03-02 2018-11-20 Apple Inc. Systems and methods for name pronunciation
US9483461B2 (en) 2012-03-06 2016-11-01 Apple Inc. Handling speech synthesis of content for multiple languages
US8942973B2 (en) 2012-03-09 2015-01-27 Language Weaver, Inc. Content page URL translation
US9075760B2 (en) 2012-05-07 2015-07-07 Audible, Inc. Narration settings distribution for content customization
US9280610B2 (en) 2012-05-14 2016-03-08 Apple Inc. Crowd sourcing information to fulfill user requests
US10261994B2 (en) 2012-05-25 2019-04-16 Sdl Inc. Method and system for automatic management of reputation of translators
US9317500B2 (en) * 2012-05-30 2016-04-19 Audible, Inc. Synchronizing translated digital content
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9141257B1 (en) 2012-06-18 2015-09-22 Audible, Inc. Selecting and conveying supplemental content
US8972265B1 (en) 2012-06-18 2015-03-03 Audible, Inc. Multiple voices in audio content
US9536439B1 (en) 2012-06-27 2017-01-03 Audible, Inc. Conveying questions with content
US9679608B2 (en) 2012-06-28 2017-06-13 Audible, Inc. Pacing content
US9495129B2 (en) 2012-06-29 2016-11-15 Apple Inc. Device, method, and user interface for voice-activated navigation and browsing of a document
US9099089B2 (en) 2012-08-02 2015-08-04 Audible, Inc. Identifying corresponding regions of content
US9576574B2 (en) 2012-09-10 2017-02-21 Apple Inc. Context-sensitive handling of interruptions by intelligent digital assistant
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9367196B1 (en) 2012-09-26 2016-06-14 Audible, Inc. Conveying branched content
US9632647B1 (en) 2012-10-09 2017-04-25 Audible, Inc. Selecting presentation positions in dynamic content
US9223830B1 (en) 2012-10-26 2015-12-29 Audible, Inc. Content presentation analysis
US9619463B2 (en) 2012-11-14 2017-04-11 International Business Machines Corporation Document decomposition into parts based upon translation complexity for translation assignment and execution
US9152622B2 (en) 2012-11-26 2015-10-06 Language Weaver, Inc. Personalized machine translation via online adaptation
US9280906B2 (en) 2013-02-04 2016-03-08 Audible. Inc. Prompting a user for input during a synchronous presentation of audio content and textual content
US9472113B1 (en) 2013-02-05 2016-10-18 Audible, Inc. Synchronizing playback of digital content with physical content
KR102516577B1 (ko) 2013-02-07 2023-04-03 애플 인크. 디지털 어시스턴트를 위한 음성 트리거
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US9368114B2 (en) 2013-03-14 2016-06-14 Apple Inc. Context-sensitive handling of interruptions
WO2014144949A2 (en) 2013-03-15 2014-09-18 Apple Inc. Training an at least partial voice command system
WO2014144579A1 (en) 2013-03-15 2014-09-18 Apple Inc. System and method for updating an adaptive speech recognition model
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
US9582608B2 (en) 2013-06-07 2017-02-28 Apple Inc. Unified ranking with entropy-weighted information for phrase-based semantic auto-completion
US9317486B1 (en) 2013-06-07 2016-04-19 Audible, Inc. Synchronizing playback of digital content with captured physical content
WO2014197336A1 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for detecting errors in interactions with a voice-based digital assistant
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
EP3008641A1 (de) 2013-06-09 2016-04-20 Apple Inc. Vorrichtung, verfahren und grafische benutzeroberfläche für gesprächspersistenz über zwei oder mehrere instanzen eines digitaler assistenten
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN105265005B (zh) 2013-06-13 2019-09-17 苹果公司 用于由语音命令发起的紧急呼叫的系统和方法
WO2015020942A1 (en) 2013-08-06 2015-02-12 Apple Inc. Auto-activating smart responses based on activities from remote devices
US9489360B2 (en) 2013-09-05 2016-11-08 Audible, Inc. Identifying extra material in companion content
US9213694B2 (en) 2013-10-10 2015-12-15 Language Weaver, Inc. Efficient online domain adaptation
US9514377B2 (en) * 2014-04-29 2016-12-06 Google Inc. Techniques for distributed optical character recognition and distributed machine language translation
US9514376B2 (en) 2014-04-29 2016-12-06 Google Inc. Techniques for distributed optical character recognition and distributed machine language translation
US9620105B2 (en) 2014-05-15 2017-04-11 Apple Inc. Analyzing audio input for efficient speech and music recognition
US10592095B2 (en) 2014-05-23 2020-03-17 Apple Inc. Instantaneous speaking of content on touch devices
US9502031B2 (en) 2014-05-27 2016-11-22 Apple Inc. Method for supporting dynamic grammars in WFST-based ASR
US10289433B2 (en) 2014-05-30 2019-05-14 Apple Inc. Domain specific language for encoding assistant dialog
EP3149728B1 (de) 2014-05-30 2019-01-16 Apple Inc. Eingabeverfahren durch einzelne äusserung mit mehreren befehlen
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9842101B2 (en) 2014-05-30 2017-12-12 Apple Inc. Predictive conversion of language input
US9760559B2 (en) 2014-05-30 2017-09-12 Apple Inc. Predictive text input
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US10078631B2 (en) 2014-05-30 2018-09-18 Apple Inc. Entropy-guided text prediction using combined word and character n-gram language models
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9785630B2 (en) 2014-05-30 2017-10-10 Apple Inc. Text prediction using combined word N-gram and unigram language models
US9734193B2 (en) 2014-05-30 2017-08-15 Apple Inc. Determining domain salience ranking from ambiguous words in natural speech
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
US10659851B2 (en) 2014-06-30 2020-05-19 Apple Inc. Real-time digital assistant knowledge updates
US10446141B2 (en) 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US10789041B2 (en) 2014-09-12 2020-09-29 Apple Inc. Dynamic thresholds for always listening speech trigger
US10074360B2 (en) 2014-09-30 2018-09-11 Apple Inc. Providing an indication of the suitability of speech recognition
US9646609B2 (en) 2014-09-30 2017-05-09 Apple Inc. Caching apparatus for serving phonetic pronunciations
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
US9886432B2 (en) 2014-09-30 2018-02-06 Apple Inc. Parsimonious handling of word inflection via categorical stem + suffix N-gram language models
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10552013B2 (en) 2014-12-02 2020-02-04 Apple Inc. Data detection
US9711141B2 (en) 2014-12-09 2017-07-18 Apple Inc. Disambiguating heteronyms in speech synthesis
US9865280B2 (en) 2015-03-06 2018-01-09 Apple Inc. Structured dictation using intelligent automated assistants
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
US9721566B2 (en) 2015-03-08 2017-08-01 Apple Inc. Competing devices responding to voice triggers
US9899019B2 (en) 2015-03-18 2018-02-20 Apple Inc. Systems and methods for structured stem and suffix language models
US9842105B2 (en) 2015-04-16 2017-12-12 Apple Inc. Parsimonious continuous-space phrase representations for natural language processing
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US10127220B2 (en) 2015-06-04 2018-11-13 Apple Inc. Language identification from short strings
US10101822B2 (en) 2015-06-05 2018-10-16 Apple Inc. Language input correction
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10186254B2 (en) 2015-06-07 2019-01-22 Apple Inc. Context-based endpoint detection
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
US10255907B2 (en) 2015-06-07 2019-04-09 Apple Inc. Automatic accent detection using acoustic models
CN104933041B (zh) * 2015-06-25 2017-09-01 武汉传神信息技术有限公司 一种利于翻译工作的文件抽取和还原方法
US11803918B2 (en) 2015-07-07 2023-10-31 Oracle International Corporation System and method for identifying experts on arbitrary topics in an enterprise social network
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US9697820B2 (en) 2015-09-24 2017-07-04 Apple Inc. Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US11587559B2 (en) 2015-09-30 2023-02-21 Apple Inc. Intelligent device identification
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10049668B2 (en) 2015-12-02 2018-08-14 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
JP2017174300A (ja) * 2016-03-25 2017-09-28 富士ゼロックス株式会社 情報処理装置、情報処理方法およびプログラム
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
US10049663B2 (en) 2016-06-08 2018-08-14 Apple, Inc. Intelligent automated assistant for media exploration
DK179309B1 (en) 2016-06-09 2018-04-23 Apple Inc Intelligent automated assistant in a home environment
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
US10628522B2 (en) * 2016-06-27 2020-04-21 International Business Machines Corporation Creating rules and dictionaries in a cyclical pattern matching process
US10043516B2 (en) 2016-09-23 2018-08-07 Apple Inc. Intelligent automated assistant
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK179560B1 (en) 2017-05-16 2019-02-18 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
US10635863B2 (en) 2017-10-30 2020-04-28 Sdl Inc. Fragment recall and adaptive automated translation
US10817676B2 (en) 2017-12-27 2020-10-27 Sdl Inc. Intelligent routing services and systems
US10540452B1 (en) * 2018-06-21 2020-01-21 Amazon Technologies, Inc. Automated translation of applications
US11256867B2 (en) 2018-10-09 2022-02-22 Sdl Inc. Systems and methods of machine learning for digital assets and message creation

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0568319A2 (de) * 1992-04-30 1993-11-03 Sharp Kabushiki Kaisha Maschinenübersetzungssystem

Family Cites Families (27)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57150071A (en) * 1981-03-12 1982-09-16 Sharp Corp Electronic type interpreter
US4553261A (en) * 1983-05-31 1985-11-12 Horst Froessl Document and data handling and retrieval system
JPS6244877A (ja) * 1985-08-22 1987-02-26 Toshiba Corp 機械翻訳装置
US5029114A (en) * 1986-07-22 1991-07-02 Kabushiki Kaisha Toshiba Method of displaying reduced-layout and apparatus for embodying the method
US4916614A (en) * 1986-11-25 1990-04-10 Hitachi, Ltd. Sentence translator using a thesaurus and a concept-organized co- occurrence dictionary to select from a plurality of equivalent target words
GB2199170A (en) * 1986-11-28 1988-06-29 Sharp Kk Translation apparatus
US4890230A (en) * 1986-12-19 1989-12-26 Electric Industry Co., Ltd. Electronic dictionary
JPS63223962A (ja) 1987-03-13 1988-09-19 Hitachi Ltd 翻訳装置
US4980289A (en) * 1987-04-27 1990-12-25 Wisconsin Alumni Research Foundation Promoter deficient retroviral vector
JPH01279368A (ja) * 1988-04-30 1989-11-09 Sharp Corp キャラクタデータの転送方式
DE68928231T2 (de) * 1988-10-28 1998-01-08 Toshiba Kawasaki Kk Verfahren und Vorrichtung zur Maschinenübersetzung
JPH02254564A (ja) * 1989-03-29 1990-10-15 Ricoh Co Ltd 翻訳用辞書編集装置
US5329446A (en) * 1990-01-19 1994-07-12 Sharp Kabushiki Kaisha Translation machine
US5109439A (en) * 1990-06-12 1992-04-28 Horst Froessl Mass document storage and retrieval system
JP3266246B2 (ja) * 1990-06-15 2002-03-18 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
US5418717A (en) * 1990-08-27 1995-05-23 Su; Keh-Yih Multiple score language processing system
US5497319A (en) * 1990-12-31 1996-03-05 Trans-Link International Corp. Machine translation and telecommunications system
US5466072A (en) * 1992-01-17 1995-11-14 Stenograph Corporation Method and apparatus for recording and translating shorthand notes
JP3220560B2 (ja) * 1992-05-26 2001-10-22 シャープ株式会社 機械翻訳装置
US5528491A (en) * 1992-08-31 1996-06-18 Language Engineering Corporation Apparatus and method for automated natural language translation
JP2745370B2 (ja) * 1993-02-23 1998-04-28 日本アイ・ビー・エム株式会社 機械翻訳方法及び機械翻訳装置
JP3408291B2 (ja) * 1993-09-20 2003-05-19 株式会社東芝 辞書作成支援装置
JPH07210558A (ja) * 1994-01-20 1995-08-11 Fujitsu Ltd 機械翻訳装置
EP0672989A3 (de) * 1994-03-15 1998-10-28 Toppan Printing Co., Ltd. Maschinelles Übersetzungssystem
JPH08101837A (ja) * 1994-09-30 1996-04-16 Toshiba Corp 機械翻訳装置における翻訳規則学習方法
US5983169A (en) * 1995-11-13 1999-11-09 Japan Science And Technology Corporation Method for automated translation of conjunctive phrases in natural languages
US5848386A (en) * 1996-05-28 1998-12-08 Ricoh Company, Ltd. Method and system for translating documents using different translation resources for different portions of the documents

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0568319A2 (de) * 1992-04-30 1993-11-03 Sharp Kabushiki Kaisha Maschinenübersetzungssystem

Also Published As

Publication number Publication date
JP2004265423A (ja) 2004-09-24
JPH1083398A (ja) 1998-03-31
JP3905179B2 (ja) 2007-04-18
US5848386A (en) 1998-12-08
US6208956B1 (en) 2001-03-27
DE19709968A1 (de) 1997-12-04

Similar Documents

Publication Publication Date Title
DE19709968C2 (de) Verfahren und System zum Übersetzen eines Dokumentes
DE60208604T2 (de) Automatisches Verfahren zur Erzeugung von Image-buttons
DE69923311T2 (de) Universelle formular-maschine
DE69925831T2 (de) Maschinenunterstützte übersetzungswerkzeuge
DE69725258T2 (de) System und Verfahren zur Wiederauffindung von Dokumenten in mehreren Sprachen
DE69734400T2 (de) Verfahren und system zur prüfung der richtigkeit der rechtschreibung und grammatik eines dokuments
DE69726339T2 (de) Verfahren und Apparat zur Sprachübersetzung
DE69728282T2 (de) System und verfahren zur extraktion und kodierung von medizinischer fachsprache
DE69737884T2 (de) Textprozessor
DE69530816T2 (de) Textbearbeitungssystem und Verfahren unter Verwendung einer Wissensbasis
DE4015905C2 (de) Sprachanalyseeinrichtung, -verfahren und -programm
DE10135445B4 (de) Integriertes Verfahren für das Schaffen einer aktualisierbaren Netzabfrage
DE60213409T2 (de) Erstellung von strukturierten daten aus unformatiertem text
DE10162156A1 (de) Die Benutzernavigation durch Multimedia-Dateiinhalte unterstützendes System und Benutzerschnittstelle
DE2633536A1 (de) Sprachuebertragungsgeraet und -verfahren
DE3032664A1 (de) Elektronisches sprachuebersetzungsgeraet.
DE10321944A1 (de) Vorrichtungen und Verfahren zum Verarbeiten von textbasierten elektronischen Dokumenten
DE3616751A1 (de) Uebersetzungssystem
DE60101668T2 (de) Verfahren und gerät zum erzeugen eines auf einer formatvorlage basierten index für ein strukturiertes dokument
DE10162418A1 (de) System zur Verarbeitung strukturierter Dokumente, damit sie sich zur Ablieferung über Netzwerke eignen
DE112020005268T5 (de) Automatisches erzeugen von schema-annotationsdateien zum umwandeln von abfragen in natürlicher sprache in eine strukturierte abfragesprache
DE4313959A1 (de) Einrichtung und verfahren zum steuern der darstellung einer vorlage
WO2005119580A1 (de) Verfahren und einrichtung zur strukturanalyse eines dokuments
WO2005106641A2 (de) Verfahren, vorrichtung und computerprogrammprodukt zum erzeugen eines seiten- und/oder bereichsstrukturierten datenstroms aus einem zeilendatenstrom
Arnold-Moore Automatic generation of amendment legislation

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8304 Grant after examination procedure
8364 No opposition during term of opposition
R071 Expiry of right