DE19709968C2 - Verfahren und System zum Übersetzen eines Dokumentes - Google Patents
Verfahren und System zum Übersetzen eines DokumentesInfo
- Publication number
- DE19709968C2 DE19709968C2 DE19709968A DE19709968A DE19709968C2 DE 19709968 C2 DE19709968 C2 DE 19709968C2 DE 19709968 A DE19709968 A DE 19709968A DE 19709968 A DE19709968 A DE 19709968A DE 19709968 C2 DE19709968 C2 DE 19709968C2
- Authority
- DE
- Germany
- Prior art keywords
- document
- translation
- language
- selecting
- translation resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/221—Parsing markup language streams
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/45—Example-based machine translation; Alignment
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/42—Data-driven translation
- G06F40/47—Machine-assisted translation, e.g. using translation memory
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/55—Rule-based translation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/40—Processing or translation of natural language
- G06F40/58—Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
Description
Die Erfindung betrifft ein Verfahren und ein System zum Übersetzen eines Dokuments aus
einer ersten Sprache in eine zweite Sprache.
Das Konzept einer maschinellen Übersetzung, mit welcher ein Dokument von einer
menschlichen Sprache in eine andere übersetzt wird, ist umfangreich untersucht worden. In
den Anfängen der maschinellen Übersetzung in den frühen Vierzigerjahren (1940) erdachte
Warren Weaver von der Rockefeller Foundation ein Übersetzungskonzept, das analog dem
Decodieren in der Weise ist, daß eine Eins-zu-Eins-Substitution angewendet wird. Jedoch
wurde bald klar, dass dieser Weg eine allzu vereinfachende Analogie war, und dass die
Feinheiten der menschlichen Sprache beim Entwickeln von Übersetzungssystemen beachtet
werden müssen. Beispielsweise ist die Bedeutung bestimmter Worte im Kontext zu bestim
men, da spezifische Redewendungen Bedeutungen haben können, die aus den einzelnen
Worten nicht offensichtlich sind, und einige Worte verschiedene Bedeutungen in verschie
denen Kontexten haben.
Eine Lösungsmöglichkeit, die maschinelle Übersetzung eines Dokuments zu verbessern,
besteht darin, einschränkende Vorschriften bei den Worten und Redewendungen vorzuse
hen, die in dem Quellendokument enthalten sind, welches zu übersetzen ist. Auf diese Wei
se können perfekte Übersetzungen erhalten werden, jedoch auf Kosten einer drastischen
Beschränkung auf das, was ein Autor sagen will. Die Grundidee, die Sprache einzuschrän
ken, welche in dem Quellendokument verwendet werden kann, welches zu übersetzen ist,
ist ähnlich wie das Benutzen eines Übersetzungsbuches für Redewendungen, das oft von
Touristen verwendet worden ist, welches den Benutzer mit einer Sammlung von zu benut
zenden "stereotypen" Redewendungen versorgt. Dies ist in Ordnung, vorausgesetzt die ste
reotypen Phrasen enthalten das, was der Benutzer sagen will. Jedoch ist dies in vielen Fäl
len nicht passend.
Aus der EP 0 568 319 ist bereits ein Übersetzungssystem bekannt, bei welchem ein Text in
einem Analysemodul analysiert wird unter Verwendung von Grammatikregeln, Wörterbü
chern und anderen Quellen, um eine Information bezüglich der Verwendung und Bedeutung
der Worte des Quellentextes zu erhalten. Anschließend werden die Worte des Quellentextes
mit einem Satz von Äquivalenzaussagen abgeglichen, welche in einem Wörterbuch gespei
chert sind, und eine Ziel-Wort-Information, welche durch das Abgleichverfahren erhalten
wurde, wird an ein Erzeugungsmodul (generation module) ausgegeben, welches einen oder
mehrere Versionen eines Textes ausgibt, welcher dem Quellentext entsprechen soll. Dieses
"generation module" weist zwei getrennte funktionale Bestandteile auf. Der erste Teil des
"generation module" bezieht sich auf die Verarbeitung einer Information, welche nicht von
der Reihenfolge der Worte in dem Zieltext abhängt, wobei sich der zweite Teil auf die Kon
struktion von Strukturen berücksichtigen, welche Beschränkungen hinsichtlich der Wortrei
henfolge und der Zuordnung zwischen den Zeichen bezieht, wobei der zweite Teil mit dem
ersten Teil kommuniziert, um die Analysen zu synchronisieren.
Es muss also ein erster Teil des Textes übersetzt werden, wobei auf eine herkömmliche Art
ein Wörterbuch und andere Quellen verwendet werden und es muss ein zweiter Teil des
Textes übersetzt werden unter Berücksichtigung der Konstruktion der Strukturen, welche
Beschränkungen hinsichtlich der Wortreihenfolge und der Zuordnung zwischen den Zeichen
berücksichtigen. Ein Text muss also mit dem bekannten System in zwei unterschiedlichen
Schritten übersetzt werden.
Es ist daher Aufgabe der Erfindung, die Nachteile des vorgenannten Standes der Technik zu
überwinden und die Notwendigkeit von zwei Übersetzungen zu vermeiden.
Diese Aufgabe wird durch die Merkmale der Ansprüche 1 und 13 gelöst.
Damit kann gemäß der Erfindung insbesondere das maschinelle Übersetzen von Dokumen
ten mit Hilfe von Ressourcen, wie Wörterbüchern and Vorschriftendatenbasen ausgeführt
werden. Dazu können verschiedene Wörterbücher and Datenbasen verwendet werden, um
verschiedene Teile eines Dokuments zu übersetzen. Es kann auch ein Dokument geschaffen
werden, das mit Hilfe von Hinweissymbolen, wie einer verallgemeinerten Stan
dard-Markup-Sprache (Standard Generalized Markup Language (SGML)) zu übersetzen ist,
um verschiedene Abschnitte des Dokuments anzuzeigen, bei welchem unterschiedliche
Übersetzungsressourcen verwendet sind.
Mit der Erfindung kann maschinell eine genauere Übersetzung als durch herkömmliche ma
schinelle Übersetzungssysteme geschaffen werden, aber nicht allzu einschränkend hinsicht
lich der Worte oder Redewendungen, die in dem Quellenelement enthalten sind. Gemäß der
Erfindung können verschiedene Übersetzungsressourcen bzw. -informationen, wie Wörter
bücher und Vorschriften-Datenbasen, für verschiedene Teile eines Dokuments verwendet
werden, um genauere Übersetzungen zu erzeugen und um ein nach dem Übersetzen vorzu
nehmendes Redigieren zu minimieren. Auch können gemäß der Erfindung Symbole bzw.
Hinweissymbole, wie SGML-Hinweissymbole benutzt werden, um den inneren Aufbau des
zu übersetzenden Dokuments festzulegen, um die Wörterbücher und/oder Vorschriften aus
zuwählen, die für den Übersetzungsprozess zu verwenden sind.
Die Erfindung ermöglicht es auch, ein interaktives Übersetzungssystem zu schaffen, das es
einem Benutzer erlaubt, sowohl das Quellendokument als auch das maschinell übersetzte
Dokument nebeneinander darzustellen, so dass der Benutzer interaktiv das übersetzte Do
kument ändern kann, um so eine vorzüglichere Übersetzung zu erhalten. Mit der Erfindung
können auch Wörterbücher und/oder Übersetzungsvorschriften aktualisiert werden, die auf
den Änderungen basieren, welche der Benutzer an der automatischen Übersetzung vorge
nommen hat.
Im Gegensatz zur EP 0 568 319 wird nach der Erfindung zunächst eine Information, welche
in dem zu übersetzenden Dokument enthalten ist, analysiert. Der Übersetzungsvorgang
selbst wird jedoch in einem einzigen Schritt durchgeführt, wobei zum Übersetzen des Do
kuments eine ausgewählte Übersetzungsressource verwendet wird. Die Erfindung weist also
keinen ersten und zweiten Übersetzungsschritt auf, wie in der EP 0 568 319, sondern analy
siert zunächst das übersetzende Dokument, wählt eine geeignete Übersetzungsressource in
Abhängigkeit von dem Analyseergebnis aus, und übersetzt das Dokument dann in einem
einzigen Übersetzungsschritt.
Bevor eine Übersetzung durchgeführt werden kann, muss eine Dokumenten-Typ-Definition
(DTD) geschaffen werden, welche die zulässigen Hinweissymbole und den zulässigen Auf
bau eines Dokuments definiert. Beispielsweise kann ein Dokument, das eine Vorrichtung,
wie einen Scanner beschreibt, größere Abschnitte, wie einen Überblick, eine Beschreibung
der Hardware des Scanners, eine Beschreibung der in dem Scanner benutzten Software,
und zusätzliche Angaben oder Optionen haben, die in Verbindung mit dem Scanner benutzt
werden können. Der Übersichtsabschnitt kann den Namen oder die Beschreibung der Vorrichtung,
eine Abbildung, die den Scanner zeigt, und eine Merkmalsliste des Scanners ent
halten.
Nachdem die Dokumententyp-Definition festgesetzt worden ist, müssen das Wörterbuch
und die Vorschriften-Datenbasen, welche bei dem Übersetzungsprozess zu verwenden sind,
festgelegt werden. Eine Art, die Wörterbücher und Vorschriften zu schaffen, die für das
Übersetzen der verschiedenen Abschnitte des Dokuments verwendet worden sind, besteht
darin, Dokumente mit einer bekannten Übersetzung einzugeben. Auf diese Weise kann das
System automatisch die Wörterbuch- und Übersetzungsvorschriften bilden, so dass die
Übertragung des Dokuments auf eine richtige bekannte Übersetzung hinausläuft. Zusätzlich
oder alternativ zu der Übersetzung bekannter Dokumente kann ein Benutzer ein Dokument
selbst übersetzen, so dass Wörterbücher und Vorschriften basierend auf der Eingabe eines
Benutzers gebildet werden. Ferner kann eine Kombination von automatischer und "manu
eller" Übersetzung durchgeführt werden, was dem Benutzer ermöglicht, die automatisch
durchgeführten Übersetzungen zu korrigieren, so dass die sich ergebende Übersetzung ge
nauer ist. Als eine weitere Alternative können die Vorschriften und Wörterbücher "manu
ell" geschaffen werden. Bei einer bevorzugten Arbeitsweise der Erfindung wird eine ge
sonderte Datenstruktur für jeden der verschiedenen Abschnitte des Dokuments benutzt. Die
Datenstruktur speichert Information, welche Information, wie Namen und (Speicher-)Stel
len weiterer Wörterbücher und Vorschriften anzeigt, welche bei dem entsprechenden Ab
schnitt oder anderen Abschnitten des Dokuments benutzt werden können. Das Benutzen der
Datenstruktur, um die Wörterbücher und Vorschriften zu verfolgen, erlaubt es, die ver
schiedenen Wörterbücher und Vorschriften in einer Hierarchie anzuordnen, welche einer
Hierarchie der Struktur des Dokuments entspricht. Wenn das Übersetzungssystem ausrei
chend entwickelt und trainiert ist, kann der Übersetzungsprozess mit Hilfe der spezifischen
Wörterbuchinformation und der Übersetzungsvorschriften, welche einem ganz bestimmten
Abschnitt des Dokuments entsprechen, automatisch erfolgen. Durch Verwenden der spezi
fischen Wörterbuchinformation und Vorschriften für die verschiedenen Teile des Doku
ments wird die Übersetzung genauer und kommt einer Eins-zu-Eins-Entsprechung zwischen
dem Quellendokument und dem übersetzten Dokument ohne irgendwelche Belastungen oder
Schwierigkeiten näher, welche von einem Verwenden von Übersetzungssystemen herrüh
ren, welche auf das Benutzen stereotyper Redewendungen beschränkt sind.
Nachfolgend wird die Erfindung anhand von bevorzugten Ausführungsformen unter Bezug
nahme auf die anliegenden Zeichnungen im einzelnen erläutert. Es zeigen:
Fig. 1 eine hierarchische Struktur eines beispielhaften Doku
ments;
Fig. 2 das Codieren eines Teils eines Dokuments mit Hilfe von
SGML-Hinweisen;
Fig. 3 das Nebeneinanderdarstellen eines Quellendokuments und
eines übersetzten Dokuments;
Fig. 4 ein bei der Erfindung benutztes Wörterbuchsystem;
Fig. 5 Übersetzungsvorschriften, wie Grammatik- und Sprachvor
schriften, welche von der Erfindung benutzt werden;
Fig. 6 eine hierarchische Organisation von Datenstrukturen, die
verwendet werden, um die Wörterbücher und Vorschriftenda
tenbasen auszuwählen, die von den verschiedenen Abschnit
ten des Dokuments benutzt werden;
Fig. 7 ein Ablaufdiagramm eines Prozesses zum Erzeugen einer Do
kumententyp-Definition;
Fig. 8 ein Datenflußdiagramm der generellen Arbeitsweise der Er
findung;
Fig. 9A bis 9C einen Prozeß, der zum Trainieren des Systems ver
wendet worden ist, um eine richtige Übersetzung durchzu
führen, und auch eine Ausführungsform zum Durchführen der
Übersetzung;
Fig. 10 einen Prozeß, um eine existierende, niedrigere hierarchi
sche Ebene zu bewegen oder um eine neue niedrigere hierar
chische Ebene in den Datenstrukturen zu erzeugen, um In
formation der Wörterbücher- und der Vorschriftendatenbasen
zu speichern;
Fig. 11 einen Prozeß zum Durchführen einer automatischen Überset
zung, nachdem das System aufgebaut und trainiert ist;
Fig. 12 einen Prozeß zum automatischen Übersetzen von Hinweissym
bolen eines Dokuments;
Fig. 13 einen Prozeß zum Ändern von hierarchischen Ebenen in einem
Dokument;
Fig. 14 eine Hardware-Ausführungsform der Erfindung;
Fig. 15 ein Blockdiagramm von Software-Komponenten der Erfindung,
und
Fig. 16 ein detaillierteres Datenflußdiagramm der Arbeitsweise der
Erfindung.
Anhand der Figuren, in welchen mit den gleichen Bezugszeichen
identische oder einander entsprechende Teile in den verschiedenen
Ansichten bezeichnet sind, und insbesondere anhand von Fig. 1 wird
der Aufbau eines beispielhaften Dokuments erläutert, das zu über
setzen ist. Der Aufbau des in Fig. 1 dargestellten Dokuments kann
für Vorrichtungen, wie einem Kopierer, einem Faksimilegerät,
einem Drucker/Printer, einem Scanner oder anderen Vorrichtungen
verwendet werden. Das Dokument 30 setzt sich aus vier größeren
Abschnitten zusammen, nämlich einer Übersicht 32 der in dem
Dokument beschriebenen Vorrichtung, einer Beschreibung der in der
Vorrichtung verwendeten Hardware 40, einer Beschreibung der in
der Vorrichtung verwendeten Software 42 und einem Abschnitt, in
welchem die zusätzlichen Möglichkeiten oder Optionen 44 der Vor
richtung beschrieben sind. Jeder der Abschnitte kann erforderli
chenfalls Unterabschnitte aufweisen, welche das Dokument noch
weiter in detailliertere Abschnitte unterteilen. Beispielsweise
enthält die Übersicht 32 einen Vorrichtungsabschnitt
34, welcher eine absatzweise Beschreibung der Vorrichtung ent
hält, einen Abbildungsabschnitt 36, welcher eine Darstellung ei
ner (Speicher-)Stelle enthält, wo eine Darstellung der Vorrich
tung gefunden werden kann, und eine Merkmalsliste 38 der Vorrich
tung.
Bei der vorliegenden Erfindung wird nicht die in einer Abbildung
enthaltende Information übersetzt, obwohl es möglich ist, eine
abweichende Abbildung in dem übersetzten Dokument zu übersetzen,
welche ein Bild enthält, welches geeigneter ist für die Sprache,
in welcher das Dokument übersetzt worden ist. Beispielsweise
zeigt eine Abbildung eines Automobils, welches in den Vereinigten
Staaten von Amerika benutzt werden soll, einen Namen, welcher in
den Vereinigten Staaten nicht verwendet werden soll, während das
entsprechende Bild, das in einem japanischen Dokument verwendet
worden ist, den Namen zeigt, welcher in Japan verwendet werden
soll. Ebenso können Abbildungen, welche Text in einer anderen
Sprache enthalten, verwendet werden.
Bevor erläutert wird, wie das Dokument, das die verschiedenen
strukturellen in Fig. 1 dargestellten Abschnitte hat, übersetzt
wird, wird ein Beispiel eines Quellendokuments, welches zu über
setzen ist, anhand von Fig. 2 beschrieben. In Fig. 2 ist die Struk
tur und der Inhalt eines Teils eines zu übersetzenden Dokuments
dargestellt. Das Dokument ist mit Hilfe von Hinweisen codiert
werden, wie beispielsweise Hinweisen, welche in der generalisier
ten Standard-Markup-Sprache (SGML) gebildet worden sind, welches
eine bekannte Codierart ist und die im einzelnen in der interna
tionalen Norm-ISO 8879: 1986 beschrieben ist, die mit "Standard
Generalized Markup Language (SGML)" betitelt ist und in dem Buch
"Das SGML-Handbuch" von C. F. Goldfarb von Oxford: Clarendon
Press, 1990 beschrieben ist, welche beide hiermit als Referenz
eingeführt sind. Jedoch ist die Erfindung nicht auf die Verwen
dung gerade von SGML-Hinweisen beschränkt, es kann auch andere
Formattierung, wie beispielsweise Hinweise, die entsprechend der
"Hyper Text Markup Language (HTML) oder auf irgendeine andere
Weise erzeugt worden sind, oder ein Codieren eines Dokuments oder
ein Markieren eines Dokuments, um verschiedene strukturelle Ab
schnitte anzuzeigen, welche bei verschiedenen Übersetzungsres
sourcen zu verwenden sind, von dem Übersetzungssystem benutzen.
Ein Dokumentensystem, das Formulare benutzt, kann die vorliegende
Erfindung bei jedem Abschnitt eines Formulars benutzt werden, das
als ein Äquivalent zu einem mit Hinweisen versehenen Element be
handelt worden ist. Gemäß der SGML-Sprache beginnen Hinweise
üblicherweise mit einem "kleiner als"-Zeichen (<); hierauf folgt
der Name des Hinweises und Hinweise enden mit einem "größer als"-
Zeichen (<). Jedes der Elemente in Fig. 2, welche mit einem "klei
ner als"-Zeichen beginnen und mit einem "größer als"-Zeichen en
den, sind Hinweissymbole. Auf den Hinweis können Daten folgen,
welche das Hinweissymbol beschreiben. Beispielsweise folgt auf
den Hinweis <LANG< in Zeile 3 von Fig. 2 das Wort "english", was
anzeigt, daß das Dokument in de englischen Sprache abgefaßt ist.
Auf Hinweise folgen, wenn überhaupt, ein Endhinweis nach den den
Hinweis beschreibenden Daten oder die Hinweise haben nicht einen
ausdrücklichen Endhinweis, sondern enden stillschweigend durch
den Beginn eines nachfolgenden Hinweises. Das Weglassen eines
Hinweises ist nur erlaubt, wenn die Syntax der in der DT-Defini
tion definierten Dokumentenstruktur unzweideutig ist und ein Weg
lassen eines Hinweises zuläßt. Der Endhinweis beginnt mit dem
"kleiner als"-Zeichen, auf das ein Schrägstrich folgt, der von
unten links nach oben rechts verläuft; hierauf folgt der Name des
Hinweises und er endet mit einem "größer als"-Zeichen (</ . . . <).
Das implizite Ende an einem Hinweis ist aus Fig. 2 zu ersehen. Ein
Beispiel ist in den Zeilen 3 und 4 gegeben, in welchen auf den
Hinweis <LANG< die Daten "ENGLISH" folgen, was anzeigt, daß das
Dokument in englischer Sprache abgefaßt ist. Dort gibt es keinen
ausdrücklichen Hinweis für den <LANG< Starthinweis, sondern Zeile
4 beginnt mit einen neuen Hinweis <DIVISION<, welcher verwendet
ist, um die Abteilung einer Gesellschaft anzuzeigen, von welcher
ein Dokument stammt. Das Vorkommen des Hinweises <DIVISION< zeigt
implizit an, daß der Hinweis <LANG< beendet ist.
Zeile 1 von Fig. 2 beginnt mit einer Beschreibung !DOCTYPE des Do
kuments. "DOCTYPE" erklärt eine vorher definierte Dokumententyp-
Definition (DTD), zu welcher das zu übersetzende Dokument paßt.
OURDOC in Zeile 1 ist die generelle Identifizierung des Dokumen
tenelements. Die Information zwischen Anführungszeichen zeigt den
SGML-Parser der Stelle der DT-Definition an. Dies ist Standard-
SGML-Syntax, die verwendet worden ist, um den Dokumententyp anzu
zeigen. Zeile 2 von Fig. 2 ist ein Hinweis, welcher den Beginn des
Dokuments anzeigt; Zeile 3 zeigt an, daß die Sprache des Doku
ments englisch ist, und Zeile 4 zeigt an, daß das Dokument von
einer Abteilung XYZ einer Gesellschaft stammt. Die vorliegende
Erfindung kann sehr nützlich für internationale Gesellschaften
sein, bei welchen die Notwendigkeit besteht, Dokumente eines ganz
bestimmten Formats regelmäßig zu übersetzen. Erforderlichenfalls
kann das Dokument nicht nur die Abteilung anzeigen, von welcher
das Dokument stammt, oder von welcher das Produkt herrührt, son
dern das Dokument kann auch eine Identifizierungsinformation der
Gesellschaft enthalten.
Zeile 5 von Fig. 2 zeigt an, daß der zu beschreibende Vorrich
tungstyp ein Scanner ist. Dies ist zweckdienlich, um den Bereich
von Wörterbücher-, und Übersetzungs-Vorschriftendaten-Basen ein
zuengen, welche verwendet werden, um das Wörterbuch anhand von
Wörterbüchern und Übersetzungsvorschriften zu übersetzen, welche
in Verbindung mit Scannern verwendet werden. Zeile 6 zeigt an,
daß das Dokument eine Produktspezifizierung ist, und daß der Name
oder die Modellnummer des Scanners, welche auch der Titel des Do
kuments ist, RS2200-EF ist.
Zeile 8 zeigt den Beginn des Übersichtabschnitts des Dokuments
an, welcher in der in Fig. 1 dargestellten, hierarchischen Struk
tur als 32 bezeichnet ist. Der Übersichtsabschnitt beginnt mit
einer Beschreibung der Vorrichtung in Zeile 10, welches ein Ab
schnitt (<P<) ist, welcher mit den Worten beginnt "Dieser Scanner
. . .". Zeile 10 zeigt an, daß eine Abbildung als nächstes in dem
Dokument enthalten ist, die der Abbildung 36 in der Struktur der
Fig. 1 entspricht. Als nächstes zeigt Zeile 11 an, daß die Merkma
le der Vorrichtung die folgenden sind; Zeile 12 zeigt, daß die
Merkmale aufgelistet sind, und die Einzelheiten der Liste (<IT<)
sind anschließend in den Zeilen 13 bis 15 aufgelistet. Das
Dokument kann weitergehen; jedoch sind deren Einzelheiten nicht
wichtig und sind der Kürze halber weggelassen, um den Leser nicht
zu verwirren, indem ein allzu spezielles Beispiel präsentiert
wird.
Fig. 3 veranschaulicht ein Bildschirmdisplay 50, das einen Ab
schnitt (Bereich) 52A, welcher die englische Sprachenversion des in Fig. 2
dargestellten Dokuments wiedergibt, und einen mit 52B bezeichneten Bereich
der die übersetzte Version des Dokuments auf der rechten Seite darstellt.
Die linke Seite der Fig. 2 veranschaulicht, daß nicht jeder Hin
weis angezeigt ist, wenn das Dokument der Fig. 2 gedruckt ist oder
auf einem elektronischen Display erzeugt worden ist, wie einer
Kathodenstrahlröhre oder einem LCD-Display. In dem Abschnitt 52A
ist der Titel oder Name der Vorrichtung mit 54A bezeichnet; hier
auf folgt eine Überschrift "Vorrichtungsübersicht" 56A und hier
auf ein Absatz (Bereich) 58A, welcher die Information beschreibt. Eine Ab
bildung ist dann in einem Bereich 60A dargestellt, auf den eine
Merkmalsliste der Vorrichtung folgt, die mit 62A, 64A und 66A be
zeichnet ist. Gemäß der Erfindung ist es möglich, nebeneinander
ein Display sowohl mit der Originalsprache des Dokuments als auch
der übersetzten Form des Dokuments zu haben, so daß ein Benutzer
ohne weiteres das übersetzte Dokument mit dem Originaldokument
vergleichen kann und erforderlichenfalls Änderungen machen kann.
Die Bereiche des übersetzten Dokuments 52B haben eine darin ent
haltene diagonale Schraffierung; während eines tatsächlichen Be
triebs gemäß der Erfindung würden sie die aktuelle Übersetzung
des Originaldokuments 52A haben. Es ist jedoch keine Übersetzung
in dem Bereich 52B dargestellt, da es zum Verständnis der Ar
beitsweise der Erfindung nicht notwendig ist, und nur zu Verwir
rungen führen würde, beispielsweise wenn fremdsprachige Worte
oder Zeichen im Abschnitt (Bereich) 52B enthalten wären.
Es ist nicht kritisch, daß jeder Hinweis oder Daten gemäß der Er
findung übersetzt werden. Beispielsweise kann der Titel oder Name
des Scanners, welcher mit 54A bezeichnet ist, denselben Titel
oder Namen in der Fremdsprache haben. Die Kopfleiste "Vorrich
tungsübersicht" 56A resultiert aus der Übersetzung des Hinweises
<OVERVIEW< (<ÜBERSICHT<) in Zeile 8 von Fig. 2. Die Übertragung
der Kopfzeile "Vorrichtungsübersicht" ist eine direkte Überset
zung des Hinweises und kann in einem Wörterbuch oder in einer Ta
belle gespeichert werden, die der Dokumententyp-Definition zuge
ordnet ist, welche anzeigt, welche Kopfleiste bei dem Hinweis
<OVERVIEW< benutzt werden sollte. Wenn der Hinweis, beispielswei
se der Hinweis <LANG< in Zeile 3 von Fig. 2 nicht angezeigt wird,
besteht keine Notwendigkeit, den Hinweis zu übersetzen, obwohl
dies erforderlichenfalls durchgeführt werden kann.
Fig. 3 veranschaulicht, daß dieselbe Abbildung sowohl der das Ori
ginaldokument darstellende Bereich 52A als auch der das übersetzte Dokument darstellende Bereich 52B ent
halten ist. Jedoch kann erforderlichenfalls eine gesonderte Ab
bildung verwendet werden, welche von einem Benutzer bestimmt wor
den ist oder automatisch ausgewählt wird, um der übersetzten
Sprache zu entsprechen. Die in den Bereichen 58A, 62A, 64A und
66A enthaltende Information wird mit Hilfe der entsprechenden
Wörterbuch- und Vorschriftsdatenbasis übersetzt.
Der mittels der Erfindung durchgeführte Übersetzungsvorgang be
faßt sich hauptsächlich mit dem Hin- und Herübersetzen zwischen
verschiedenen menschlichen Kommunikationssprachen, wie englisch,
japanisch, deutsch, französisch, spanisch, chinesisch, russisch
und anderen menschlichen Sprachen. Es sind jedoch auch die Lehren
anzuwenden, die bei anderen Sprachtypen und Kommunikationen ent
halten sind, wie Übersetzungen beispielsweise zwischen verschie
denen Computersprachen.
Wenn ein Textabschnitt, wie der im Bereich 58A der Fig. 3 darge
stellte Text, übersetzt wird, werden ein Wörterbuch, das ein Vo
kabular enthält, und Übersetzungsvorschriften einschließlich
Grammatik- und Sprachvorschriften benutzt. Das Benutzen eines
Wörterbuchs und Sprachvorschriften bei Übersetzungsprozessen ist
herkömmlich. Eine Informationsquelle, wie herkömmliche maschinel
le Übersetzungssysteme arbeiten, ist in dem Buch "Maschinelle
Übersetzung. Eine Einführung" von D. Arnold et al. von Blackwell
Publishers, 1994 vorgesehen. Zusätzlich zu dem Vorsehen einer gu
ten Einleitung in die maschinelle Übertragung sieht dieses Buch
auch ein Auflisten von zahlreichen anderen Quellen vor, die her
kömmliche maschinelle Übersetzungsoperationen beschreiben; auf
das Buch von Arnold et al und die anderen hier angeführten Publi
kationen wird hiermit Bezug genommen. Ein Unterscheidungsmerkmal
der vorliegenden Erfindung von den in diesem Buch und den zitier
ten Referenzen offenbarten Systemen ist die Verwendung eines spe
zifischen Wörterbuchs oder eines spezifischen Abschnitts eines
Wörterbuchs und/oder die Benutzung spezifischer Vorschriftendatenbasen
oder eines Abschnitts oder einer Vorschriftsdatenbasis
in Abhängigkeit davon, welcher Abschnitt eines Dokuments oder
welcher Dokumententyp zu übersetzen ist.
Fig. 4 veranschaulicht ein beispielhaftes Wörterbuch, welches in
Verbindung mit der Erfindung verwendet werden kann. In Fig. 4 ist
ein Wörterbuch 70 in Englisch-Japanisch/Japanisch-Englisch wie
dergegeben, das vier gesonderte Abschnitte, nämlich ein Kopierer-
Wörterbuch 72, ein Scanner-Wörterbuch 84, ein Printer/Drucker-
Wörterbuch 86 und ein allgemeines Wörterbuch 88 für englisches
und japanisches Vokabular aufweist. Das Kopierer-Wörterbuch 72
wird verwendet, wenn ein zu übersetzendes Dokument ein Kopierer
ist. Ferner wird, wenn der Abschnitt des Dokuments, welcher zu
übersetzen ist, ein Kopierer-Benutzer-Handbuch enthält, der Ab
schnitt 74 des Kopierer-Wörterbuchs 72 verwendet. Wenn eine tech
nische Beschreibung des Kopierers zu übersetzen ist, wird der
technische Beschreibungsabschnitt 76 verwendet, welcher spezifi
sche Abschnitte 78, 80 und 82 enthält, welche Wörterbuch-Informa
tion für die Software-, Hardware- und mechanischen Merkmale des
Dokuments enthalten, welches den Kopierer beschreibt. Die Einzel
heiten des Scanner-Wörterbuchs 84 und des Printer-Wörterbuchs 86
sind nicht dargestellt; sie können jedoch in ähnlicher Weise wie
das Kopierer-Wörterbuch unterteilt sein. Ferner wird der allge
meine Wörterbuchabschnitt 78 für englisches und japanisches Voka
bular benutzt, um allgemeine Worte zu übersetzen, welche nicht
spezifisch sind oder nicht in einem der anderen Wörterbücher ent
halten sind.
Wörterbücher und Vorschriftendaten-Basen können auf der höchsten
hierarchischen Ebene in verschiedene Gebiete unterteilt werden.
Beispielsweise kann es ein Kopierer-, ein Scanner- und ein Prin
ter-Gebiet sein. Wenn Dokumente, welche übersetzt werden, in
einem dieser Gebiete enthalten sind, werden die Wörterbücher und
Vorschriften, welche benutzt werden, um die Übersetzung durchzu
führen, aus dem entsprechenden Gebiet genommen.
Die Information, die in den Wörterbüchern und in den spezifischen
Wörterbuchabschnitten enthalten ist, wird erforderlichfalls in
jeder gewünschten Weise einschließlich einer herkömmlichen Art
und Weise gespeichert. Ein wichtiges Merkmal der Erfindung liegt
darin, daß verschiedene Wörterbuch-Information in Verbindung mit
verschiedenen Abschnitten verschiedener Dokumententypen verwendet
wird. Jedoch können auch im Vergleich zu dem, was in Fig. 4 darge
stellt ist, auch andere Zusammenstellungen von Wörterbüchern be
nutzt werden. Beispielsweise können gesonderte Wörterbücher für
verschiedene Abschnitte oder verschiedene Dokumententypen verwen
det werden; es kann jedoch auch ein Wörterbuch zwischen verschie
denen Dokumententypen gemeinsam benutzt werden und es können er
forderlichenfalls verschiedene Abschnitte desselben Wörterbuchs
benutzt werden. Die verschiedenen Wörterbücher oder Abschnitte
können über die Benutzung von Zeigern oder Merkern ausgewählt
werden, die anzeigen, welches Wörterbuch zu benutzen ist. Wenn
die Wörterbücher einzurichten, zu modifizieren oder zu verwenden
sind, kann die Information in einem Wörterbuch erforderlichen
falls in ein anderes Wörterbuch kopiert werden.
Fig. 5 zeigt eine beispielhafte Anordnung einer Grammatik- und
Sprachvorschriften-Datenbasis 90, welche in dem Übersetzungs
prozeß der Erfindung verwendet wird. Die Datenbasis enthält japa
nische Grammatik- und Sprachvorschriften 92, welche Grammatik-
und Sprachregeln, die benutzt worden sind, wenn Gesellschafts-
Richtlinien übersetzt werden, und Vorschriften 94 enthalten, wenn
Benutzer-Handbücher übersetzt werden, einschließlich-Benutzer-
Handbücher, die Printer/Drucker, Scanner oder Kopierer betreffen,
die jeweils ihre eigenen Vorschriften 98, 100 bzw. 102 haben, und
sie enthält einen Abschnitt 104, der zum Übersetzen von techni
schen Dokumenten verwendet wird, einschließlich Dokumenten, die
Printer 106, Scanner 108 und Kopierer 110 betreffen. Die Datenba
sis 90 enthält auch englische Grammatik- und Sprachvorschriften
120, welche auch Vorschriften zum Übersetzen von Gesellschafts-
Richtlinien und Vorschriften 122, 124 zum Übersetzen von Benut
zerhandbüchern einschließlich Vorschriften 126, 128 und 130 zum
Übersetzen von Benutzer-Handbüchern für Printer, Scanner bzw. Ko
pierer sowie Vorschriften 132 zum Übersetzen technischer Dokumen
te, einschließlich Vorschriften 134, 136, 138 zum Übersetzen
technischer Dokumente, enthalten, welche Printer/Drucker, Scanner
und Kopierer betreffen.
Die Grammatik- und Sprachvorschriften, welche in der Datenbasis
90 gespeichert sind, sind herkömmliche Grammatik- und Sprachre
geln für maschinelles Übersetzen, und ein Fachmann weiß folglich,
wie derartige Regeln und Vorschriften gestaltet sind. Jedoch sind
die Vorschriften bei der vorliegenden Erfindung spezifisch zuge
schnitten und haben verschiedene Abschnitte oder verschiedene
spezifische Regeln, um verschiedene Teile des Dokuments zu über
setzen.
Fig. 6 erläutert eine bevorzugte Art und Weise, Information hin
sichtlich Speicherstelle und hierarchischer Struktur der Wörter
buch- und Vorschriftendaten-Basen zu speichern, so daß sie bequem
ausgewählt und von den verschiedenen Abschnitten eines Dokuments
benutzt werden können. Jede der Datenstrukturen 150A bis 150G hat
dieselbe Struktur, weshalb die einzelnen Felder der Datenstruktu
ren 150B bis 150G nicht dargestellt worden sind. Ein Schlüssel-
Feld 152 ist eine eindeutige Identifizierung für die Datenstruk
tur. Beispielsweise kann der Schlüssel einfach eine Zahl sein;
andererseits könnte er auch ein Name sein. Für die höchste hie
rarchische Ebene der Datenstruktur 150A ist es absolut nicht notwendig, einen
Schlüssel zu haben, und der Schlüssel kann gleich null einge
stellt werden. Die Datenstruktur 150A enthält einen Zeiger 154 zu
einer Elterndaten-Struktur, so daß es möglich ist, ohne weiteres
den hierarchischen Baum von Datenstrukturen zu durchwandern. Wenn
jedoch die Datenstruktur 150A auf der höchsten hierarchischen
Ebene liegt, dann hat sie keinen Elternteil, und, der Zeiger 154 in
der Elterndaten-Struktur wird gleich null gesetzt. Das Wör
terbuch, das für die Übersetzung des entsprechenden hierarchi
schen Pegels des Dokuments benutzt worden ist, ist an der Adresse
festgelegt, die in dem Zeiger zu dem Wörterbuch 156 enthalten
ist. Dementsprechend ist die Adresse der Vorschriftendatenbasis,
die zum Übersetzen des entsprechenden Abschnitts des Dokuments
verwendet worden ist, an einer Adresse angeordnet, die dem Zeiger
auf die Vorschriftendatenbasis 158 entspricht.
Ein Feld enthält einen Zeiger zu einer Schlüsselinformation 160.
Dies kann ein Zeiger auf eine Tabelle sein, die einen Schlüssel
enthält, welcher der Struktur des Schlüsselelements im Schlüsselfeld 152
entspricht, und kann ein gesondertes Feld für Eingangsinformation
sein. Beispielsweise enthält eine unten wiedergegebene Tabelle I
eine Spalte Eingangsinformation, welche den Namen eines Hinweises
beschreibt, der die Auswahl des Wörterbuchs und der Vorschrift
bewirkt, und eine Spalte, die Schlüssel enthält, die der Ein
gangsinformation entsprechen.
Die Datenstruktur 150A enthält ferner ein Feld 162, welches die
Anzahl von Kinderdaten-Strukturen aufweist. Beispielsweise ent
hält die Datenstruktur 150A vier Kinderdaten-Strukturen 150B bis 150E.
Schließlich enthält das Feld 164 eine Anordnung von Zeigern zu
den verschiedenen Kinderdaten-Strukturen 150B bis 150E.
Wenn gewünscht wird, auf eine nächst niedrigere Ebene in der Hie
rarchie zu gehen, wird ein Hinweis in dem zu übersetzenden
Dokument gelesen, welcher die Wörterbuch- und Vorschriftendaten-
Basis anzeigt, welche zu benutzen ist. Beispielsweise wird bei
Verarbeiten von Zeile 5 in Fig. 2, welche anzeigt, daß das
Dokument einen Scanner beschreibt, Tabelle I aufgesucht, um den
Eintrag Scanner zu finden, welcher einen Schlüssel 12 hat. Die
Datenstrukturen in der nächst niedrigeren hierarchischen Ebene
werden mit Hilfe der Anzahl Kinder und einer Anordnung von Zei
gern zu Kindern aufgesucht, um das Wörterbuch festzulegen, wel
ches den Schlüssel 12 hat. Auf diese Weise ist es möglich, wirk
sam eine Spur von Wörterbuch- und Vorschriftsdaten-Basisinforma
tion zu suchen, welche der hierarchischen Ebene und dem Dokumen
tentyp entspricht, der zu übersetzen ist.
Gemäß der Erfindung werden Dokumente übersetzt, welche Hinweise
von verschiedenen Abschnitte enthalten, welche hierarchische Ebe
nen des Dokuments sein können. Um für die maschinelle Überset
zungseinrichtung zu wissen, wann die Abschnitte oder hierarchi
schen Ebenen beginnen und enden, muß das zu übersetzende Dokument
einen Hinweis auf den Anfang jedes Abschnitts enthalten. Eine be
queme Art und Weise, auf die verschiedenen Abschnitte eines Doku
ments hinzuweisen, ist das Verwenden von Hinweissymbolen. Die
Hinweissymbole werden vorzugsweise entsprechend der SGML-Sprache
angeordnet; es kann jedoch auch eine andere Art und Weise benutzt
werden, die verschiedenen Abschnitte des Dokuments erforderli
chenfalls anzuzeigen. Die SGML-Hinweissymbole, welche bei der Er
findung verwendet werden, um die verschiedenen Abschnitte anzu
zeigen, müssen mit einer spezifischen Dokumententyp-Definition
(DTD) entsprechend den Vorschriften der SGML-Sprache übereinstim
men. Es ist wahrscheinlich, daß eine neue DT-Definition erzeugt
werden muß, damit die Erfindung effizient arbeitet. Es gibt be
kannte DT-Definitionen, welche vorhanden sind und ein auf diesem
Gebiet tätiger Fachmann könnte eine neue DT-Definition, die auf
den hier gegebenen Lehren basieren, ohne übermäßiges Experimen
tieren entwickeln. Eine beispielshafte SGML-Dokumententyp-Defini
tion, die wahrscheinlich bei der vorliegenden Erfindung nicht un
mittelbar benutzt werden könnte, aber zeigt, wie eine DT-Defini
tion strukturiert ist, ist die DT-Definition im Anhang E der in
ternationalen Norm ISO 8879-1986(E), die auf Seite 136 beginnt.
Fig. 7 erläutert einen Prozeß, um eine Dokumententyp-Definition zu
schaffen. Nach einem Starten wird beim Schritt 172 die Struktur
einer Anzahl von Dokumenten analysiert, welche in demselben Ge
biet liegen. Dies kann automatisch, von einer Person oder durch
eine Kombination aus einer Maschine und einer Person vorgenommen
werden. Beim Schritt 174 werden dann die gemeinsamen strukturel
len Elemente (einschließlich den semantischen) sowie eindeutige
Strukturelemente für die verschiedenen Dokumente bestimmt. Basie
rend auf den gemeinsamen Strukturelementen und eindeutigen Struk
turelementen sowie auch den semantischen Elementen wird beim
Schritt 176 eine neue Struktur festgelegt, welche eine Dokumen
tentyp-Definition (DTD) für das Gebiet ist. Beispielsweise kann
die Struktur eines Scanner beschreibenden Dokuments, wie in Fig. 1
dargestellt ist, vier Hauptabschnitte haben, nämlich die Über
sichts 32, den Hardware-Abschnitt 40, den Software-Ab
schnitt 42 und den Zusatzelemente enthaltenden Abschnitt 44. Fer
ner kann die Übersicht 32 einen Abschnitt enthalten,
welcher die Vorrichtung, eine Abbildung und eine Merkmalsliste
festlegt. Beim Schritt 178 wird dann bestimmt, ob die neue Struk
tur, welche festgelegt worden ist (z. B. die DTD) im Gebiet ge
nügt, was bedeutet, daß die Dokumente mit Hilfe der DT-Definition
dargestellt werden können. Wenn sie es nicht können, wird in dem
Ablaufdiagramm auf Schritt 176 zurückgegangen, um die DT-Defini
tion erneut zu definieren oder zu ändern. Wenn die Struktur ak
zeptabel ist und dem Gebiet genügt, wird beim Schritt 180 die
Struktur in eine SGML-Dokumententyp-Definition geschrieben, und
der Prozeß in Fig. 7 ist beendet.
Fig. 8 ist ein Datenablaufdiagramm, das die generelle Arbeitsweise
der Erfindung zeigt. In Fig. 8 und auch in dem Datenablaufdiagramm
der Fig. 16 zeigen die Kreise einen Prozeß an; die Information,
die in zwei horizontalen Linien enthalten ist, zeigt einen Daten
typ an, und die Blöcke oder Quadrate geben einen Benutzer oder
eine andere Vorrichtung an, welche eine Operation durchführt. In
dem Datenablaufdiagramm der Fig. 8 erstellt ein Dokumentenerstel
ler (creator) 202 ein Dokument mit Hilfe eines Dokumentenaufbe
reitungs-/Erstellungsprozesses 204. Eine Eingabe von dem Dokumen
tenersteller 202 wird in dem Prozeß 204 zusammen mit einer vorher
erstellten Dokumententyp-Definition 206 benutzt. Wenn bei dem
Dokumentenaufbereitungs-/Erstellungsprozeß 204 ein Problem mit dem zu erstellenden oder aufzuberei
tenden Dokument festgestellt wird, ist ein Rückkoppeln zu dem Do
kumentenersteller 202 vorgesehen. Beispiele von Problemen schlie
ßen eine Verletzung von Gesellschaftsrichtlinien und unklaren An
gaben ein. Das Ergebnis des Dokumentenaufbereitungs-/Erstellungs
prozesses 204 ist das Originaldokument 208.
Das Datenablaufdiagramm der Fig. 8 enthält einen Übersetzungs- und
Systemtrainer 210, welcher verwendet wird, um die Übersetzungs-
und Wörterbuchvorschriften zu entwickeln. Ein Wörterbuch- und
Vorschriften-Entwicklungsprozeß 210 erhält die Dokumententyp-Definition
206, das Originaldokument 208 und eine Eingabe von dem Übersetzungs- und System
trainer 210 und entwickelt die Wörterbuch- und Vorschriftendaten
basis. Das Originaldokument 208 wird in den Wörterbuch- und Vor
schriften-Entwicklungsprozeß 212 und/oder den Zuordner/Übersetzer
214 von einer Platte, einem RAM oder einem anderen Speichermedium
oder von einer Übertragungsleitung aus, wie einem Netz, oder von
einem Modem aus eingegeben. Ferner sorgt der Wörterbuch- und Vor
schriftenentwicklungsprozeß 212 für ein Rückkoppeln zu dem Über
setzungs- und Systemtrainer 210. Während des Trainings- und des
Übersetzungsprozesses benutzt erforderlichenfalls der Übersetzungs- und Systemtrainer 210
eine Wörterbuchdatenbasis 216 und eine Vorschriftendatenbasis
218, um ein übersetztes Dokument 220 zu erzeugen. Das Wörterbuch
oder die Wörterbücher und/oder Vorschriftendatenbasen, die für
den Übersetzungsprozeß verwendet worden sind, werden als Überset
zungsinformation oder Übersetzungsressourcen betrachtet. Jedoch
sind die Übersetzungsinformationen oder die Übersetzungsressour
cen nicht auf reine Wörterbücher oder Vorschriftendatenbasen be
schränkt, sondern andere Ressourcen und Informationen, welche ei
nen Übersetzungsprozeß unterstützen oder durchführen, sind eben
falls Übersetzungsinformationen oder Übersetzungsressourcen.
Das Datenablaufdiagramm enthält auch einen automatischen Zuordner/Überset
zer 214, welcher die Dokumententyp-Definition 206, das Original
dokument 208, die Wörterbuchdatenbasis 216 und die Vorschriften
datenbasis benutzt, um automatisch das übersetzte Dokument 220 zu
erzeugen. Das übersetzte Dokument wird in einem Speicher, wie
beispielsweise einer Diskette, einem RAM oder einer anderen Art
Speicher gesichert, mittels eines Printers gedruckt und/oder an
einen anderen Computer über ein Netz, ein Modem oder eine andere
Übertragungsleitung abgegeben und/oder auf einem Printer ge
druckt.
Fig. 9A bis 9C und 10 veranschaulichen einen Prozeß, welcher dem
Wörterbuch- und Vorschriftenentwicklungsprozeß 212 entspricht,
der in Fig. 8 dargestellt ist. Dieser Prozeß wird benutzt, um
nicht nur das Wörterbuch und Vorschriften zu entwickeln, sondern
wird auch dazu verwendet, einen Übersetzungsprozeß durchzuführen.
Nach einem Starten in Fig. 9A wird beim Schritt 230 der nächste
Token des zu übersetzenden Dokuments gelesen. Wenn gerade erst
gestartet worden ist, ist dies der erste Token des Dokuments, der
ein Hinweis oder ein Abschnitt von zu übersetzenden Daten sein
kann. Beim Schritt 232 wird dann bestimmt, ob der Token ein Hin
weis ist. Wenn dies der Fall ist, wird im Ablaufdiagramm auf den
Schritt 234 übergegangen, bei welchem bestimmt wird, ob der Token
ein Starthinweis ist. Wenn festgestellt wird, daß der Token ein
Starthinweis ist, wird beim Schritt 240 festgestellt, ob die vor
herige hierarchische Ebene des Dokuments ohne einen Endhinweis
endete. Wie vorstehend bereits erläutert, kann ein Endhinweis
weggelassen werden, und das Ende eines bestimmten Hinweises kann
automatisch gefühlt werden, wenn die Dokumententyp-Definition be
kannt ist. Wenn folglich beim Schritt 240 festgestellt wird, daß
die vorher hierarchische Ebene ohne einen Endhinweis geendet hat,
wird Schritt 242 durchgeführt, welcher auf eine hierarchische
Ebene oder mehrere hierarchische Ebenen geht, da der Starthin
weis, auf den gerade gestoßen worden ist, bedeutet, daß ein vor
heriger Hinweis oder mehrere Hinweise geendet haben. Wenn die
Feststellung beim Schritt 240 negativ ist oder nach dem Durchfüh
ren des Schrittes 244 geht das Ablaufdiagramm beim dem in Fig. 9B
dargestellten Prozeß weiter.
In Fig. 9B wird beim Schritt 248 der Starthinweis verarbeitet, um,
wenn überhaupt, die Attribute des Starthinweises festzulegen
(siehe beispielsweise Zeilen 4, 10, usw. von Fig. 2). Beim Schritt
250 wird der Prozeß aufgerufen, sich eine hierarchisches Ebene
nach unten zu bewegen, welche in Fig. 10 dargestellt ist. Das zu
übersetzende Dokument wird dann in verschiedenen hierarchischen
Ebenen angeordnet, und wenn eine neue hierarchische Ebene aufge
treten ist, welche durch einen neuen Starthinweis angezeigt wird,
ist es notwendig, die Datenstrukturen, wie beispielsweise die in
Fig. 6 dargestellten Datenstrukturen einzustellen, so daß die
richtige Wörterbuch- und Vorschriftendatenbasis, falls es erfor
derlich ist, geschaffen und benutzt werden.
In Fig. 10 wird nach dem Start beim Schritt 280 festgestellt, ob
es das erste Mal ist daß diese ganz bestimmte hierarchische Ebene
und strukturelle Hinweise zu verwenden sind. Wenn beispielsweise
der Hinweis niemals verwendet worden ist, sind die Datenstruktu
ren zum Speichern der hierarchischen Information erzeugt worden,
welche die Wörterbücher und Vorschriften anzeigt, welche zu ver
wenden sind, wie beispielsweise die in Fig. 6 dargestellten Daten
strukturen. Wenn die hierarchische Ebene oder der Hinweis vorher
verwendet worden sind, sollte die neue Datenstruktur nicht redun
dant zugeordnet werden, wenn sie vorher zugeordnet worden ist.
Beim Schritt 280 wird festgestellt, ob dies das erste Mal ist,
daß die hierarchische Ebene zu verwenden ist, und eine Daten
struktur zum Speichern von Information eines Wörterbuchs und von
Übersetzungsvorschriften, wie beispielsweise die in Fig. 6 darge
stellte Datenstruktur 150A wird zugeordnet. Beim Schritt 284 wer
den die Felder dieser erzeugten Datenstruktur initialisiert, um
die notwendige Information zu erhalten. Beispielsweise muß eine
eindeutige Identifikation für das Schlüsselfeld 152 erzeugt werden;
der Zeiger zu dem Wörterbuch 156 und der Zeiger zu der Vorschrif
tendatenbasis 158 müssen gesetzt werden; die neue Wörterbuch- und
Vorschriftendatenbasis, welche benutzt werden, müssen erzeugt
oder kopiert werden, und der Zeiger zu der Schlüsselinformation
160 muß initialisiert werden, um in der Zukunft den Schlüssel be
stimmen zu können. Auch ist es notwendig, die Tabelle zu aktuali
sieren, welche den Schlüssel und die Schlüsselinformation ent
hält. Ferner muß der Zeiger auf den Elternteil 154 eingestellt
werden, um auf die Elterndatenstruktur in der nächst höheren
hierarchischen Ebene zu zeigen; die Anzahl Kinder ist null zu
setzen, und die Zeigeranordnung zu den Kindern ist auf null zu
stellen, wenn es zu diesem Zeitpunkt keine Kinder für die gerade
erzeugte Datenstruktur gibt. Beim Schritt 286 muß die Elternda
tenstruktur aktualisiert werden, so daß die Anzahl Kinder und die
Anordnung von Zeigern auf die Kinder genau das Erstellen des
neuen Wörterbuchs reflektieren.
Wenn beim Schritt 280 festgestellt wird, daß dies nicht das erste
Mal ist, daß die hierarchische Ebene verwendet wird, wird beim
Schritt 288 die Schlüsselinformation von dem Hinweissymbol aus
erhalten. Sobald die Schlüsselinformation bekannt ist, kann der
Schlüssel mit Hilfe einer Tabelle, wie beispielsweise der Tabelle
I, gefunden werden. Beim Schritt 290 wird dann die Datenstruktur
gefunden, die der Schlüsselinformation entspricht, welche die Da
tenstruktur mit dem Schlüssel ist, welcher der Schlüsselinforma
tion entspricht. Diese Datenstruktur wird als die derzeit gültige
Datenstruktur gesetzt, die für den Übersetzungsprozeß des derzeit
gültigen Hinweises verwendet worden ist. Von den Schritten 290
und 286 kehrt das Ablaufdiagramm auf den Aufrufprozeß zurück,
welcher in diesem Fall ein Zurück auf den Schritt 252 in Fig. 9B
ist.
Beim Schritt 252 der Fig. 9B wird festgestellt, ob der Hinweis
eine direkte Übersetzung hat. Wenn der Hinweis nicht eine direkte
Übersetzung hat, ist es nicht notwendig, das Hinweissymbol zu
übersetzen, wenn es dem Benutzer niemals angezeigt wird. Das Hin
weissymbol kann für Dokumentenstrukturierzwecke verwendet werden,
wird aber nicht tatsächlich angezeigt und folglich ist es nicht
von Bedeutung, für welche Sprache der Hinweis ist, solange der
Prozeß, der verwendet worden ist, um das Dokument darzustellen,
die Form des Hinweises erkennt. Wenn der Hinweis nicht eine
direkte Übersetzung hat, kehrt das Ablaufdiagramm auf den Aufruf
prozeß zurück. Anschließend kann der Prozeß der Fig. 9A wiederholt
werden, um den nächsten Token des Dokuments zu lesen.
Wenn beim Schritt 252 in Fig. 9B festgestellt wird, daß das Hin
weissymbol eine direkte Übersetzung hat, wird das Hinweissymbol
mit Hilfe des Wörterbuchs und von Vorschriften der aktuellen
hierarchischen Ebene übersetzt. Andererseits kann die Übersetzung
des Hinweises in einer Tabelle festgelegt sein, die der DT-Defi
nition zugeordnet ist, und kann mit Hilfe dieser Tabelle einfach
Eins-zu-Eins übersetzt werden. Als eine weitere Alternative kann
die Übersetzung des Hinweises von einer vorherigen Übersetzung
des Dokuments erhalten werden und dazu verwendet werden, das Sy
stem zu trainieren. Als nächstes wird beim Schritt 256 das Hin
weissymbol in dessen Originalsprache und auch die Übersetzung des
Hinweissymbols angezeigt. Dies entspricht der Darstellung der in
Fig. 3 dargestellten Abschnitte 56A und 56B. Beim Schritt 258 wird
der Benutzer gefragt, ob es gewünscht wird, die Übersetzung zu
ändern. Wenn die Übersetzung zu ändern ist, werden das Wörterbuch
und die Vorschriften erforderlichenfalls aktualisiert, um bei zukünftigen
Übersetzungen den Wunsch des Benutzers zu reflektieren.
Das Ablaufdiagramm kehrt dann auf den Aufrufprozeß zurück, um mit
Hilfe weiterer Information, die in dem Dokument enthalten ist, zu
übersetzen und zu trainieren.
In Fig. 9A wird, wenn beim Schritt 234 festgestellt wird, daß das
zu verarbeitende Token nicht ein Starthinweis ist, beim Schritt
256 bestimmt, ob der Token ein Endhinweis ist. Wenn dies nicht
der Fall ist, wird ein Fehler angezeigt, da der Token entweder
ein Start- oder ein Endhinweis sein muß, da beim Schritt 232
festgestellt worden ist, daß der Token ein Hinweissymbol ist.
Wenn beim Schritt 236 festgestellt wird, daß der Token ein End
hinweis ist, wird beim Schritt 238 die in Fig. 6 dargestellte hie
rarchische Struktur eingestellt, so daß die entsprechende Daten
struktur für zukünftige Übersetzungen verwendet wird. Durch ein
Bewegen auf eine hierarchische Ebene oder mehrere hierarchische
Ebenen des Dokuments wird dann die nächste höchste Datenstruktur
in Richtung zu dem oberen Ende der Seite in Fig. 6 ausgewählt.
Wenn ein Endhinweis (oder dessen Weglassen) anzeigt, daß mehr als
eine hierarchische Ebene geendet hat, wird die entsprechende An
zahl hierarchischer Ebenen nach oben gegangen. Das Ablaufdiagramm
kehrt dann auf den Aufrufprozeß zurück und kann zusätzliche In
formationen, die in dem Dokument enthalten ist, wenn es vorhanden
ist, zum Trainieren und Übersetzen verwenden, indem der Prozeß
von Fig. 9A bis 9C wiederholt wird.
Wenn beim Schritt 232 festgestellt wird, daß der Token nicht ein
Hinweissymbol ist, muß der Token Daten sein, und das Ablaufdia
gramm geht bei dem in Fig. 9C dargestellten Prozeß A weiter. In
Fig. 9C wird beim Schritt 264 festgestellt, wenn die Daten die
Hierarchie manipulieren. Ein Beispiel für die Daten, welche die
Hierarchie manipulieren, kann in Zeile 5 von Fig. 2 gesehen wer
den, wo die Daten ein "Scanner" sind. Die Daten "Scanner" zeigen
an, daß die Hierarchie, welche zu verwenden ist, für das Scanner
gebiet ist. Wenn die Daten die Hierarchie manipulieren, geht das
Ablaufdiagramm auf Schritt 266 über, was bewirkt, daß der Prozeß
auf eine hierarchische Ebene heruntergeht, welche mit Hilfe des
Prozesses von Fig. 10 durchgeführt wird. Fig. 10 ist bereits bezüglich
des Schrittes 250 in Fig. 9B erläutert worden, so daß er hier
nicht wieder erläutert wird, um dadurch Redundanz zu vermeiden.
Von dem Schritt 260 aus, oder wenn die Daten die Hierarchie nicht
manipulieren, wird der Originalsatz, welcher zu übersetzen ist,
beim Schritt 268 hervorgehoben (beispielsweise wenn er in einer
Weise angezeigt wird, wie in Fig. 3 dargestellt ist, und dadurch
hervorgehoben wird). Eine Übersetzung des hervorgehobenen Satzes
wird ebenfalls mit Hilfe des Wörterbuchs und Vorschriften der ak
tuellen hierarchischen Ebene beim Schritt 270 angezeigt. Dies
läuft darauf hinaus, daß das Original und die übersetzte Informa
tion unmittelbar nebeneinander angezeigt werden, wie die in Fig. 3
dargestellten Bereichen 58A und 58B.
Beim Schritt 272 wird dann festgestellt, ob der Benutzer wünscht,
die Übersetzung zu ändern. Wenn der Benutzer dies nicht will,
kehrt das Ablaufdiagramm zurück, so daß zusätzliche Information
in dem Originaldokument übersetzt werden kann. Wenn der Benutzer
wünscht, die Übersetzung zu ändern, gibt der Benutzer die kürz
lich übermittelte Information beim Schritt 274 ein, und das Ori
ginal und die vorher übersetzten Sätze werden analysiert, um die
Unterschiede zwischen der Übersetzung, die von dem Benutzer ge
wünscht worden ist, und der automatisch durchgeführten Überset
zung festzustellen. Anschließend werden das Wörterbuch und die
Vorschriften der aktuellen hierarchischen Ebene beim Schritt 276
aktualisiert, so daß zukünftige Übersetzungen derselben oder ähn
licher Ausdrücke bzw. Redewendungen zu der gewünschten Überset
zung führen. Der Prozeß in Fig. 9C kehrt dann auf den Aufrufprozeß
zurück.
Zu beachten ist, daß, wenn ein Wörterbuch und Übersetzungsregeln
nicht vorhanden oder nicht vollständig sind, wenn der Schritt 270
durchgeführt wird, um eine vollständige oder entsprechende Über
setzung durchzuführen, es nicht wesentlich ist, daß die Überset
zung dargestellt wird, sondern es kann eine Anzeige gegeben wer
den, daß eine ausreichende Information nicht vorhanden ist, die
Übersetzung durchzuführen. Ferner wird, wenn der Trainingsprozeß
des Übersetzers mit Hilfe eines zu übersetzenden Originalsdoku
ments und einer vorher angefertigten Übersetzung des Dokuments
durchgeführt wird, beim Schritt 270 die vorher angefertige Über
setzung angezeigt, und wenn der Benutzer die Übersetzung nicht
ändern will, werden das Wörterbuch und die Vorschriften der ak
tuellen hierarchischen Ebene überprüft und erforderlichenfalls
geändert, damit zukünftige automatische Übersetzungen des Origi
naldokuments auf eine Übersetzung hinauslaufen, welche dieselbe
ist wie die vorher durchgeführte Übersetzung.
Während des Trainierens, das mittels der Ablaufdiagramme der
Fig. 9A bis 10 durchgeführt worden ist, kann eine Datenstruktur,
wie sie in Fig. 6 dargestellt ist, für jedes Hinweissymbol oder
für jede der verschiedenen hierarchischen Ebenen des Dokuments
geschaffen werden. Dies kann zu einer sehr großen Anzahl von Da
tenstrukturen und entsprechenden Wörterbüchern und Vorschriften
datenbasen führen. Um jedoch die Anzahl Datenstrukturen 150 und
die Anzahl an Wörterbüchern und Vorschriftendatenbasen zu verrin
gern, werden gemäß der Erfindung, falls es gewünscht wird, die
verschiedenen Wörterbücher und die Vorschriftendatenbasen mitein
ander verglichen, um die Ähnlichkeiten zu sehen. Wenn Ähnlichkei
ten gefunden werden, können die Datenstrukturen und/oder die Wör
terbücher oder Vorschriftendatenbasen zusammengelegt oder verein
igt werden. Es ist auch möglich, die Wörterbücher und die Vor
schriftendatenbasen einfach zu kombinieren, um deren Anzahl zu
verringern. Die Kombination der verschiedenen Wörterbücher
und/oder Vorschriftendatenbasen kann auch vorzuziehen sein, wenn
man eine geringe Anzahl von Einträgen erhält, welche sich nicht
widersprechen oder sich nicht von anderen Übersetzungsressourcen
unterscheiden. Durch Kombinieren der Wörterbücher kann die Anzahl
an Wörterbüchern und Vorschriftendatenbasen und/oder die Anzahl
an Datenstrukturen verringert werden, die verwendet werden, um
die Wörterbücher zu verfolgen. Ein Reduzieren von Wörterbüchern
und Vorschriften erlaubt es auch, die hierarchischen Strukturen
zu konsolidieren und zu vereinfachen. Es ist jedoch nicht notwen
dig, die verschiedenen Übersetzungsressourcen einschließlich der
Datenstrukturen zu kombinieren, wenn dies nicht gewünscht wird.
Durch Verwenden einer spezifischen Wörterbuchinformation und von
Vorschriften für die verschiedenen Abschnitte des Dokuments wird
die Übersetzung genauer und kommt einer Eins-zu-Eins-Entsprechung
zwischen dem Quellendokument und dem übersetzten Dokument ohne
Belastungen und Schwierigkeiten näher, welche sich durch das Ver
wenden von Übersetzungssystemen ergeben, welche auf das Benutzen
stereotyper Redewendungen beschränkt sind.
In Fig. 11 ist ein Prozeß dargestellt, welcher von dem automati
schen Übersetzer 214 der Fig. 8 durchgeführt wird. Nach dem Star
ten wird beim Schritt 294 die Dokumententyp-Definition (DTD) ge
lesen, welche die zulässige Struktur des Dokuments festlegt. Beim
Schritt 296 wird dann der nächsten Token des Dokuments gelesen,
welcher zu übersetzen ist. Dieser Token ist entweder ein Hinweis
symbol oder zu übersetzende Daten. Beim Sehritt 298 wird festge
stellt, wenn das Ende des Dokuments erreicht worden ist. Wenn
dies der Fall ist, endet der automatische Übersetzungsprozeß.
Wenn das Ende nicht erreicht worden ist, wird beim Schritt 300
festgestellt, ob der Token ein Hinweissymbol ist. Wenn er nicht
ein Hinweissymbol ist, entspricht der Token Daten und der Token
wird mit Hilfe des aktuellen Wörterbuchs und der Vorschriftsda
tenbasis übersetzt, welche mit Hilfe der aktuellen Datenstruktur,
wie beispielsweise eine der in Fig. 6 dargestellten Datenstruktu
ren, bestimmt wird. Wenn der Token ein Hinweissymbol ist, geht
das Ablaufdiagramm von dem Schritt 300 auf den Schritt 304 über,
bei welchem das Hinweissymbol einen in Fig. 12 dargestellten Pro
zessor aufruft.
In Fig. 12 wird beim Schritt 310 bestimmt, wenn eine direkte Über
setzung des Hinweissymbols benötigt wird. Eine direkte Überset
zung des Hinweissymbols wird benötigt, wenn das übersetze Hin
weissymbol in dem Dokument dargestellt wird und nicht einfach für
Dokumenten-Strukturierprozesse ist. Wenn eine Übersetzung benö
tigt wird, wird beim Schritt 312 festgestellt, ob die direkte
Übersetzung vorhanden ist. Wenn dies der Fall ist, wird der Hin
weis mit Hilfe des aktuellen Wörterbuchs und der Vorschriftsda
tenbasis übersetzt. Wenn eine direkte Übersetzung nicht vorhanden
ist, wird eine Übersetzung nicht durchgeführt, wenn die notwendi
ge Information nicht vorhanden ist. Zu diesem Zeitpunkt kann eine
Fehlermeldung dem Benutzer erforderlichenfalls dargestellt wer
den, die anzeigt, daß eine direkte Übersetzung nicht existiert.
Beim Schritt 316 wird bestimmt, ob das Hinweissymbol in der rich
tigen Folge der DT-Definition lokalisiert wird. Wenn dies nicht
der Fall ist, wird eine Fehlerbehandlungs-Routine bei dem Schritt
318 aufgerufen; dann endet der Prozeß. Als nächstes wird beim
Schritt 320 der Hierarchie-Prozessor, welcher in Fig. 13 darge
stellt ist, zusammen mit der notwendigen Hinweisinformation auf
gerufen.
In Fig. 13, welche den Hierarchie-Prozessor darstellt, wird beim
Schritt 330 festgelegt, wenn eine höhere hierarchische Ebene in
dem Dokument zu verarbeiten ist. Wie in Fig. 6 dargestellt, liegt
eine höhere hierarchische Ebene näher bei dem oberen Ende der Ab
bildung. Wenn eine höhere hierarchische Ebene nicht zu übersetzen
ist, was bedeutet, daß der Prozeß in der Hierarchie tiefer wei
tergeht, geht das Ablaufdiagramm auf den Schritt 322 über, wel
cher (wenn überhaupt) die neue hierarchische Ebene festlegt, wel
che zu verwenden ist. Als ein Beispiel für den Hinweis <DEVTYPE<,
welcher in Zeile 5 von Fig. 2 enthalten ist, zeigt das Hinweissym
bol an, daß die hierarchische Ebene zu ändern ist, und die Daten
"Scanner", welche folgen zeigen an, daß die hierarchische Ebene
für den Scanner gilt. Die Schlüsselinformation wird gesucht, um
einen dem Scanner entsprechenden Schlüssel zu finden. Sobald der
Schlüssel festgelegt ist, werden die Datenstrukturen gesucht, um
eine Datenstruktur mit einem entsprechenden Schlüssel zu finden.
Ein entsprechender Prozeß wird auch durchgeführt, bei welchem der
Hinweis allein die Schlüsselinformation anzeigt, welche zu suchen
ist. Es ist möglich, daß das Hinweissymbol nicht anzeigt, daß
eine neue hierarchische Ebene vorhanden ist. Anschließend wird
der neue Schlüssel oder eine Anzeige, Schlüssel nicht ändern zu
rückgegeben.
Wenn beim Schritt 320 festgestellt wird, daß die neue Datenstruk
tur, die für ein Verfolgen von Übersetzungsinformation oder
-ressourcen einschließlich Wörterbüchern und Vorschriften verwen
det worden ist, in der Hierarchie höher liegt, wird beim Schritt
334 mit Hilfe der Hinweis- und Dokumenten-Hierarchie-Information,
die Anzahl hierarchischer Ebenen bestimmt, die hinaufzugehen ist.
Anschließend wird auf die Anzahl Ebenen zurückgegangen, um in der
Hierarchie hinaufzugehen. Es ist auch möglich, daß, wenn auf den
Starthinweis getroffen wird, wobei der entsprechend Endhinweis
weggelassen ist, das System zuerst die Schritte 330 und 334
durchführt, um in der Hierarchie hinaufzugehen, und dann die
Schritte 330 und 332 durchführt, um in der Hierarchie nach unten
zu gehen. Der Prozeß in Fig. 12 und 13 endet dann.
Gemäß der Erfindung kann auf einem Universalrechner gearbeitet
werden, welche entsprechend den Lehren der Erfindung programmiert
ist oder es kann ein anderer Gerätetyp verwendet werden, wie bei
spielsweise ein spezieller Computer. Ein Computer, der bei der
Erfindung verwendbar ist, ist eine Workstation, beispielsweise
eine Workstation 348. Die Workstation 348 weist eine Zentralein
heit (CPU) 350, einen RAM 352, einen ROM 354 zum Speichern von
Programminformation und eine Eingabesteuereinheit 356 auf, die
mit einem Tastenfeld 358 und einer Maus 360 verbunden ist. Ferner
ist ein Printerinterface 364 vorgesehen, welches einen Prin
ter/Drucker steuert, wie einen Printer, der Videosteuersignale
benutzt. Ein Systembus 366 verbindet die verschiedenen Elemente,
die in der Workstation 348 enthalten sind. Es gibt eine Disket
tensteuereinheit 372, die mit einem Diskettenlaufwerk 370 und
einem Festplattenlaufwerk 368 verbunden ist. Eine Datenübertra
gungssteuerung 374 ist mit einem Netz 375 verbunden, welches ein
Ethernet-Netz sein kann. Eine Ein/Ausgabe-Steuereinheit 376 ist
mit einem Festplattenlaufwerk 380, wie beispielsweise einem ex
ternen Festplattenlaufwerk, über einen SCSI-Bus verbunden. Ebenso
ist mit der Ein-/Ausgabe-Steuereinheit 376 ein Printer/Drucker
378 verbunden, welcher über eine RS-232-Verbindung oder als Al
ternative hierzu durch einen Parallelanschluß angeschlossen ist.
Die Workstation enthält auch eine Display-Steuereinheit 382, wel
che mit einer Kathodenstrahlröhre (CRT) 384 oder einer anderen
Anzeigevorrichtung verbunden ist.
In Fig. 15 sind die Software-Komponenten dargestellt, die bei der
Erfindung benutzt werden. Ein Systemsteuermodul 402 wird verwen
det, um den Betrieb und die Verbindung jeder der Software-Kompo
nenten zu steuern. Ein SGML-Parser wird verwendet, um das Origi
naldokument zu bestimmen. Zusätzlich zu dem SGML-Parser 404 ist
auch ein Originalsprachen-Parser/Syntax-Analysierer 422 und ein
Zielsprachen-Parser/Syntax-Analysierer 418 vorgesehen. Ein Wör
terbuch-Manager verwaltet eine Vielzahl von Wörterbüchern, die
gemäß der Erfindung verwendet werden und dementsprechend verwal
tet ein Übersetzungsvorschriften-Manager die verschiedenen Über
setzungsvorschriften-Datenbasen, die von der Erfindung benutzt
werden. Das Management, das von diesen Managern durchgeführt
wird, schließt auch ein Überwachen der Zuordnung zwischen Syntax
und Semantik ein, die der DT-Definition zugeordnet ist. Ein Voka
bular-Ersteller 408 erstellt das Vokabular von Wortpaaren aus den
Original- und Zielsprachen. Der Zielsprachenteil dieses Paars
kann eine verknüpfte Liste sein, um eine Vielzahl Worte zu behan
deln, die einem einzigen Originalwort zugeordnet sind. Jedes Wör
terbuch kann entsprechend aufgebaut werden, um einen Zeiger zu
den Paaren zu enthalten, da verschiedene Wörterbücher dieselben
Wörter gemeinsam nutzen. Der Ersteller 410 der Wörterbuchauswahl
vorschrift und der Ersteller 420 der Sprachenübersetzungsvor
schrift schaffen die Regeln, die verwendet werden, um die Über
setzungen entsprechend den hier beschriebenenprozessen durchzu
führen. Ein Eingabemanager 412 und ein Display-Manager 414 verar
beiten die jeweiligen Wechselwirkungen mit einem Benutzer.
Fig. 16 veranschaulicht ein anderes Datenablaufdiagramm der Erfin
dung, das während des automatischen Übersetzungsprozesses verwen
det wird. In diesem Diagramm liest der SGML-Prozessor 456 das
Originaldokument 454 zusammen mit der DT-Definition 452 und er
zeugt eine Dokumentenhierarchie-Information 458 und trennt die
Hinweise 460 und die Daten 462 des Originaldokuments 454. Ein Ge
bietsabbildungsprozeß 464 liest die Hinweise und Daten und er
zeugt einen Gegenstandsbereich 466. Das Gegenstandsgebiet zeigt
beispielsweise an, ob die Gegenstandssache des zu übersetzenden
Dokuments für einen Scanner, einen Printer/Drucker oder ein tech
nisches Dokument für ein Benutzerhandbuch oder andere Gegen
standsgebiete ist. Die Gebiete können auch erforderlichenfalls
schmaler sein. Der Übersetzungs-Vorschriften-Manager 468 benutzt
die Dokumentenhierarchie-Information 458, die Hinweise 460, den
Gegenstandsbereich 466 und die Daten 462, um eine Auswahlvor
schrift(n) 472 zu erzeugen, welche das spezifische Wörterbuch und
Übersetzungsvorschriften anzeigt, welche zu benutzen sind. Ein
Auswahlprozeß 476 erhält die Auswahlvorschrift 472 und wählt die
entsprechende Wörterbuchinformation und die Übersetzungsvor
schriftinformation von der Wörterbuchdatenbasis 470 und der Über
setzungsvorschriften-Datenbasis 474 aus, um die Wörterbuch- und
Übersetzungsvorschriften zu erzeugen (oder zu kopieren oder zu
benutzen), welche von dem Übersetzer 480 benutzt werden. Der
Übersetzer 480 liest die Hinweise 460 des Dokuments, die Daten
462 des Dokuments und die Wörterbuch- und Übersetzungsvorschrif
ten 478, welche ausgewählt worden sind, um das übersetzte
Dokument 482 entsprechend dem erfindungsgemäßen Prozeß zu erzeu
gen.
Nachdem die Erfindung richtig trainiert ist und arbeitet, um den
Übersetzungsvorgang durchzuführen, kann das eingegebene Original
sprachen-Dokument mit Hilfe der Wörterbuch-Datenbasis und der
Übersetzungssvorschriften analysiert werden, so daß unklare Ein
gaben in Zweifel gezogen werden. Wenn beispielsweise das automa
tische Übersetzungssystem Schwierigkeiten beim Übersetzen eines
Dokumentes hat, kann eine Nachricht dargestellt werden, die an
zeigt, daß das Originalsprachen-Dokument einige Fehler haben
kann. Es gibt viele Japaner, die japanische Sprachdokumente er
zeugen, die schwierig zu übersetzen sind. Ein Grund für diese
Schwierigkeit liegt darin, daß die japanische Bedeutung selbst
nicht klar ist. Wenn die Bedeutung in der Originalsprache nicht
klar ist, ist es schwierig oder unmöglich, ein Gerät zu benutzen,
um eine klare Übersetzung zu schaffen. Durch Analysieren des ein
gegebenen Dokuments kann der Urheber des Dokuments oder eine an
dere Person von dem Problem informiert werden und/oder er(sie)
kann gefordert werden, daß Ursprungsdokument deutlicher zu ma
chen.
Die Erfindung kann bequem mit Hilfe eines herkömmlichen digitalen
Universalrechners oder Mikroprozessors durchgeführt werden, der
entsprechend den Lehren der vorliegenden Beschreibung program
miert ist, was für den Fachmann auf dem Gebiet der Computertech
nik offensichtlich ist. Ein entsprechendes Software-Codieren kann
ohne weiteres von versierten Programmierern auf der Basis der
Lehre der vorstehenden Beschreibung aufbereitet werden. Die Er
findung kann auch durch das Aufbereiten von anwendungsspezifi
schen integrierten Schaltungen oder durch Anschließen an ein ent
sprechendes Netz aus herkömmlichen Komponentenschaltungen ausge
führt werden.
Die Erfindung ist beschrieben worden, indem Hinweise bzw. Hin
weissymbole verwendet werden, um die verschiedenen Abschnitte des
Dokuments anzuzeigen, welche verschiedene Übersetzungsressourcen
benutzen. Wenn jedoch die Computerleistungen stärker werden und die
Software komplexer wird, ist es möglich, statt Hinweise zu ver
wenden, um verschiedene Abschnitte eines Dokuments zu markieren,
daß die verschiedenen Abschnitte von Dokumenten oder verschiedene
Dokumententypen automatisch basierend auf einem darin enthaltenen
Inhalt festgelegt werden. Beispielsweise können Worte oder Rede
wendungen, die in dem Dokument enthalten sind, analysiert werden,
um einen Abschnittstyp zu bestimmen, welcher in dem Quellendoku
ment enthalten ist. Die Erfindung enthält ein Computerprogramm
produkt, welches ein Speichermedium einschließlich Befehlen ist,
die verwendet werden können, um einen Computer zu programmieren,
um einen Prozeß gemäß der Erfindung durchzuführen. Das Speicher
medium kann, ohne hierauf beschränkt zu sein, einen Diskettentyp
einschließlich Floppy Disk, Bildplatten, CD-ROMs und magneto-op
tische Platten, ROMs, RAMs, EPROMs, EEPROMs, magnetische oder op
tische Karten oder jede Art von Medium sein, das geeignet ist,
elektronische Befehle zu speichern.
Claims (29)
1. Verfahren zum Übersetzen eines Dokuments aus einer ersten
Sprache in eine zweite Sprache, welches die Schritte aufweist:
Eingeben eines Dokuments, welches in einer ersten Sprache abge faßt ist;
Analysieren von Information, die in dem Dokument enthalten ist und Erzeugen eines Analyseergebnisses;
Auswählen einer Übersetzungsressource entsprechend dem Analyseer gebnis, welche zum Übersetzen des Dokuments verwendet wird, und
Übersetzen des Dokuments aus der ersten Sprache in eine zweite Sprache mit Hilfe der Übersetzungsressource, welche ausgewählt worden ist.
Eingeben eines Dokuments, welches in einer ersten Sprache abge faßt ist;
Analysieren von Information, die in dem Dokument enthalten ist und Erzeugen eines Analyseergebnisses;
Auswählen einer Übersetzungsressource entsprechend dem Analyseer gebnis, welche zum Übersetzen des Dokuments verwendet wird, und
Übersetzen des Dokuments aus der ersten Sprache in eine zweite Sprache mit Hilfe der Übersetzungsressource, welche ausgewählt worden ist.
2. Verfahren nach Anspruch 1, bei welchem
der Schritt Auswählen der Übersetzungsressource ein Auswählen ei ner ersten Übersetzungsressource für einen ersten Teil eines Do kuments und ein Auswählen einer zweiten Übersetzungsressource für einen zweiten Teil des Dokuments einschließt, und
der Schritt Übersetzen ein Übersetzen des ersten Teils des Doku ments mit Hilfe der ersten Übersetzungsressource und Übersetzen des zweiten Teils des Dokuments mit Hilfe der zweiten Überset zungsressource einschließt.
der Schritt Auswählen der Übersetzungsressource ein Auswählen ei ner ersten Übersetzungsressource für einen ersten Teil eines Do kuments und ein Auswählen einer zweiten Übersetzungsressource für einen zweiten Teil des Dokuments einschließt, und
der Schritt Übersetzen ein Übersetzen des ersten Teils des Doku ments mit Hilfe der ersten Übersetzungsressource und Übersetzen des zweiten Teils des Dokuments mit Hilfe der zweiten Überset zungsressource einschließt.
3. Verfahren nach Anspruch 1, bei welchem
der Schritt Analysieren ein Analysieren einer strukturellen In
formation einschließt, die in dem Dokument enthalten ist.
4. Verfahren nach Anspruch 1, bei welchem
der Schritt Analysieren ein Analysieren von Hinweisen umfaßt, die
in dem Dokument enthalten sind.
5. Verfahren nach Anspruch 4, bei welchem der Schritt Analysieren
ein Analysieren von SGML-Hinweisen einschließt, die in dem
Dokument enthalten sind.
6. Verfahren nach Anspruch 1, bei welchem der Schritt, Auswählen
der Übersetzungsressource, ein Auswählen einer Wörterbuchinforma
tion umfaßt, welche zum Übersetzen des Dokuments verwendet wird.
7. Verfahren nach Anspruch 1, bei welchem der Schritt, Auswählen
der Übersetzungsressource, ein Auswählen einer Vorschrifteninfor
mation umfaßt, welche zum Übersetzen des Dokuments verwendet
wird.
8. Verfahren nach Anspruch 1, bei welchem der Schritt, Auswählen
der Übersetzungsressource, ein Auswählen einer Wörterbuchsinfor
mation und einer Vorschrifteninformation einschließt, welche zum
Übersetzen des Dokuments verwendet werden.
9. Verfahren nach Anspruch 1, bei welchem der Schritt Auswählen
ein Auswählen einer Datenstruktur umfaßt, welche eine Stelle der
Übersetzungsressource festlegt, die zum Übersetzen des Dokuments
verwendet worden ist.
10. Verfahren nach Anspruch 1, bei welchem der Schritt Analysie
ren ein Analyseergebnis schafft, das einen Schlüssel einschließt,
welcher die Datenstruktur anzeigt, welche eine Stelle der Über
setzungsressource festlegt, die zum Übersetzen verwendet wird,
und
der Schritt Auswählen ein Auswählen der Datenstruktur umfaßt,
welche den Schlüssel enthält, welcher eine Stelle der Überset
zungsressourcen festlegt, die zum Übersetzen des Dokuments ver
wendet worden ist.
11. Verfahren nach Anspruch 1, bei welchem ein Abschnitt des Do
kuments, welcher in der ersten Sprache abgefaßt ist, und ein ent
sprechender Abschnitt des Dokuments, welcher in die zweite Spra
che übersetzt worden ist, gleichzeitig dargestellt werden.
12. Verfahren nach Anspruch 1, bei welchem der Abschnitt des Do
kuments, welcher in die zweite Sprache übersetzt worden ist, nach
dem Darstellen geändert wird.
13. System zum Übersetzen eines Dokuments von einer ersten Spra
che in eine zweite Sprache mit
einer Einrichtung zum Analysieren von Information, die in dem Dokument enthalten ist, und zum Erzeugen eines Analyseergebnis ses;
einer Einrichtung zum Auswählen einer Übersetzungsressource ent sprechend dem Analyseergebnis, welches zum Übersetzen des Doku ments verwendet wird, und
eine Einrichtung zum Übersetzen des Dokuments von der ersten Sprache in eine zweite Sprache mit Hilfe der Übersetzungsressour ce, welche ausgewählt worden ist.
einer Einrichtung zum Analysieren von Information, die in dem Dokument enthalten ist, und zum Erzeugen eines Analyseergebnis ses;
einer Einrichtung zum Auswählen einer Übersetzungsressource ent sprechend dem Analyseergebnis, welches zum Übersetzen des Doku ments verwendet wird, und
eine Einrichtung zum Übersetzen des Dokuments von der ersten Sprache in eine zweite Sprache mit Hilfe der Übersetzungsressour ce, welche ausgewählt worden ist.
14. System nach Anspruch 13, bei welchem die Einrichtung zum Aus
wählen der Übersetzungsressource eine Einrichtung zum Auswählen
einer ersten Übersetzungsressource für einen ersten Teil eines
Dokuments und eine Einrichtung zum Auswählen einer zweiten Über
setzungsressource für einen zweiten Teil des Dokuments aufweist,
und
die Einrichtung zum Übersetzen eine Einrichtung zum Übersetzen
des ersten Teils des Dokuments mit Hilfe der ersten Übersetzungs
ressource und eine Einrichtung zum Übesetzen des zweiten Teils
der Einrichtung mit Hilfe der zweiten Übersetzungsressource auf
weist.
15. System nach Anspruch 13, bei welchem die Analyseeinrichtung
eine Einrichtung zum Analysieren einer strukturellen Information
aufweist, die in dem Dokument enthalten ist.
16. Einrichtung nach Anspruch 13, bei welchem die Analyseeinrich
tung eine Einrichtung zum Analysieren von Hinweisen aufweist, die
in dem Dokument enthalten sind.
17. System nach Anspruch 16, bei welchem die Analyseeinrichtung
eine Einrichtung zum Analysieren von verallgemeinerten Standard-
Markiersprachen-(SGML-)Hinweisen aufweist, die in dem Dokument
enthalten sind.
18. System nach Anspruch 13, bei welchem die Einrichtung zum Aus
wählen der Übersetzungsressource eine Einrichtung zum Auswählen
einer Wörterbuchinformation aufweist, welche zum Übersetzen des
Dokuments verwendet wird.
19. System nach Anspruch 13, bei welchem die Einrichtung zum Aus
wählen der Übersetzungsressource eine Einrichtung zum Auswählen
von Vorschrifteninformation aufweist, welche zum Übersetzen des
Dokuments verwendet wird.
20. System nach Anspruch 13, bei welchem die Einrichtung zum Aus
wählen der Übersetzungsressourcen eine Einrichtung zum Auswählen
von Wörterbuchinformation und von Vorschrifteninformation auf
weist, welche zum Übersetzen des Dokuments verwendet werden.
21. System nach Anspruch 13, bei welchem die Auswähleinrichtung
eine Einrichtung zum Auswählen einer Datenstruktur aufweist, wel
che eine Stelle der Übersetzungsressource festlegt, die zum Über
setzen des Dokuments verwendet worden ist.
22. System nach Anspruch 13, bei welchem die Analyseeinrichtung
ein Analyseergebnis erzeugt, welches einen Schlüssel enthält,
welches die Datenstruktur anzeigt, welche eine Stelle der
Übersetzungsressource festlegt, die zum Übersetzen verwendet wor
den ist, und
die Auswähleinrichtung eine Einrichtung zum Auswählen der Daten
struktur aufweist, welche den Schlüssel enthält, welcher eine
Stelle der Übersetzungsressource festlegt, die zum Übersetzen des
Dokuments verwendet worden ist.
23. System nach Anspruch 13, mit einer Einrichtung, um gleichzei
tig einen Abschnitt des Dokuments, welches in der ersten Sprache
abgefaßt ist, und einen entsprechenden Abschnitt des Dokuments
gleichzeitig darzustellen, welches in die zweite Sprache über
setzt worden ist.
24. System nach Anspruch 23, mit einer Einrichtung zum Ändern des
Abschnitts des Dokuments, welches in die zweite Sprache übersetzt
worden ist.
25. Computer-Programm-Produkt mit einem computerlesbaren Medium
mit einer darauf aufgezeichneten Computerprogrammlogik, um ein
Dokument von einer ersten Sprache in eine zweite Sprache zu über
setzen, mit
einer Einrichtung zum Analysieren von Information, die in dem Dokument enthalten ist, und zum Erzeugen eines Analyseergebnis ses;
einer Einrichtung zum Auswählen einer Übersetzungsressource ent sprechend dem Analyseergebnis, welches zum Übersetzen des Doku ments verwendet wird, und
einer Einrichtung zum Übersetzen des Dokuments von der ersten Sprache in die zweite Sprache mit Hilfe der Übersetzungs ressource, welche ausgewählt worden ist.
einer Einrichtung zum Analysieren von Information, die in dem Dokument enthalten ist, und zum Erzeugen eines Analyseergebnis ses;
einer Einrichtung zum Auswählen einer Übersetzungsressource ent sprechend dem Analyseergebnis, welches zum Übersetzen des Doku ments verwendet wird, und
einer Einrichtung zum Übersetzen des Dokuments von der ersten Sprache in die zweite Sprache mit Hilfe der Übersetzungs ressource, welche ausgewählt worden ist.
26. Computer-Programm-Produkt nach Anspruch 25, bei welchem
die Einrichtung zum Auswählen der Übersetzungsressource eine Ein richtung zum Auswählen einer ersten Übersetzungsressource für ei nen ersten Teil eines Dokuments und eine Einrichtung zum Auswäh len einer zweiten Übersetzungsressource für einen zweiten Teil des Dokuments aufweist, und
die Übersetzungseinrichtung eine Einrichtung zum Übersetzen des ersten Teils des Dokuments mit Hilfe der ersten Übersetzungs ressource und eine Einrichtung zum Übersetzung des zweiten Teil des Dokuments mit Hilfe der zweiten Übersetzungsressource auf weist.
die Einrichtung zum Auswählen der Übersetzungsressource eine Ein richtung zum Auswählen einer ersten Übersetzungsressource für ei nen ersten Teil eines Dokuments und eine Einrichtung zum Auswäh len einer zweiten Übersetzungsressource für einen zweiten Teil des Dokuments aufweist, und
die Übersetzungseinrichtung eine Einrichtung zum Übersetzen des ersten Teils des Dokuments mit Hilfe der ersten Übersetzungs ressource und eine Einrichtung zum Übersetzung des zweiten Teil des Dokuments mit Hilfe der zweiten Übersetzungsressource auf weist.
27. Computer-Programm-Produkt nach Anspruch 25, bei welchem die
Analyseeinrichtung eine Einrichtung zum Analysieren einer struk
turellen Information aufweist, die in dem Dokument enthalten ist.
28. Computer-Programm-Produkt nach Anspruch 25, bei welchem die
Analyseeinrichtung eine Einrichtung zum Analysieren von in dem
Dokument enthaltenen Hinweisen aufweist.
29. Computer-Programm-Produkt nach Anspruch 28, bei welchem die
Analyseeinrichtung eine Einrichtung zum Analysieren von in dem
Dokument enthaltenen SGML-Hinweisen aufweist.
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/654,207 US5848386A (en) | 1996-05-28 | 1996-05-28 | Method and system for translating documents using different translation resources for different portions of the documents |
Publications (2)
Publication Number | Publication Date |
---|---|
DE19709968A1 DE19709968A1 (de) | 1997-12-04 |
DE19709968C2 true DE19709968C2 (de) | 2003-04-30 |
Family
ID=24623898
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE19709968A Expired - Lifetime DE19709968C2 (de) | 1996-05-28 | 1997-03-11 | Verfahren und System zum Übersetzen eines Dokumentes |
Country Status (3)
Country | Link |
---|---|
US (2) | US5848386A (de) |
JP (2) | JP3905179B2 (de) |
DE (1) | DE19709968C2 (de) |
Families Citing this family (339)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7131070B1 (en) | 1999-05-13 | 2006-10-31 | Ricoh Company, Ltd. | Application unit monitoring and reporting system and method |
US5819110A (en) * | 1995-06-05 | 1998-10-06 | Ricoh Company, Ltd. | System for determining whether connection or connectionless modes of communication should be used to transmit information between devices in accordance with priorities of events |
US5818603A (en) | 1996-03-29 | 1998-10-06 | Ricoh Company, Ltd. | Method and system for controlling and communicating with machines using multiple communication formats |
US20020004812A1 (en) * | 1997-06-26 | 2002-01-10 | Tetsuro Motoyama | Method and system for diagnosis and control of machines using connectionless modes having delivery monitoring and an alternate communication mode |
US6044205A (en) * | 1996-02-29 | 2000-03-28 | Intermind Corporation | Communications system for transferring information between memories according to processes transferred with the information |
US6700958B2 (en) * | 1995-04-10 | 2004-03-02 | Starguide Digital Networks, Inc. | Method and apparatus for transmitting coded audio signals through a transmission channel with limited bandwidth |
US7185080B1 (en) | 1995-06-05 | 2007-02-27 | Ricoh Company, Ltd. | Method and system for diagnosis and control of machines using connection and connectionless modes of communication |
BR9610270A (pt) * | 1995-08-16 | 1999-07-06 | Starguide Digital Networks Inc | Alocação dinâmica de largura de faixa para transmissão de sinais de audio e um sinal de vídeo |
EP0847638A4 (de) * | 1995-09-01 | 2002-08-21 | Starguide Digital Networks Inc | Vorrichtung zur erzeugung und verteilung einer audio-datei |
US6073143A (en) * | 1995-10-20 | 2000-06-06 | Sanyo Electric Co., Ltd. | Document conversion system including data monitoring means that adds tag information to hyperlink information and translates a document when such tag information is included in a document retrieval request |
US6546406B1 (en) * | 1995-11-03 | 2003-04-08 | Enigma Information Systems Ltd. | Client-server computer system for large document retrieval on networked computer system |
US6470306B1 (en) * | 1996-04-23 | 2002-10-22 | Logovista Corporation | Automated translation of annotated text based on the determination of locations for inserting annotation tokens and linked ending, end-of-sentence or language tokens |
US5848386A (en) * | 1996-05-28 | 1998-12-08 | Ricoh Company, Ltd. | Method and system for translating documents using different translation resources for different portions of the documents |
US6061697A (en) * | 1996-09-11 | 2000-05-09 | Fujitsu Limited | SGML type document managing apparatus and managing method |
CA2268303A1 (en) * | 1996-10-09 | 1998-04-16 | Starguide Digital Networks | Aggregate information production and display system |
JPH10198680A (ja) * | 1997-01-07 | 1998-07-31 | Hitachi Ltd | 分散辞書管理方法及びそれを用いた機械翻訳方法 |
IL121071A0 (en) * | 1997-03-27 | 1997-11-20 | El Mar Software Ltd | Automatic conversion server |
IL121457A (en) * | 1997-08-03 | 2004-06-01 | Guru Internat Inc | Computerized dictionary and thesaurus applications |
US6154754A (en) * | 1997-09-25 | 2000-11-28 | Siemens Corporate Research, Inc. | Automatic synthesis of semantic information from multimedia documents |
US5960080A (en) * | 1997-11-07 | 1999-09-28 | Justsystem Pittsburgh Research Center | Method for transforming message containing sensitive information |
US6161082A (en) * | 1997-11-18 | 2000-12-12 | At&T Corp | Network based language translation system |
US6321244B1 (en) * | 1997-12-04 | 2001-11-20 | Siemens Corporate Research, Inc. | Style specifications for systematically creating card-based hypermedia manuals |
JPH11175527A (ja) * | 1997-12-15 | 1999-07-02 | Fujitsu Ltd | 出力制御装置及び出力制御方法 |
US6009436A (en) * | 1997-12-23 | 1999-12-28 | Ricoh Company, Ltd. | Method and apparatus for mapping structured information to different structured information |
US8489980B2 (en) * | 1998-02-23 | 2013-07-16 | Transperfect Global, Inc. | Translation management system |
US10541973B2 (en) * | 1998-02-23 | 2020-01-21 | Transperfect Global, Inc. | Service of cached translated content in a requested language |
US6526426B1 (en) * | 1998-02-23 | 2003-02-25 | David Lakritz | Translation management system |
US7194757B1 (en) | 1998-03-06 | 2007-03-20 | Starguide Digital Network, Inc. | Method and apparatus for push and pull distribution of multimedia |
US8284774B2 (en) | 1998-04-03 | 2012-10-09 | Megawave Audio Llc | Ethernet digital storage (EDS) card and satellite transmission system |
US6160797A (en) | 1998-04-03 | 2000-12-12 | Starguide Digital Networks, Inc. | Satellite receiver/router, system, and method of use |
US7191393B1 (en) * | 1998-09-25 | 2007-03-13 | International Business Machines Corporation | Interface for providing different-language versions of markup-language resources |
US7281203B2 (en) * | 1998-09-29 | 2007-10-09 | Netscape Communications Corporation | Selecting a DTD for transforming malformed layout expressions into wellformed ones |
US6336214B1 (en) * | 1998-11-10 | 2002-01-01 | International Business Machines Corporation | System and method for automatically generating browsable language grammars |
US7376728B1 (en) * | 2000-07-25 | 2008-05-20 | Ricoh Company, Ltd. | Method and system for monitoring, collecting information, diagnosing and servicing a remote system |
US6964011B1 (en) * | 1998-11-26 | 2005-11-08 | Canon Kabushiki Kaisha | Document type definition generating method and apparatus, and storage medium for storing program |
US6535842B1 (en) * | 1998-12-10 | 2003-03-18 | Global Information Research And Technologies, Llc | Automatic bilingual translation memory system |
US6363337B1 (en) * | 1999-01-19 | 2002-03-26 | Universal Ad Ltd. | Translation of data according to a template |
US6480860B1 (en) * | 1999-02-11 | 2002-11-12 | International Business Machines Corporation | Tagged markup language interface with document type definition to access data in object oriented database |
US7287219B1 (en) | 1999-03-11 | 2007-10-23 | Abode Systems Incorporated | Method of constructing a document type definition from a set of structured electronic documents |
EP2336899A3 (de) * | 1999-03-19 | 2014-11-26 | Trados GmbH | System zum Verwalten von Arbeitsabläufen |
US6986101B2 (en) * | 1999-05-06 | 2006-01-10 | International Business Machines Corporation | Method and apparatus for converting programs and source code files written in a programming language to equivalent markup language files |
US6490548B1 (en) | 1999-05-14 | 2002-12-03 | Paterra, Inc. | Multilingual electronic transfer dictionary containing topical codes and method of use |
WO2000077609A1 (en) | 1999-06-14 | 2000-12-21 | The Thomson Corporation | System for converting data to a markup language |
US6901361B1 (en) * | 1999-07-09 | 2005-05-31 | Digital Esperanto, Inc. | Computerized translator of languages utilizing indexed databases of corresponding information elements |
US6993476B1 (en) * | 1999-08-26 | 2006-01-31 | International Business Machines Corporation | System and method for incorporating semantic characteristics into the format-driven syntactic document transcoding framework |
US6598015B1 (en) * | 1999-09-10 | 2003-07-22 | Rws Group, Llc | Context based computer-assisted language translation |
US7533344B1 (en) | 1999-09-10 | 2009-05-12 | Ricoh Company, Ltd. | Application unit monitoring and reporting system and method |
US20060116865A1 (en) | 1999-09-17 | 2006-06-01 | Www.Uniscape.Com | E-services translation utilizing machine translation and translation memory |
US7120863B1 (en) | 1999-11-15 | 2006-10-10 | International Business Machines Corporation | Method, system, and program for interfacing with elements in a document |
US6662225B1 (en) * | 1999-11-16 | 2003-12-09 | Ricoh Company, Ltd. | Remote system usage monitoring with flexible packaging of data |
US7743133B1 (en) | 1999-11-16 | 2010-06-22 | Ricoh Company, Ltd. | Remote system usage monitoring with flexible encoding and decoding objects |
US6948175B1 (en) | 1999-11-16 | 2005-09-20 | Ricoh Company, Ltd. | Method and system of remote diagnostic, control and information collection using a dynamic linked library |
US7054952B1 (en) * | 1999-12-09 | 2006-05-30 | International Business Machines Corp. | Electronic document delivery system employing distributed document object model (DOM) based transcoding and providing interactive javascript support |
JP2001195115A (ja) | 2000-01-06 | 2001-07-19 | Canon Inc | 工数自動設定システム、工数自動設定方法、分散型クライアントサーバシステム及びコンピュータプログラムの記憶媒体 |
JP2001195462A (ja) * | 2000-01-06 | 2001-07-19 | Canon Inc | 組立情報管理システムと組立情報管理のためのクライアントサーバ型分散システム |
JP2001256333A (ja) * | 2000-01-06 | 2001-09-21 | Canon Inc | 作業割付システム、作業割付方法、分散型クライアントサーバシステム及びコンピュータプログラム記憶媒体 |
JP2001195463A (ja) * | 2000-01-06 | 2001-07-19 | Canon Inc | 作業標準作成システム、作業標準作成方法、分散型クライアントサーバシステム及びコンピュータプログラムの記憶媒体 |
US6915342B1 (en) | 2000-02-04 | 2005-07-05 | Ricoh Company Limited | Method and system for maintaining the business office appliance through log files |
US6915337B1 (en) | 2000-03-07 | 2005-07-05 | Ricoh Co. Ltd. | Method and system for updating the device driver of a business office appliance |
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
EP1139231A1 (de) * | 2000-03-31 | 2001-10-04 | Fujitsu Limited | Anordnung und Verfahren zur Dokumentbearbeitung |
US6785711B1 (en) | 2000-04-04 | 2004-08-31 | Ricoh Co., Ltd. | Method and system for displaying various messages while performing tasks or while idling |
JP4028154B2 (ja) | 2000-04-07 | 2007-12-26 | 富士通株式会社 | 磁気記録媒体及び磁気記憶装置 |
US7120674B1 (en) | 2000-05-17 | 2006-10-10 | Ricoh Company, Ltd. | Method and system of remote diagnostic, control and information collection using a dynamic linked library of multiple formats and multiple protocols with intelligent protocol processor |
US6988141B1 (en) | 2000-05-17 | 2006-01-17 | Ricoh Company, Ltd. | Method and system of remote diagnostic, control and information collection using a dynamic linked library of multiple formats and multiple protocols with restriction on protocol |
US7287085B1 (en) | 2000-05-17 | 2007-10-23 | Ricoh Company, Ltd. | Method and system of remote diagnostic, control and information collection using a dynamic linked library of multiple formats and multiple protocols with intelligent formatter |
FR2809509B1 (fr) * | 2000-05-26 | 2003-09-12 | Bull Sa | Systeme et procede d'internationalisation du contenu de documents a balises dans un systeme informatique |
US6519557B1 (en) * | 2000-06-06 | 2003-02-11 | International Business Machines Corporation | Software and method for recognizing similarity of documents written in different languages based on a quantitative measure of similarity |
WO2002021413A2 (en) * | 2000-09-05 | 2002-03-14 | Zaplet, Inc. | Methods and apparatus providing electronic messages that are linked and aggregated |
US20040205671A1 (en) * | 2000-09-13 | 2004-10-14 | Tatsuya Sukehiro | Natural-language processing system |
US6857016B1 (en) | 2000-09-25 | 2005-02-15 | Ricoh Company Limited | Method and system of data collection and mapping from a remote position reporting device |
US20020083103A1 (en) * | 2000-10-02 | 2002-06-27 | Ballance Chanin M. | Machine editing system incorporating dynamic rules database |
US6782384B2 (en) | 2000-10-04 | 2004-08-24 | Idiom Merger Sub, Inc. | Method of and system for splitting and/or merging content to facilitate content processing |
WO2002029621A1 (en) * | 2000-10-04 | 2002-04-11 | Idiom Technologies, Incorporated | Method of and system for splitting and/or merging content to facilitate content processing |
US7669051B2 (en) * | 2000-11-13 | 2010-02-23 | DigitalDoors, Inc. | Data security system and method with multiple independent levels of security |
US9311499B2 (en) * | 2000-11-13 | 2016-04-12 | Ron M. Redlich | Data security system and with territorial, geographic and triggering event protocol |
WO2002069073A2 (en) * | 2000-11-13 | 2002-09-06 | Starguide Digital Networks, Inc. | Ethernet digital storage (eds) card and satellite transmission system including faxing capability |
WO2002046878A2 (en) * | 2000-12-06 | 2002-06-13 | American Express Travel Related Services Company, Inc. | Layout generator system and method |
DE50111786D1 (de) * | 2000-12-15 | 2007-02-15 | Siemens Ag | Verschlüsselung von Steuerungsprogrammen |
US20020099745A1 (en) * | 2001-01-23 | 2002-07-25 | Neo-Core, L.L.C. | Method and system for storing a flattened structured data document |
US20020103632A1 (en) * | 2001-01-31 | 2002-08-01 | International Business Machines Corporation | Method, program, and tool for updating the national language versions of documents |
US7392307B2 (en) * | 2001-02-14 | 2008-06-24 | Ricoh Co., Ltd. | Method and system of remote diagnostic, control and information collection using a shared resource |
US7533333B2 (en) | 2001-02-14 | 2009-05-12 | Ricoh Co., Ltd. | Object-oriented method and system of remote diagnostic, control and information collection using multiple formats and multiple protocols |
US7171670B2 (en) | 2001-02-14 | 2007-01-30 | Ricoh Co., Ltd. | Method and system of remote diagnostic, control and information collection using multiple formats and multiple protocols with verification of formats and protocols |
US7047293B2 (en) * | 2001-02-14 | 2006-05-16 | Ricoh Co., Ltd. | Method and system of remote diagnostic, control and information collection using multiple formats and multiple protocols with delegating protocol processor |
AUPR329501A0 (en) * | 2001-02-22 | 2001-03-22 | Worldlingo, Inc | Translation information segment |
US7860706B2 (en) * | 2001-03-16 | 2010-12-28 | Eli Abir | Knowledge system method and appparatus |
JP3475186B2 (ja) * | 2001-03-21 | 2003-12-08 | 株式会社ニチベイ | ブラインド、ブラインド用スラット、その製造方法及びその成形加工機 |
WO2002082289A1 (en) * | 2001-04-06 | 2002-10-17 | Agea Corporation | Mobile presentation system |
US20020147749A1 (en) * | 2001-04-06 | 2002-10-10 | Ortiz C. Enrique | Mobile presentation system |
US20030023584A1 (en) * | 2001-04-27 | 2003-01-30 | Brandin Christopher Lockton | Universal information base system |
JP2003022125A (ja) * | 2001-05-02 | 2003-01-24 | Ricoh Co Ltd | 機器の定期診断装置及び機器の定期診断方法ならびに定期診断される顧客に配置された機器 |
US6993474B2 (en) * | 2001-05-17 | 2006-01-31 | Curry David G | Interactive conversational speech communicator method and system |
US20030004703A1 (en) * | 2001-06-28 | 2003-01-02 | Arvind Prabhakar | Method and system for localizing a markup language document |
US7016963B1 (en) | 2001-06-29 | 2006-03-21 | Glow Designs, Llc | Content management and transformation system for digital content |
US8214196B2 (en) | 2001-07-03 | 2012-07-03 | University Of Southern California | Syntax-based statistical translation model |
US7100108B2 (en) * | 2001-08-31 | 2006-08-29 | International Business Machines Corporation | Software program utility that isolates translatable english text from machine code and merges the text into one file for review purposes |
US7490146B1 (en) | 2001-09-17 | 2009-02-10 | Ricoh Company, Ltd. | System, method, and computer program product for collecting and sending various types of information to a monitor using e-mail |
US7302469B2 (en) * | 2001-09-17 | 2007-11-27 | Ricoh Company, Ltd. | System, method, and computer program product for transferring remote device support data to a monitor using e-mail |
US7536450B2 (en) * | 2001-09-17 | 2009-05-19 | Ricoh Company, Ltd. | System, method, and computer program product for sending remote device configuration information to a monitor using e-mail |
JP2003091344A (ja) * | 2001-09-19 | 2003-03-28 | Sony Corp | 情報処理装置および情報処理方法、記録媒体、データ構造、並びにプログラム |
JP3452558B2 (ja) * | 2001-09-25 | 2003-09-29 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 翻訳対象のリソースと分野別辞書を関連付けるための方法、システムおよびプログラム |
US8438004B2 (en) * | 2001-10-03 | 2013-05-07 | Hewlett-Packard Development Company L.P. | System and methods for language translation printing |
US7343407B2 (en) * | 2001-10-15 | 2008-03-11 | Ricoh Company, Ltd. | Method and system of remote monitoring and support of devices, including handling Email messages having message types specified within the Email message |
US6839717B1 (en) | 2001-10-15 | 2005-01-04 | Ricoh Company, Ltd. | Method and system of remote monitoring and support of devices, extracting data from different types of email messages, and storing data according to data structures determined by the message types |
US6925571B1 (en) | 2001-10-15 | 2005-08-02 | Ricoh Company, Ltd. | Method and system of remote monitoring and support of devices, using POP3 and decryption using virtual function |
US20030101046A1 (en) * | 2001-11-28 | 2003-05-29 | Mark Krasnov | Word, expression, and sentence translation management tool |
US20030105621A1 (en) * | 2001-12-04 | 2003-06-05 | Philippe Mercier | Method for computer-assisted translation |
US20030131316A1 (en) * | 2002-01-07 | 2003-07-10 | Kyle Brown | Internationalizing SGML documents |
WO2004001623A2 (en) | 2002-03-26 | 2003-12-31 | University Of Southern California | Constructing a translation lexicon from comparable, non-parallel corpora |
US20030212962A1 (en) * | 2002-05-08 | 2003-11-13 | Amikai, Inc. | Thin client-server architecture for automated machine translation |
US7209915B1 (en) | 2002-06-28 | 2007-04-24 | Microsoft Corporation | Method, system and apparatus for routing a query to one or more providers |
US7185271B2 (en) * | 2002-08-20 | 2007-02-27 | Hewlett-Packard Development Company, L.P. | Methods and systems for implementing auto-complete in a web page |
US7113960B2 (en) * | 2002-08-22 | 2006-09-26 | International Business Machines Corporation | Search on and search for functions in applications with varying data types |
US20040078762A1 (en) * | 2002-10-17 | 2004-04-22 | Taiwan Semiconductor Manufacturing Co., Ltd. | Multi-lingual information server apparatus and method for operation thereof |
EP1574967A4 (de) * | 2002-12-18 | 2009-05-27 | Ricoh Kk | Übersetzungshilfssystem und programm dafür |
US7428699B1 (en) | 2003-01-15 | 2008-09-23 | Adobe Systems Incorporated | Configurable representation of structured data |
FR2850473A1 (fr) * | 2003-01-28 | 2004-07-30 | France Telecom | Procede et systeme pour la fourniture d'un service de traduction automatique de contenu web |
US8170863B2 (en) * | 2003-04-01 | 2012-05-01 | International Business Machines Corporation | System, method and program product for portlet-based translation of web content |
US20040230898A1 (en) * | 2003-05-13 | 2004-11-18 | International Business Machines Corporation | Identifying topics in structured documents for machine translation |
US7558841B2 (en) * | 2003-05-14 | 2009-07-07 | Microsoft Corporation | Method, system, and computer-readable medium for communicating results to a data query in a computer network |
JP3765798B2 (ja) * | 2003-05-27 | 2006-04-12 | 沖電気工業株式会社 | 文書対応関係検査装置、翻訳処理装置、文書対応関係検査方法、翻訳処理方法、および文書対応関係検査プログラム |
US20040243391A1 (en) * | 2003-05-28 | 2004-12-02 | Nelson David D. | Apparatus, system, and method for multilingual regulation management |
US20100070265A1 (en) * | 2003-05-28 | 2010-03-18 | Nelson David D | Apparatus, system, and method for multilingual regulation management |
JP2004362249A (ja) * | 2003-06-04 | 2004-12-24 | Advanced Telecommunication Research Institute International | 翻訳知識最適化装置、翻訳知識最適化のためのコンピュータプログラム、コンピュータ及び記憶媒体 |
US8548794B2 (en) | 2003-07-02 | 2013-10-01 | University Of Southern California | Statistical noun phrase translation |
US7657832B1 (en) | 2003-09-18 | 2010-02-02 | Adobe Systems Incorporated | Correcting validation errors in structured documents |
US7983896B2 (en) | 2004-03-05 | 2011-07-19 | SDL Language Technology | In-context exact (ICE) matching |
US8296127B2 (en) | 2004-03-23 | 2012-10-23 | University Of Southern California | Discovery of parallel text portions in comparable collections of corpora and training using comparable texts |
US8666725B2 (en) | 2004-04-16 | 2014-03-04 | University Of Southern California | Selection and use of nonstatistical translation components in a statistical machine translation framework |
US7853473B2 (en) | 2004-08-31 | 2010-12-14 | Revionics, Inc. | Market-based price optimization system |
JP5452868B2 (ja) | 2004-10-12 | 2014-03-26 | ユニヴァーシティー オブ サザン カリフォルニア | トレーニングおよび復号のためにストリングからツリーへの変換を使うテキスト‐テキスト・アプリケーションのためのトレーニング |
US7680646B2 (en) * | 2004-12-21 | 2010-03-16 | Xerox Corporation | Retrieval method for translation memories containing highly structured documents |
US7818666B2 (en) | 2005-01-27 | 2010-10-19 | Symyx Solutions, Inc. | Parsing, evaluating leaf, and branch nodes, and navigating the nodes based on the evaluation |
JP2006276915A (ja) * | 2005-03-25 | 2006-10-12 | Fuji Xerox Co Ltd | 翻訳処理方法、文書翻訳装置およびプログラム |
JP4311365B2 (ja) * | 2005-03-25 | 2009-08-12 | 富士ゼロックス株式会社 | 文書処理装置およびプログラム |
JP2006277103A (ja) * | 2005-03-28 | 2006-10-12 | Fuji Xerox Co Ltd | 文書翻訳方法および文書翻訳装置 |
US9245032B2 (en) * | 2005-06-02 | 2016-01-26 | Oracle International Corporation | Globalization framework for providing locale-specific services using client-side scripting languages |
US8886517B2 (en) | 2005-06-17 | 2014-11-11 | Language Weaver, Inc. | Trust scoring for language translation systems |
US8676563B2 (en) | 2009-10-01 | 2014-03-18 | Language Weaver, Inc. | Providing human-generated and machine-generated trusted translations |
US20070010989A1 (en) * | 2005-07-07 | 2007-01-11 | International Business Machines Corporation | Decoding procedure for statistical machine translation |
US20070043553A1 (en) * | 2005-08-16 | 2007-02-22 | Microsoft Corporation | Machine translation models incorporating filtered training data |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US20070067154A1 (en) * | 2005-09-22 | 2007-03-22 | International Business Machines Corporation | Language translation system |
US7992085B2 (en) | 2005-09-26 | 2011-08-02 | Microsoft Corporation | Lightweight reference user interface |
US7788590B2 (en) | 2005-09-26 | 2010-08-31 | Microsoft Corporation | Lightweight reference user interface |
US10319252B2 (en) | 2005-11-09 | 2019-06-11 | Sdl Inc. | Language capability assessment and training apparatus and techniques |
US9411781B2 (en) | 2006-01-18 | 2016-08-09 | Adobe Systems Incorporated | Rule-based structural expression of text and formatting attributes in documents |
EP2511833B1 (de) | 2006-02-17 | 2020-02-05 | Google LLC | Kodierung und adaptiver, skalierbarer zugang zu verteilten übersetzungsmodellen |
US8943080B2 (en) | 2006-04-07 | 2015-01-27 | University Of Southern California | Systems and methods for identifying parallel documents and sentence fragments in multilingual document collections |
WO2007124109A2 (en) * | 2006-04-21 | 2007-11-01 | Scomm, Inc. | Interactive conversational speech communicator method and system |
US7873641B2 (en) * | 2006-07-14 | 2011-01-18 | Bea Systems, Inc. | Using tags in an enterprise search system |
US8886518B1 (en) | 2006-08-07 | 2014-11-11 | Language Weaver, Inc. | System and method for capitalizing machine translated text |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8521506B2 (en) | 2006-09-21 | 2013-08-27 | Sdl Plc | Computer-implemented method, computer software and apparatus for use in a translation system |
US8433556B2 (en) | 2006-11-02 | 2013-04-30 | University Of Southern California | Semi-supervised training for statistical word alignment |
US9122674B1 (en) * | 2006-12-15 | 2015-09-01 | Language Weaver, Inc. | Use of annotations in statistical machine translation |
JP2008165415A (ja) * | 2006-12-27 | 2008-07-17 | Oki Electric Ind Co Ltd | 文書処理装置、文書処理方法およびプログラム |
US8468149B1 (en) | 2007-01-26 | 2013-06-18 | Language Weaver, Inc. | Multi-lingual online community |
US8615389B1 (en) | 2007-03-16 | 2013-12-24 | Language Weaver, Inc. | Generation and exploitation of an approximate language model |
US8326598B1 (en) * | 2007-03-26 | 2012-12-04 | Google Inc. | Consensus translations from multiple machine translation systems |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8831928B2 (en) | 2007-04-04 | 2014-09-09 | Language Weaver, Inc. | Customizable machine translation service |
US20080288239A1 (en) * | 2007-05-15 | 2008-11-20 | Microsoft Corporation | Localization and internationalization of document resources |
US9361294B2 (en) * | 2007-05-31 | 2016-06-07 | Red Hat, Inc. | Publishing tool for translating documents |
US8205151B2 (en) * | 2007-05-31 | 2012-06-19 | Red Hat, Inc. | Syndication of documents in increments |
US10296588B2 (en) * | 2007-05-31 | 2019-05-21 | Red Hat, Inc. | Build of material production system |
US8825466B1 (en) | 2007-06-08 | 2014-09-02 | Language Weaver, Inc. | Modification of annotated bilingual segment pairs in syntax-based machine translation |
US20080313291A1 (en) * | 2007-06-12 | 2008-12-18 | Smartmicros Usa, Llc | Method and apparatus for encoding data |
US20090013268A1 (en) * | 2007-07-02 | 2009-01-08 | Universal Ad Ltd. | Creation Of Visual Composition Of Product Images |
JP5105513B2 (ja) * | 2007-07-20 | 2012-12-26 | インターナショナル・ビジネス・マシーンズ・コーポレーション | 処理対象として適切なテキストを選択する技術 |
US9418061B2 (en) * | 2007-12-14 | 2016-08-16 | International Business Machines Corporation | Prioritized incremental asynchronous machine translation of structured documents |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
JP5423398B2 (ja) * | 2008-01-10 | 2014-02-19 | 日本電気株式会社 | 機械翻訳装置および機械翻訳方法 |
US8849665B2 (en) * | 2008-01-30 | 2014-09-30 | At&T Intellectual Property I, L.P. | System and method of providing machine translation from a source language to a target language |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
DE102009009123A1 (de) | 2009-02-16 | 2010-08-19 | Marius Gevers | Verfahren und ein System zum Übersetzen eines Textes aus einer ersten Sprache in zumindest eine weitere Sprache sowie ein Computer-Programm-Produkt |
GB2468278A (en) | 2009-03-02 | 2010-09-08 | Sdl Plc | Computer assisted natural language translation outputs selectable target text associated in bilingual corpus with input target text from partial translation |
US9262403B2 (en) | 2009-03-02 | 2016-02-16 | Sdl Plc | Dynamic generation of auto-suggest dictionary for natural language translation |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US20120311585A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Organizing task items that represent tasks to perform |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US8990064B2 (en) | 2009-07-28 | 2015-03-24 | Language Weaver, Inc. | Translating documents based on content |
JP4935869B2 (ja) * | 2009-08-07 | 2012-05-23 | カシオ計算機株式会社 | 電子機器及びプログラム |
US8380486B2 (en) | 2009-10-01 | 2013-02-19 | Language Weaver, Inc. | Providing machine-generated translations and corresponding trust levels |
US8508787B2 (en) * | 2009-11-23 | 2013-08-13 | Xerox Corporation | System and method for automatic translation of documents scanned by multifunctional printer machines |
WO2011075762A1 (en) * | 2009-12-22 | 2011-06-30 | Health Ewords Pty Ltd | Method and system for classification of clinical information |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
WO2011089450A2 (en) | 2010-01-25 | 2011-07-28 | Andrew Peter Nelson Jerram | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10417646B2 (en) | 2010-03-09 | 2019-09-17 | Sdl Inc. | Predicting the cost associated with translating textual content |
US8280954B2 (en) | 2010-03-25 | 2012-10-02 | Scomm, Inc. | Method and system for providing live real-time communication via text between mobile user devices |
WO2011146934A2 (en) | 2010-05-21 | 2011-11-24 | Western Standard Publishing Company, Inc. | Apparatus, system, and method for computer aided translation |
US9002696B2 (en) * | 2010-11-30 | 2015-04-07 | International Business Machines Corporation | Data security system for natural language translation |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
US9128929B2 (en) | 2011-01-14 | 2015-09-08 | Sdl Language Technologies | Systems and methods for automatically estimating a translation time including preparation time in addition to the translation itself |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US9760920B2 (en) | 2011-03-23 | 2017-09-12 | Audible, Inc. | Synchronizing digital content |
US8855797B2 (en) | 2011-03-23 | 2014-10-07 | Audible, Inc. | Managing playback of synchronized content |
US8862255B2 (en) | 2011-03-23 | 2014-10-14 | Audible, Inc. | Managing playback of synchronized content |
US9706247B2 (en) | 2011-03-23 | 2017-07-11 | Audible, Inc. | Synchronized digital content samples |
US9703781B2 (en) | 2011-03-23 | 2017-07-11 | Audible, Inc. | Managing related digital content |
US9734153B2 (en) | 2011-03-23 | 2017-08-15 | Audible, Inc. | Managing related digital content |
US8948892B2 (en) | 2011-03-23 | 2015-02-03 | Audible, Inc. | Managing playback of synchronized content |
US11003838B2 (en) | 2011-04-18 | 2021-05-11 | Sdl Inc. | Systems and methods for monitoring post translation editing |
US8538742B2 (en) * | 2011-05-20 | 2013-09-17 | Google Inc. | Feed translation for a social network |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8694303B2 (en) | 2011-06-15 | 2014-04-08 | Language Weaver, Inc. | Systems and methods for tuning parameters in statistical machine translation |
US8706472B2 (en) * | 2011-08-11 | 2014-04-22 | Apple Inc. | Method for disambiguating multiple readings in language conversion |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
US8886515B2 (en) | 2011-10-19 | 2014-11-11 | Language Weaver, Inc. | Systems and methods for enhancing machine translation post edit review processes |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
US8942973B2 (en) | 2012-03-09 | 2015-01-27 | Language Weaver, Inc. | Content page URL translation |
US9075760B2 (en) | 2012-05-07 | 2015-07-07 | Audible, Inc. | Narration settings distribution for content customization |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10261994B2 (en) | 2012-05-25 | 2019-04-16 | Sdl Inc. | Method and system for automatic management of reputation of translators |
US9317500B2 (en) * | 2012-05-30 | 2016-04-19 | Audible, Inc. | Synchronizing translated digital content |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9141257B1 (en) | 2012-06-18 | 2015-09-22 | Audible, Inc. | Selecting and conveying supplemental content |
US8972265B1 (en) | 2012-06-18 | 2015-03-03 | Audible, Inc. | Multiple voices in audio content |
US9536439B1 (en) | 2012-06-27 | 2017-01-03 | Audible, Inc. | Conveying questions with content |
US9679608B2 (en) | 2012-06-28 | 2017-06-13 | Audible, Inc. | Pacing content |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9099089B2 (en) | 2012-08-02 | 2015-08-04 | Audible, Inc. | Identifying corresponding regions of content |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
US9367196B1 (en) | 2012-09-26 | 2016-06-14 | Audible, Inc. | Conveying branched content |
US9632647B1 (en) | 2012-10-09 | 2017-04-25 | Audible, Inc. | Selecting presentation positions in dynamic content |
US9223830B1 (en) | 2012-10-26 | 2015-12-29 | Audible, Inc. | Content presentation analysis |
US9619463B2 (en) | 2012-11-14 | 2017-04-11 | International Business Machines Corporation | Document decomposition into parts based upon translation complexity for translation assignment and execution |
US9152622B2 (en) | 2012-11-26 | 2015-10-06 | Language Weaver, Inc. | Personalized machine translation via online adaptation |
US9280906B2 (en) | 2013-02-04 | 2016-03-08 | Audible. Inc. | Prompting a user for input during a synchronous presentation of audio content and textual content |
US9472113B1 (en) | 2013-02-05 | 2016-10-18 | Audible, Inc. | Synchronizing playback of digital content with physical content |
KR102516577B1 (ko) | 2013-02-07 | 2023-04-03 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
WO2014144949A2 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | Training an at least partial voice command system |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
US9317486B1 (en) | 2013-06-07 | 2016-04-19 | Audible, Inc. | Synchronizing playback of digital content with captured physical content |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
EP3008641A1 (de) | 2013-06-09 | 2016-04-20 | Apple Inc. | Vorrichtung, verfahren und grafische benutzeroberfläche für gesprächspersistenz über zwei oder mehrere instanzen eines digitaler assistenten |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
CN105265005B (zh) | 2013-06-13 | 2019-09-17 | 苹果公司 | 用于由语音命令发起的紧急呼叫的系统和方法 |
WO2015020942A1 (en) | 2013-08-06 | 2015-02-12 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
US9489360B2 (en) | 2013-09-05 | 2016-11-08 | Audible, Inc. | Identifying extra material in companion content |
US9213694B2 (en) | 2013-10-10 | 2015-12-15 | Language Weaver, Inc. | Efficient online domain adaptation |
US9514377B2 (en) * | 2014-04-29 | 2016-12-06 | Google Inc. | Techniques for distributed optical character recognition and distributed machine language translation |
US9514376B2 (en) | 2014-04-29 | 2016-12-06 | Google Inc. | Techniques for distributed optical character recognition and distributed machine language translation |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
EP3149728B1 (de) | 2014-05-30 | 2019-01-16 | Apple Inc. | Eingabeverfahren durch einzelne äusserung mit mehreren befehlen |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
CN104933041B (zh) * | 2015-06-25 | 2017-09-01 | 武汉传神信息技术有限公司 | 一种利于翻译工作的文件抽取和还原方法 |
US11803918B2 (en) | 2015-07-07 | 2023-10-31 | Oracle International Corporation | System and method for identifying experts on arbitrary topics in an enterprise social network |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
JP2017174300A (ja) * | 2016-03-25 | 2017-09-28 | 富士ゼロックス株式会社 | 情報処理装置、情報処理方法およびプログラム |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
US10628522B2 (en) * | 2016-06-27 | 2020-04-21 | International Business Machines Corporation | Creating rules and dictionaries in a cyclical pattern matching process |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10635863B2 (en) | 2017-10-30 | 2020-04-28 | Sdl Inc. | Fragment recall and adaptive automated translation |
US10817676B2 (en) | 2017-12-27 | 2020-10-27 | Sdl Inc. | Intelligent routing services and systems |
US10540452B1 (en) * | 2018-06-21 | 2020-01-21 | Amazon Technologies, Inc. | Automated translation of applications |
US11256867B2 (en) | 2018-10-09 | 2022-02-22 | Sdl Inc. | Systems and methods of machine learning for digital assets and message creation |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0568319A2 (de) * | 1992-04-30 | 1993-11-03 | Sharp Kabushiki Kaisha | Maschinenübersetzungssystem |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57150071A (en) * | 1981-03-12 | 1982-09-16 | Sharp Corp | Electronic type interpreter |
US4553261A (en) * | 1983-05-31 | 1985-11-12 | Horst Froessl | Document and data handling and retrieval system |
JPS6244877A (ja) * | 1985-08-22 | 1987-02-26 | Toshiba Corp | 機械翻訳装置 |
US5029114A (en) * | 1986-07-22 | 1991-07-02 | Kabushiki Kaisha Toshiba | Method of displaying reduced-layout and apparatus for embodying the method |
US4916614A (en) * | 1986-11-25 | 1990-04-10 | Hitachi, Ltd. | Sentence translator using a thesaurus and a concept-organized co- occurrence dictionary to select from a plurality of equivalent target words |
GB2199170A (en) * | 1986-11-28 | 1988-06-29 | Sharp Kk | Translation apparatus |
US4890230A (en) * | 1986-12-19 | 1989-12-26 | Electric Industry Co., Ltd. | Electronic dictionary |
JPS63223962A (ja) | 1987-03-13 | 1988-09-19 | Hitachi Ltd | 翻訳装置 |
US4980289A (en) * | 1987-04-27 | 1990-12-25 | Wisconsin Alumni Research Foundation | Promoter deficient retroviral vector |
JPH01279368A (ja) * | 1988-04-30 | 1989-11-09 | Sharp Corp | キャラクタデータの転送方式 |
DE68928231T2 (de) * | 1988-10-28 | 1998-01-08 | Toshiba Kawasaki Kk | Verfahren und Vorrichtung zur Maschinenübersetzung |
JPH02254564A (ja) * | 1989-03-29 | 1990-10-15 | Ricoh Co Ltd | 翻訳用辞書編集装置 |
US5329446A (en) * | 1990-01-19 | 1994-07-12 | Sharp Kabushiki Kaisha | Translation machine |
US5109439A (en) * | 1990-06-12 | 1992-04-28 | Horst Froessl | Mass document storage and retrieval system |
JP3266246B2 (ja) * | 1990-06-15 | 2002-03-18 | インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン | 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法 |
US5418717A (en) * | 1990-08-27 | 1995-05-23 | Su; Keh-Yih | Multiple score language processing system |
US5497319A (en) * | 1990-12-31 | 1996-03-05 | Trans-Link International Corp. | Machine translation and telecommunications system |
US5466072A (en) * | 1992-01-17 | 1995-11-14 | Stenograph Corporation | Method and apparatus for recording and translating shorthand notes |
JP3220560B2 (ja) * | 1992-05-26 | 2001-10-22 | シャープ株式会社 | 機械翻訳装置 |
US5528491A (en) * | 1992-08-31 | 1996-06-18 | Language Engineering Corporation | Apparatus and method for automated natural language translation |
JP2745370B2 (ja) * | 1993-02-23 | 1998-04-28 | 日本アイ・ビー・エム株式会社 | 機械翻訳方法及び機械翻訳装置 |
JP3408291B2 (ja) * | 1993-09-20 | 2003-05-19 | 株式会社東芝 | 辞書作成支援装置 |
JPH07210558A (ja) * | 1994-01-20 | 1995-08-11 | Fujitsu Ltd | 機械翻訳装置 |
EP0672989A3 (de) * | 1994-03-15 | 1998-10-28 | Toppan Printing Co., Ltd. | Maschinelles Übersetzungssystem |
JPH08101837A (ja) * | 1994-09-30 | 1996-04-16 | Toshiba Corp | 機械翻訳装置における翻訳規則学習方法 |
US5983169A (en) * | 1995-11-13 | 1999-11-09 | Japan Science And Technology Corporation | Method for automated translation of conjunctive phrases in natural languages |
US5848386A (en) * | 1996-05-28 | 1998-12-08 | Ricoh Company, Ltd. | Method and system for translating documents using different translation resources for different portions of the documents |
-
1996
- 1996-05-28 US US08/654,207 patent/US5848386A/en not_active Expired - Lifetime
-
1997
- 1997-03-11 DE DE19709968A patent/DE19709968C2/de not_active Expired - Lifetime
- 1997-05-27 JP JP13648397A patent/JP3905179B2/ja not_active Expired - Lifetime
-
1998
- 1998-11-13 US US09/190,460 patent/US6208956B1/en not_active Expired - Lifetime
-
2004
- 2004-03-04 JP JP2004060677A patent/JP2004265423A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0568319A2 (de) * | 1992-04-30 | 1993-11-03 | Sharp Kabushiki Kaisha | Maschinenübersetzungssystem |
Also Published As
Publication number | Publication date |
---|---|
JP2004265423A (ja) | 2004-09-24 |
JPH1083398A (ja) | 1998-03-31 |
JP3905179B2 (ja) | 2007-04-18 |
US5848386A (en) | 1998-12-08 |
US6208956B1 (en) | 2001-03-27 |
DE19709968A1 (de) | 1997-12-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE19709968C2 (de) | Verfahren und System zum Übersetzen eines Dokumentes | |
DE60208604T2 (de) | Automatisches Verfahren zur Erzeugung von Image-buttons | |
DE69923311T2 (de) | Universelle formular-maschine | |
DE69925831T2 (de) | Maschinenunterstützte übersetzungswerkzeuge | |
DE69725258T2 (de) | System und Verfahren zur Wiederauffindung von Dokumenten in mehreren Sprachen | |
DE69734400T2 (de) | Verfahren und system zur prüfung der richtigkeit der rechtschreibung und grammatik eines dokuments | |
DE69726339T2 (de) | Verfahren und Apparat zur Sprachübersetzung | |
DE69728282T2 (de) | System und verfahren zur extraktion und kodierung von medizinischer fachsprache | |
DE69737884T2 (de) | Textprozessor | |
DE69530816T2 (de) | Textbearbeitungssystem und Verfahren unter Verwendung einer Wissensbasis | |
DE4015905C2 (de) | Sprachanalyseeinrichtung, -verfahren und -programm | |
DE10135445B4 (de) | Integriertes Verfahren für das Schaffen einer aktualisierbaren Netzabfrage | |
DE60213409T2 (de) | Erstellung von strukturierten daten aus unformatiertem text | |
DE10162156A1 (de) | Die Benutzernavigation durch Multimedia-Dateiinhalte unterstützendes System und Benutzerschnittstelle | |
DE2633536A1 (de) | Sprachuebertragungsgeraet und -verfahren | |
DE3032664A1 (de) | Elektronisches sprachuebersetzungsgeraet. | |
DE10321944A1 (de) | Vorrichtungen und Verfahren zum Verarbeiten von textbasierten elektronischen Dokumenten | |
DE3616751A1 (de) | Uebersetzungssystem | |
DE60101668T2 (de) | Verfahren und gerät zum erzeugen eines auf einer formatvorlage basierten index für ein strukturiertes dokument | |
DE10162418A1 (de) | System zur Verarbeitung strukturierter Dokumente, damit sie sich zur Ablieferung über Netzwerke eignen | |
DE112020005268T5 (de) | Automatisches erzeugen von schema-annotationsdateien zum umwandeln von abfragen in natürlicher sprache in eine strukturierte abfragesprache | |
DE4313959A1 (de) | Einrichtung und verfahren zum steuern der darstellung einer vorlage | |
WO2005119580A1 (de) | Verfahren und einrichtung zur strukturanalyse eines dokuments | |
WO2005106641A2 (de) | Verfahren, vorrichtung und computerprogrammprodukt zum erzeugen eines seiten- und/oder bereichsstrukturierten datenstroms aus einem zeilendatenstrom | |
Arnold-Moore | Automatic generation of amendment legislation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8304 | Grant after examination procedure | ||
8364 | No opposition during term of opposition | ||
R071 | Expiry of right |