DE3733391A1

DE3733391A1 - Verfahren zur spracherkennung

Info

Publication number: DE3733391A1
Application number: DE19873733391
Authority: DE
Inventors: Shogo Nakamura
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1986-10-03
Filing date: 1987-10-02
Publication date: 1988-04-14
Also published as: GB2195803B; FR2604815B1; US4903306A; GB8723298D0; JPS6391699A; FR2604815A1; DE3733391C2; GB2195803A

Description

Die Erfindung betrifft ein Verfahren zur Spracherkennung und betrifft insbesondere ein Verfahren zum Erkennen einer unbe kannten Sprache durch Vergleich mit einer Anzahl bekannter Sprachen, und betrifft insbesondere ein Verfahren zum Erken nen einer unbekannten, eingegebenen Sprache, indem ein Ei genvektor benutzt wird, welcher durch ein Grundbestandteil- Analyseverfahren erhalten worden ist.

Es ist bereits ein Spracherkennungsverfahren vorgeschlagen worden, in welchem eine Sprache, welche mit einem Wort als einer Einheit erzeugt worden ist, einer binären Verarbeitung unterworfen wird, um ein eingegebenes Muster in Form einer Zeit-Häufigkeits-Verteilung zu bilden, was auch als zeit spektrales Muster bezeichnet wird; das eingegebene Muster wird dann durch lineare Anpassung mit einer Anzahl Biblio theksmuster verglichen, um so die eingegebene Sprache zu er kennen. Dies Spracherkennungsverfahren wird auch das BTSP (binäres Zeit-Spektrum-Muster-) Verfahren bezeichnet und es ist einfach und vorteilhaft, da es nicht das sogenannte DP (Dynamisches Programmierungs-) Anpassungsverfahren benutzt. Außerdem eignet sich dieses Verfahren ausgezeichnet, um Fre quenzschwankungen in dem TSP-Verfahren zu absorbieren, so daß erwartet wird, daß es bei einer unbegrenzten Anzahl von Rednern anwendbar ist. Jedoch ist bei dem herkömmlichen BTSP-Verfahren eine beachtlich große Kapazität zum Spei chern einer Anzahl von zeit-spektralen Bibliotheks- oder Ar chivmustern erforderlich, so daß ein hochschneller Prozessor geschaffen werden mußte, um ohne Verzögerung eine Erkennungs verarbeitung durchzuführen.

Durch die Erfindung sollen die vorstehend beschriebenen Nachteile der herkömmlichen Verfahren vermieden werden und es soll ein Verfahren zum Erkennen einer eingegebenen unbe kannten Sprache geschaffen werden, welches in der Struktur einfach ist und welches eine minimale Bibliotheks- oder Ar chiv-Speicherkapazität für Bibliotheks- oder Archivdaten er fordert. Ein weiteres Ziel der Erfindung besteht darin, ein Spracherkennungsverfahren zu schaffen, welches schnell ar beitet und leicht auszuführen ist. Gemäß der Erfindung ist dies bei einem Verfahren zur Spracherkennung durch die Schritte im kennzeichnenden Teil des Anspruchs 1 erreicht. Vorteilhafte Weiterbildungen des erfindungsgemäßen Verfah rens sind Gegenstand der Unteransprüche.

Gemäß einer bevorzugten Ausführungsform der Erfindung ist ein Verfahren zum Erkennen einer eingegebenen Sprache ge schaffen, bei welchem ein zeit-spektrales Muster mit Zeit information und mit einer Anzahl Rahmen aus der eingegebenen Stimme erhalten wird, und das zeit-spektrale Muster einem Hauptbestandteil-Analyseverfahren unterzogen wird, um einen Nicht-Null-Eigenvektor zu bestimmen, welcher dann bei dem zeit-spektralen Muster angewendet wird, um eine Verteilung von inneren Produkten zwischen dem Eigenvektor und den Rah men des zeit-spektralen Musters zu bestimmen.

Nachfolgend wird die Erfindung anhand von bevorzugten Ausfüh rungsformen unter Bezugnahme auf die anliegenden Zeichnungen im einzelnen erläutert. Es zeigen:

Fig. 1 ein Blockdiagramm eines Spracherkennungssystems gemäß einer Ausführungsform der Erfindung;

Fig. 2 eine schematische Darstellung eines Beispiels eines Sprachmusters, das bei der Erfindung anwend bar ist, und

Fig. 3 einen Graphen, in welchem eine Häufigkeitsvertei lung von inneren Produkten zwischen einem Biblio theks- oder Archivmuster I und mehreren eingegebe nen Mustern II und III dargestellt ist.

In Fig. 2 ist ein Sprachmuster für eine Wort "shita" darge stellt, welches, wenn es in dem Klang der japanischen Spra che ausgesprochen wird, im englischen "down" bedeutet. Ein derartiges Sprachmuster kann gebildet werden, indem ein Sprachsignal in einem vorherbestimmten Zeitintervall, bei spielsweise von 10 ms, in einer Anzahl vorherbestimmter Fre quenzbänder beispielsweise mittels Bandpaß-Filtern abgetastet wird und die örtlichen Spitzenwerte in jeder Ansammlung von abgetasteten Daten quantisiert werden. Die Daten können umgesetzt werden, indem sie dann beispielsweise binär-be wertete Daten sind, indem eine Methode angewendet wird, die beispielsweise in der US-PS 46 34 966 beschrieben ist, wel ches den Erfindern der vorliegenden Anmeldung erteilt worden ist.

In dem in Fig. 2 dargestellten Sprachmuster liegt das Muster in einer Matrixform vor und hat neun Spalten und 34 Zeilen. Hierbei weist jede Zeile die Daten auf, welche durch Ab tasten in einem ganz bestimmten Abtast-Zeitabschnitt erhal ten worden sind, und jede Zeile wird daher auch Rahmen ge nannt. Mit anderen Worten, wenn eine eingegebene Sprache in einem vorher bestimmten Zeitintervall in einer Anzahl vor herbestimmter Frequenzbänder, welche voneinander verschieden sind, abgegetastet wird, wird eine Zeit-Frequenz-Verteilung erhalten. Eine solche Zeit-Frequenz-Verteilung kann verar beitet werden, um das in Fig. 2 dargestellte Sprachmuster festzulegen. In dem speziellen, in Fig. 2 dargestellten Sprachmuster legen die linken drei Spalten A bis C eine kombinierte Frequenzinformation fest. Das heißt, die Spalte A enthält kombinierte Daten für einen niederfrequenten Be reich, die Spalte B enthält kombinierte Daten für einen mittleren Frequenzbereich, und die Spalte C enthält kombi nierte Daten für einen hochfrequenten Bereich. Mit anderen Worten, die in der Frequenz analysierten Daten, die aus ei ner Anzahl Bandpaßfilter in einem vorherbestimmten Zeitinter vall erhalten worden sind, sind in drei Frequenzbereichen, nämlich nieder-, mittel- und hochfrequenten Bereichen zusam mengefaßt, und diese jeweiligen kombinierten bzw. zusam mengefaßten Daten sind in den entsprechenden, den nieder-, mittel- und hochfrequenten Bereichen entsprechenden Spalten angeordnet. Eine Spalte D enthält Daten, welche ein sprachlo ses bzw. stummes Intervall anzeigen, und Spalten E und F enthalten hervorgehobene nieder- und hochfrequente Daten, welche durch Verarbeiten der bezüglich der Frequenz analy sierten Daten in einer vorherbestimmten, dem Fachmann geläu figen Weise erhalten worden sind.

Von Bedeutung ist auch, daß das in Fig. 2 dargestellte Sprachmuster drei mit G bezeichnete Spalten enthält, wel che drei binäre Zahlen enthalten, welche einen binärkodier ten Dezimalkode (B.C.D. code) anzeigen, welcher Zeit an zeigt. Beispielsweise haben die ersten 15 Rahmen "000" in der Zeitspalte G, und dies zeigt an, daß die ersten 15 Rah men in einem vorherbestimmten Zeitintervall, z.B. 10 ms, für einen ersten Zeitabschnitt von etwa 15×10 ms=150 ms abge tastet worden sind. Die nächsten sechzehn Rahmen haben "001" in der Zeitspalte G, und dies zeigt an, daß die näch sten sechzehn Rahmen in dem vorherbestimmten Zeitintervall, z.B. 10 ms, für das folgende zweite Zeitintervall von etwa 16×10 ms=160 ms abgetastet worden ist, was vorzugsweise im wesentlichen gleich dem ersten Zeitabschnitt ist. Auf diese Weise werden eine Anzahl Rahmen in einem vorherbestimmten Zeitintervall für einen vorherbestimmten Zeitabschnitt abge tastet, welcher beliebig eingestellt werden kann, aber vor zugsweise wesentlich größer als das Abtastzeitintervall ein gestellt wird.

Da jeder Rahmen oder jede Zeile des in Fig. 2 dargestellten Sprachmusters neun Elemente hat oder das in Fig. 2 darge stellte Muster neun Spalten hat, kann das in Fig. 2 darge stellte Sprachmuster als eines betrachtet werden, das aus einer Anzahl N von neun Dimensionsvektoren gebildet ist. Wie im einzelnen später noch beschrieben wird, wird gemäß dem Grundgedanken dar Erfindung das Sprachmuster in einer in Fig. 2 dargestellten Matrixform der bekannten Hauptbestand teil-Analyse unterzogen, um einen Nicht-Null-Minimum-Eigen vektor festzulegen, und dann werden innere Produkte zwischen dem auf diese Weise erhaltenen Eigenvektor und den Rahmen des Bildmusters der Fig. 2 berechnet. Die sich ergebenen in neren Produkte werden in einer Häufigkeitsverteilung in einer Anzahl von (z.B. acht) Intervallen aufgetragen, die im Wert zueinander unterschiedlich sind, um dadurch ein Histo gramm der inneren Produkte festzulegen. Dieses Histogramm innerer Produkte wird als eine Identifizierung einer ganz bestimmten Stimme bzw. Sprache verwendet.

In Fig. 1 ist in Blockform ein Spracherkennungssystem gemäß einer Ausführungsform der Erfindung dargestellt. Das dar gestellte Spracherkennungssystem weist eine Vorverarbeitungs einheit 1 auf, in welcher ein Sprachsignal eingegeben wird, das beispielsweise mittels eines Mikrophons aus einer Spra che umgesetzt worden ist, die von einem Redner ausgesprochen worden ist. Die Vorverarbeitungseinheit 1 weist beispiels weise einen Sprech-Intervalldetektor auf, in welchem der Energiepegel des Sprachsignals überwacht wird, um ein Sprechintervall mit Hilfe eines Schwellenwertpegels zu be stimmen. Üblicherweise weist die Vorverarbeitungseinheit 1 auch eine Filterbank auf, welche aus einer Anzahl Bandpaß filter gebildet ist, welche hinsichtlich des Frequenzbereichs voneinander verschieden sind. Wenn im Ergebnis das Sprach signal durch die Vorverarbeitungseinheit 1 verarbeitet ist, wird das Sprachsignal in eine Anzahl verschiedener Frequenz bereiche digitalisiert. Die auf diese Weise erhaltenen, di gitalisierten Sprachsignale werden dann an eine Merkmal-Pa rametereinheit 2 abgegeben, in welcher die digitalisierten Sprachdaten in einer vorherbestimmten Weise verarbeitet wer den, um ein Sprachmuster beispielsweise der in Fig. 2 dar gestellten Form zu bilden. Das auf diese Weise gebildete Sprachmuster wird dann einer partiellen Anpassungs- und Vor bereitungs-Auswahleinheit 3 zugeführt, in welcher das auf diese Weise zugeführte Sprachmuster mit einer Anzahl Bib liotheks- oder Archivmuster verglichen wird, welche jeweils einer bekannten, in einem Speicher gespeicherten Sprache oder Stimme entsprechen. In diesem Fall wird das eingegebe ne Sprachmuster partiell mit jedem der Archivmuster, bei spielsweise mit einer vorherbestimmten Anzahl von ersten Rahmen, verglichen, um mögliche Kandidaten aus der Sammlung der Archivmuster auszuwählen, wobei die Kandidaten an einem Kandidatenspeicher 6 übertragen werden. Danach wird das ein gegebene Sprachmuster im Ganzen mit jedem der Kandidatenwor te verglichen, indem ein Ähnlichkeitsgrad mittels einer Ahn lichkeits-Berechnungseinheit 4 berechnet wird, und das Kan didatenwort mit dem höchsten Ähnlichkeitsgrad wird als ein erkanntes Ergebnis abgegeben.

In der bevorzugten Ausführungsform der Erfindung wird ein Sprachsignal einer Frequenzanalyse unterworfen, um eine Zeit-Frequenz- oder zeit-spektrale Verteilung zu erzeugen, und örtliche Spitzenwerte, welche als der Formant betrach tet werden können, werden extrahiert und als Merkmale des Sprachsignals benutzt. Der Anpassungsprozeß wird vorzugs weise in zwei Schritten durchgeführt. Das heißt, bei dem ersten Anpassungsschritt wird das eingegebene Sprachmuster mit jeder der Anzahl Archivmuster für eine vorherbestimmte Anzahl von z.B. 20 Rahmen von dem ersten Rahmen in den je weiligen Zeit-Frequenz-Verteilungsmustern verglichen, wobei der Stelle von lokalen Scheitelwerten Beachtung geschenkt wird. Eine vorherbestimmte Anzahl z.B. 20, dieser Archiv- Sprachmustern, deren lokale Scheitelwerte näher bei demjeni gen des eingegebenen Sprachmusters lokalisiert sind, werden als mögliche Kandidaten ausgewählt und an den Kandidaten speicher 6 übertragen. Bei dem zweiten Anpassungsschritt wird dann das eingegebene Sprachmuster nunmehr vollständig mit jedem der auf diese Weise ausgewählten Kandidaten-Ar chivsprachmuster mit Hilfe der Hauptbestandteil-Analyse ver glichen, wie nachstehend noch im einzelnen beschrieben wird. Das Sprachmuster einer in Fig. 2 dargestellten zeit-spektra len Verteilung enthält eine Anzahl Rahmen, die jeweils eine Zeile festlegen und als ein Element in einem Vektorraum be trachtet werden können. Folglich kann jeder Rahmen als ein Punkt Xi in dem neundimensionalen Vektorraum betrachtet wer den, welcher durch den folgenden Ausdruck festgelegt ist:

Xi = (Xi₁, Xi₂, . . . Xi₉) (1)

wobei i = 1,2, . . . N ist.

Ein Eigenvektor R für eine Wortsprache ist durch den folgenden Ausdruck festgelegt. Hierbei ist zu beachten, daß ein derartiger Eigenvektor durch ein Sprachmuster des in Fig. 2 dargestellten Formats für jede bekannte Sprache bzw. Stimme durch Anwenden der Hauptbestandteil-Analyse bestimmt werden kann.

R = (r₁, r₂, . . . r₃) (2)
wobei

ist.

Ein inneres Produkt zwischen dem Eigenvektor R und Xi kann durch den folgenden Ausdruck festgelegt werden:

Nunmehr wird die Berechnung des inneres Produkts aus G 1.(3) bei jedem Rahmen angewendet, so daß eine Anzahl von N inneren Produkten erhalten wird, wenn das Sprachmuster eine Anzahl von N Rahmen hat. Mit Hilfe der auf diese Weise erhaltenen inneren Produkte wird eine Häufigkeitsverteilung oder ein Histogramm von inneren Produkten gebildet, wie in Fig. 2 dar gestellt ist. Diese Operation wird für jede der bekannten Sprachen oder Stimmen durchgeführt, um ein Histogramm von inneren Produkten festzulegen, welche als innere Produkte zwischen dem Eigenvektor R und den Rahmen eines Sprachmu sters erhalten worden sind. Das auf diese Weise erhaltene Histogramm oder die entsprechende Häufigkeitsverteilung von inneren Produkten wird als ein Parameter gespeichert, wel cher einer ganz bestimmten Sprache bzw. Stimme zugeordnet ist. Folglich hat das in Fig. 1 dargestellte Spracherken nungssystem zwei Operationsmode, d.h. einen Registrierungs mode und einen Erkennungsmode. Wenn das Spracherkennungs system in dem Registrierungsmode betrieben wird, wird eine bekannte Sprache oder Stimme eingegeben, und deren Histo gramm von inneren Produkten, die, wie vorstehend beschrieben, berechnet worden sind, wird erzeugt und wird als ein Para meter gespeichert, welcher der bekannten Sprache oder Stimme zugeordnet ist. Auf diese Weise werden eine Anzahl bekann ter Sprachen/Stimmen als Bibliotheks- oder Archivdaten ge speichert, welche das Sprachmuster und das Histogramm in nerer Produkte aufweisen. Dann wird das Spracherkennungs system in den Erkennungsmode gesetzt, und dann wird eine eingegebene unbekannte Sprache/Stimme mit jedem der Bib liotheks- oder Archivdaten verglichen, um die Identifizie rung der eingegebenen Sprache /Stimme festzustellen bzw. zu bestimmen.

Bestimmung von Eigenvektor R

Es ist wichtig, einen Eigenvektor zu bestimmen, so daß die Spannweite der Werteverteilung von inneren Produkten be grenzt wird, um so die Speicherkapazität zu begrenzen, die zum Speichern der Häufigkeitsverteilung von inneren Pro dukten erforderlich ist. Zuerst wird ein Eigenvektor be stimmt, um so die Streuung oder Abweichung der inneren Pro dukte (R, Xi) zu minimieren. Eigenwerte können bestimmt werden, indem ein bekanntes Eigenwertproblem für ein Sprach muster mit einem Matrixformat gelöst wird, wie es in Fig. 2 dargestellt ist. Unter den auf diese Weise bestimmten Ei genwerten wird dann ein Nicht-Null- und der kleinste Eigen wert ausgewählt, und dessen entsprechender Eigenvektor für das spezielle Sprachmuster bestimmt und festgelegt. Da auf diese Weise der kleinste Wert ausgewählt wird, kann die Spannweite einer Verteilung von inneren Produkten mini miert werden. Dies ist vorteilhaft, um Speicherkapazität zu sparen, die zum Speichern der Daten einer Häufigkeits-Ver teilung von inneren Produkten erforderlich ist. Dann wird ein Histogramm von inneren Produkten bestimmt und zusammen mit deren Eigenvektor in der Bibliothek 5 gespeichert.

Erkennungsverarbeitung

Um die eingegebene unbekannte Sprache/Stimme zu identifi zieren, wird eine Berechnung des inneren Produkts zwischen dem Sprachmuster der eingegebenen Sprache/Stimme, wie in Fig. 2 dargestellt ist und dem Eigenvektor jeder der Kandi datensprachen durchgeführt, welche als ein Ergebnis der Vor bereitungsanpassung ausgewählt worden ist, und wird nunmehr in dem Kandidatenspeicher 6 gespeichert. Somit ist eine Häu figkeits-Verteilung oder ein Histogramm von inneren Produk ten für jeder der Kandidaten-Stimmen bestimmt. Basierend auf den auf diese Weise erhaltenen Häufigkeitsverteilungen von inneren Produkten wird bestimmt, welche von den Kandidaten- Stimmen den höchsten Ahnlichkeitswert hat. In Fig. 3 ist ein Graph dargestellt, welche mehrere Häufigkeitsverteilungen von inneren Produkten zeigt, wobei auf der Abszisse die Wer te der inneren Produkte und auf der Ordinate die Häufigkeit des Auftretens aufgetragen ist. Somit kann der Graph der Fig. 3 dafür angesehen werden, Histogramme festzulegen, wel che anzeigen, daß Werte von inneren Produkten, die in einen bestimmten Wertebereich fallen, soviel Mal auftreten. Daher ist die Abszisse in der Tat in eine vorherbestimmte Anzahl (z.B. 8) Bereichen unterteilt, und folglich ist jede Vertei lung nicht eine kontinuierliche Verteilung, sondern legt eher ein Histogramm fest.

In Fig. 3 zeigt die ausgezogene Kurve I eine Häufigkeits verteilung von inneren Produkten für eine ganz bestimmte Bibliotheksstimme an, und die gestrichelte Kurve II zeigt eine Häufigkeitsverteilung von innerenProdukten für eine eingegebene unbekannte Sprache an, welche der ganz bestimmten Bibliotheksstimme entspricht. Da die Ver teilungen I und II für denselben Klang gelten, sind diese Verteilungen I und II beinahe identisch übereinander ange ordnet. Andererseits zeigen die anderen drei gestrichelten verteilungen III Häufigkeitsverteilungen von inneren Pro dukten an, welche für verschiedene (Stimmen) Sprachen erhalten worden sind. Wenn auf diese Weise die eingegebene, unbe kannte Stimme sich von der Bibliotheks (Archiv) Stimme un terscheidet, unterscheidet sich die Häufigkeitsverteilung der inneren Produkte drastisch in der Höhe und der seitli chen Streuung. Folglich kann durch Berechnen des Ahnlich keitsgrads in der Häufigkeitsverteilung der inneren Produkte zwischen eingegebener und Bibliothekssprache (Stimme) die Iden tität der eigegebenen Sprache/Stimme bestimmt werden.

Wie oben beschrieben, kann gemäß der Erfindung, da eine Häufigkeitsverteilung von innerenProdukten und ein Eigen vektor als Parameter benutzt werden, um eine ganz bestimm te Bibliothekssprache (Stimme) zu identifizieren, die Spei cherkapazität, die zum Speichern von Bibliothekssprachen daten erforderlich ist, beträchtlich gemindert werden. Folglich kann für eine gegebene Speicherkapazität eine größere Anzahl von Bibliothekssprachdaten gespeichert wer den. Insbesondere kann in dem BTSP-System, in welchem ein Sprachmuster in Form einer zeit-spektralen Verteilung binär-bewertet ist, die Berechnung von inneren Produkten nur durch Addition durchgeführt werden, was besonders vor teilhaft ist. Außerdem ist gemäß der Erfindung die Spei cherkapazität, die für eine Bibliothekssprache (Stimme) erfor derlich ist, annähernd 20 Bytes, und die Rechenvorgänge bei der Spracherkennungs-Verarbeitung sind vereinfacht und meistens Additionen, so daß für eine Bibliothek von annä hernd 50 Wort-Sprachen eine Spracherkennung mit Hilfe eines 8-Bit-Universal-Mikroprozessors hinlänglich durchgeführt werden kann. Zu beachten ist auch, daß ein Sprachmuster, das in der vorliegenden Erfindung verwendbar ist, nicht auf das eine in Fig. 2 dargestellte Muster beschränkt werden sollte. Ein Sprachmuster mit Rahmen, die jeweils eine Häufigkeits- Information und eine Zeitinformation haben, kann in der vor liegenden Erfindung verwendet werden. Beispielsweise können die Spalten A bis F Daten enthalten, welche ein Teil einer einer zeit-spektralen Verteilung sind, welche dadurch er halten worden ist, daß ein Sprachsignal einer Frequenz analyse unterworfen wird.

Claims

1. Verfahren zur Spracherkennung, dadurch gekenn zeichnet, daß
ein eingegebenes Sprachmuster aus einem eingegebenen Sprachsignal einer eingegebenen unbekannten Sprache gebildet wird, wobei das eingegebene Sprachmuster eine Anzahl Rahmen enthält, die jeweils Frequenz-und Zeitdaten haben;
das eingegebene Sprachmuster mit einem Bibliotheks-Sprach muster jeder einer ersten Anzahl von bekannten Bibliotheks sprachen teilweise verglichen wird, um eine zweite Anzahl von Kandidaten-Bibliothekssprachen auszuwählen, von denen jede einen Eigenvektor und eine Häufigkeitsverteilung von inneren Produkten zwischen den Rahmen der Bibliotheksspra che und des Eigenvektors hat,
eine Häufigkeitsverteilung von inneren Produkten zwischen den Rahmen des eingegebenen Sprachmusters und dem Eigen vektor jeder der zweiten Anzahl von Kandidaten-Bibliotheks sprachen berechnet wird, und
eine Sprache (Stimme) aus der zweiten Anzahl von Kandidaten- Bibliothekssprachen ausgewählt wird, deren Häufigkeitsver teilung der inneren Produkte sehr ähnlich einer der Häufig keitsverteilungen von inneren Produkten ist, welche bei dem Berechnungsschritt berechnet worden sind, um dadurch die eingegebene Sprache (Stimme) mittels der auf diese Weise ausgewählten Bibliothekssprachen zu identifizieren.

2. Verfahren nach Anspruch 1, dadurch gekenn zeichnet, daß das Sprachmuster eine Matrixform hat, die aus einer ersten, vorherbestimmten Anzahl von Zeilen und aus einer zweiten vorherbestimmten Anzahl von Spalten gebildet ist, wobei jede der ersten vorherbestimmten Anzahl von Zeilen einem entsprechenden der Rahmen entspricht.

3. Verfahren nach Anspruch 1, dadurch gekenn zeichnet, daß der Schritt Vergleichen durchgeführt wird, indem eine vorbestimmte Anzahl erster Rahmen des ein gegebenen Sprachmusters mit den entsprechenden Rahmen jedes der Bibliothekssprachmuster verglichen wird.

4. Verfahren nach Anspruch 1, dadurch gekenn zeichnet, daß jede der Bibliothekssprachen aus Daten gebildet ist, welche ein Wort darstellen.

5. Verfahren nach Anspruch 1, dadurch gekenn zeichnet, daß der Eigenvektor ein Nicht-Null- und der kleinste Eigenvektor ist, welcher dadurch erhalten wird, daß das Sprachmuster einer Hauptbestandteils-Analyse unterzogen wird.