DE2613258A1 - System zur automatischen spracherkennung - Google Patents

System zur automatischen spracherkennung

Info

Publication number
DE2613258A1
DE2613258A1 DE19762613258 DE2613258A DE2613258A1 DE 2613258 A1 DE2613258 A1 DE 2613258A1 DE 19762613258 DE19762613258 DE 19762613258 DE 2613258 A DE2613258 A DE 2613258A DE 2613258 A1 DE2613258 A1 DE 2613258A1
Authority
DE
Germany
Prior art keywords
decision
signal
signals
correlation data
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19762613258
Other languages
English (en)
Other versions
DE2613258C2 (de
Inventor
Jun James Erving Paul
Visvaldis Alberts Vitols
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Boeing North American Inc
Original Assignee
Rockwell International Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Rockwell International Corp filed Critical Rockwell International Corp
Publication of DE2613258A1 publication Critical patent/DE2613258A1/de
Application granted granted Critical
Publication of DE2613258C2 publication Critical patent/DE2613258C2/de
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/10Speech classification or search using distance or distortion measures between unknown speech and reference templates
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Description

PATENTANWALT
DIPL-ING.
6 Frankfurt am Main 70
Schneckenhofstr. 27 - Tel. 617079
26. März 1976 ROCKWELL INTERNATIONAL CORPORATION Gzw/goe
System zur automatischen Spracherkennung.
Die Erfindung betrifft ein System zur Spracherkennung gemäß dem Gattungsbegriff des Hauptanspruches, insbesondere ein System, das fähig ist, Schlüsselworte in einer kontinuierlich gesprochenen Sprache zu erkennen.
Es sind bereits zahlreiche Spracherkennungs-Systeme für die Anwendung in der Datenverarbeitung, der Kommunikation und der industriellen MaschiVensteuerung vorgeschlagen worden.
Die US-PS Nr. 3,775,627 und Nr. 3,582,559 beschreiben Worterkennungs-Systeme, die diskrete Worte erkennen können, die jedoch nur bei Isolierten sprachlichen Äußerungen arbeitsfähig sind, und die funktionell nicht in der Lage sind, Schlüsselwörter bei einer kontinuierlich gesprochenen Sprache zu erkennen.
Die US-PS 3,588,363 beschreibt ein Worterkennungs-System, das auf einer Folge von phonetischen Ereignis-Anzeigen basiert. Dieses System ist zwar anwendbar bei einzelnen sprachlichen Äußerungen, ist jedoch funktionell nicht in der Lage, bei einer kontinuier-
609884/0999
lieh gesprochenen Sprache verwendet zu werden, da das Ton-Erkennungsnetzwerk zu Beginn jedes Wortes zurückgestellt werden muß.
Die US-PS'en 3,557,310 und 3,688,126 beschreiben ein Worterkennungs-System mit einem begrenzten Vokabular (festgelegt auf zwei Worte). Keines dieser beiden Systeme wird einem Schlüsselwort in einer kontinuierlich gesprochenen Sprache gerecht.
In der US-PS 3,499,989 wird ein System zur Anzeige von Pormanten im Sprachsignal (Pole in der Vokal-Übertragungsfunktion) beschrieben. Dieses System sieht jedoch eine Sprachanalyse, aber keine Klassifikation von sprachlichen Äußerungen vor.
Die US-PS 3,428,748 beschreibt ein System zum Klassifizieren von Vokalen, wobei eine Entscheidung über vokale und nicht vokale Töne getroffen wird. Dieses System ist gleich dem System nach der US-PS 3,499,989 ein Sprach-Analysator und ist nicht fähig, eine Klassifikation von Äußerungen durchzuführen. .Die US-PS'en 3.129,287 und 3,742,143 beschreiben Wor.terkennungs-Systeme mit einem beschränkten Vokabular, die nicht fähig sind, der Erkennung eines Schlüsselwortes gerecht zu werden.
Das System gemäß der US-PS 3,198,884 ist auf die Erkennung von einzelnen Ziffern abgestellt. Dieses System sieht über" einen
Segmentierungsvorgang eine akustische Zeitregistrierung vor. Diese Segmentierungsvorgänge eröffnen die Möglichkeit Tür yPehler und sind ungeeignet zur Erkennung von Schlüsselworten.
Das System gemäß der US-PS 3,7^2,146 ist auf die Klassifikation von Vokalen gerichtet und besitzt keine Vorkehrungen zum Kombinieren dieser Ereignisse für die Anzeige eines Schlüsselwortes.
In dem Artikel von G. L. Clapper, mit dem Titel "Automatic Word Recognition", Seiten 57-69 des IEEE-Spectrum, August 1971, wird ein System für die Erkennung einzelner Worte beschrieben. Da dieses System auf Grenzinformationen von Worten beruht, ist durch dieses System eine Erkennung von Schlüsselworten unmöglich.
Das asynchrone Anzeigen von Schlüsselworten in einer kontinuierlichen Sprache setzt voraus, daß in dem Erkennungsverfahren keine Synchronisationspunkte verwendet werden. Aus zwei Gründen ist eine asynchrone Anzeige bei der Klassifikation von kontinuierlichen Sprachsignalen im Speziellen wünschenswert. Zunächst wird die Dauer eines Schlüsselwortes in einer kontinuierlichen Spra-
dem ehe durch die Sprachgeschwindigkeit und die Stärke, die/Schlüssel wort als Teil der gesprochenen Nachricht mitgegeben wird, Zum zweiten ist die Stellung derselben phonetischen Elemente über
609884/0999
eine Anordnung von verschiedenen Äußerungen desselben Schlüsselverwendet
wortes nichtlineaj/. Dieser zweite Grund vermindert die Verwendbarkeit der linearen Zeitnormierung, die sich als sehr nützlich bei der Erkennung von einzelnen Worten erwiesen hat.
Viele der vorstehend erläuterten bekannten Spracherkennungs-Systeme als auch andere ähnliche Systeme sehen Synchronisationspunkte in dem Erkennungsverfahren vor, übliche bekannte Verfahren leiten die Synchronisationspunkte von vorklassierenden Segmentierungsverfahren ab. Segmentierungsverfahren besitzen zwei natürliche Wachteile. Zunächst sinkt die Leistungsfähigkeit rapide ab, wenn in dem Signal Rauschen enthalten ist. Ein synchrones Verfahren, das von Hause aus verrauscht ist, ist für ein System zum Erfassen eines Schlüsselwortes kein optimales Verfahren, weil eine ausgelassene Segmentierungsgrenze trotz einer perfekten Erlcennungs logik des Schlüsselwortes verhindern kann.
Keines der oben beschriebenen Systeme ist fähig, in einer kontinuierlichen Sprache ein oder mehrere Schlüsselwörter zu erfassen. Der Erfindung liegt die Aufgabe zugrunde, ein Verfahren anzugeben, das die Erkennung von Schlüsselwörtern in einer kontinuierlichen Sprache gewährleistet. Die Lösung dieser Aufgabe gelingt gemäß den kennzeichnenden Merkmalen des Hauptanspruches.
609884/0999
Die Erfindung bezieht sich somit auf ein neues asynchrones Anzeigesystem,das fähig ist, eine unbegrenzte Anzahl von Schlüsselwörtern in einer kontinuierlichen Sprache zu erfassen, wobei das System keine Isolierung bzw. Segmentierung von Worten erfordert. Bei einer bevorzugten Ausführungsform wird mittels eines Sprach-Prozessors' aus einem eingangsseitigen kontinuierlichen Sprachsignal eine Vielzahl von analogen Sprachparameter extrahiert und mittels eines STV-Generatorkreises selektiv in digitalisierte Zeit-Spektral-Matrix-Sprachsignalabtastwerte umgewandelt. In einem asynchronen Korrelationskreis werden Polgen der digitalisierten Sprachsignalabtastwerte kontinuierlich mit gespeicherten Spektral-Bezugs-Abdeckschablonen, die vorbestimmten zu erkennenden Schlüsselwörtern entsprechen, korreliert, um korrelierte Daten zu erzeugen. Diese korrelierten Daten setzen einen Ent» scheidungsfunktions-Kreis in die Lage, für jedes der vorgewählten erfaßten Schlüsselworte ein Entscheidungs-Ausgangssignal zu erzeugen.
Es ist ein Ziel der vorliegenden Erfindung, ein neues,asynchrones Spracherkennungssystem zu entwickeln; ein anderes Ziel der Erfindung ist es, ein System zu entwickeln, das zur Erkennung von Schlüsselworten in fortlaufender Sprache befähigt ist. Ein weiteres Ziel der Erfindung ist ein System zur Erkennung von Schlüsselworten in fortlaufender Sprache durch Anwendung einer fortlaufenden asynchronen Korrelationsverarbeitung.
Anhand von in der Zeichnung dargestellten Ausführungsbeispielen wird die Erfindung näher erläutert.
■-/-609884/0999
Es zeigen:
Fig. 1 ein vereinfachtes Blockschaltbild einer bevorzugten Ausführungsform der Erfindung;
Fig. 2 ein Blockschaltbild des Sprach-Prozessors der Fig. Ij Fig. 3 ein Blockschaltbild des STV-Generators der Fig. 1;
Fig. k Impulsdiagramme zur Erläuterung der Arbeitsweise des STV-Generators nach Fig. 3;
Fig. 5 ein Blockschaltbild des asynchronen Korrelationskreises nach Fig. Ij
Fig. 6 ein Blockschaltbild der zentralen Steuerung der Fig. 5;
Fig. 7 ein Impulsdiagramm zur Erläuterung der Arbeitsweise der zentralen Steuerung nach Fig. 6;
Fig. 8 ein Blockschaltbild der Maskeneinheit nach Fig. 5;
Fig. 9 die Adressenpositionen in dem Maskenspeicher nach den Fig. 5 und 8;
Fig. 10 ein Blockschaltbild der Speichereinheit mit direktem Zugriff gemäß Fig. 5 J
Fig. HA und 113 die STV-Adressenposition in den Speicher der Fig. 5 und 10 während der gewählten Zustände "LOAD" und "RUN"j
Fig. 12 verschiedene Typen von Korrelationsoperationen, durchgeführt durch einige der verschiedenen Konfigurationen, die in der arithmetischen Strang-Einheit der Fig. 5
verwendet werden könnenj -/-
609884/0999
Fig» 13A und 13B zwei verschiedene Verwirklichungen der Vergleichsfunktion gemäß Fig. 5 und 12;
Fig. 14A, 14B und I1IC drei verschiedene Realisierungsmöglichkeiten für den Schwellwertfunktions-Änderer nach Fig. 5 und 12;
Fig. 15A und 15B zwei verschiedene Realisierungsmöglichkeiten für den Gewichts-Funktion-Änderer der Fig. 5 und 12;
Fig. 16 ein Blockschaltbild des Summen-Akkumulators der Fig. 5 und 12;
Fig. 17 die Arbeitsweise der von Eins verschiedenen arithmetischen Strang-Einheit 151 für eine Maske X mit der Länge von l6 Worten;
Fig. 18 ein Blockschaltbild eines ersten Teils der Entscheidungsfunktion nach Fig. 1;
Fig. 19 ein Blockschaltbild eines zweiten Teiles der Entscheidungsfunktion nach Fig. 1, und
Fig. 20 ein Blockschaltbild eines alternativen zweiten Teiles der Entscheidungsfunktion nach Fig. 1, die anstelle der Anordnung nach Fig. 19 verwendbar ist.
609884/0999
Die Fig. 1 zeigt ein vereinfachtes Blockschaltbild eines bevorzugten Ausführungsbeispiels der Erfindung zum Erfassen eines oder mehrerer Schlüsseiworte in einer am Eingang anliegenden kontinuierlichen Sprache. Ein Sprach-Prozessor 11, der im wesentlichen ein Spektral-Analysierer ist, führt in dem kontinuierlichen breitbandigen Eingangs-Sprachsignal N analoge spektrale Bestimmung durch, um in N-Kanälen analoge Sprechparameter S. bis S„ zu erzeugen. Diese spektralen Bestimmungen können der Energie von Bandpässen entsprechen, deren Grenzen jeweils um 200 Hz auseinanderliegen. Jeder der N-Kanäle der analogen Sprachparameter werden mittels eines STV-Generators 13 zeit-multiplext und digitalisiert, um ein jeder lO-Millisekunden-(msec)-Periode Spektral-Zeit-Vektor-(STV)-Daten mit N-Kornponenten zu erzeugen.
Diese STV-Daten des STV-Generators 13 werden in einem asynchronen Korrelationskreis 15 gespeichert, zusammen mit einer vorbestimmten Anzahl von vorher empfangenen STV-Daten, um so eine Folge von gespeicherten STV-Daten zu erzeugen. Zu jedem Zeitpunkt, in dem ein neuer STV-Wert erhalten wird, wird der älteste gespeicherte STV-Wert aus der Folge entfernt. Die Folge der gespeicherten STV-Daten formt im wesentlichen ein Spektogramm, wobei die Frequenzkomponenten jeder der STV-Daten beispielsweise entlang einer vertikalen Frequenzachse angeordnet sind und wobei die STV-Daten entlang einer horizontalen Zeitachse in Abständen
S09884/0999
— ο —
von 10 msec, angeordnet sind. Werden also STV-Daten jede 10 msec, entnommen, dann entsteht ein Muster, das das Spektogramm bildet.
Der asynchrone Korrelationskreis 15 bewirkt kontinuierlich eine asynchrone Korrelation hinsichtlich der Folge der STV-Daten, die von dem STV-Generator 13 erzeugt werden. Um diese kontinuierliche asynchrone Korrelation durchzuführen, werden die ankommenden digitalisierten Sprachparameter in der Folge der aufeinanderfolgenden STV-Daten selektiv mit intern gespeicherten Bezugs-Maskenschablonen oder Masken (gezeigt in Fig» 9) in dem Korrelationskreis 15 korreliert. Die gespeicherten Masken entsprechen Unterelementen der Schlüsselwortäußerung. Typischerweise stellen diese Unterelemente ein Paar von Phonemen ("dyads" oder zwei phonetische Ereignisse) und/oder ein Triplet von Phonemen ("triads" oder drei phonetische Ereignisse) dar. Ein "dyad" oder "triad" ist in jeder Maske gespeichert. Im Mittel sind in dem vorliegenden System für die Anzeige des gewünschten Schlüsselwortes sechs Masken notwendig.
Es sollte angemerkt werden, daß die englische Sprache ein phonetisches Alphabet besitzt, das aus phonetischen Symbolen aufgebaut ist, die ihrerseits diese phonetischen Ereignisse darstellen. In der englischen Sprache sind ungefähr 44 phonetische Ereignisse bzw. Erscheinungen vorhanden. Diese phonetischen Er-
609884/0999
eignisse schließen auch beispielsweise die Vokale ee, üb, uu, er, ah usw. ein, dh. "stops", die eine Person durchführt, indem sie in bestimmten Positionen t, k, g, b usw. und bei anderen Konsonanten die stimmhafte Aussprache abschließt.
Die gespeicherten Masken können eine verschiedene Länge aufweisen* Typischerweise können sie in der Länge von 1 bis 16 STV-Daten schwanken, wobei im Mittel eine Maske eine Länge von ungefähr 10 STV-Daten hat.
Jede der gespeicherten Masken wird periodisch mit einer entsprechend langen Folge von aufeinanderfolgenden STV-Daten verglichen, zwecks Identifizierung bzw. Korrelierung der "dyad"- und "triad"-Tongruppen. Die am nahe kommendste Korrelation zwischen jeder Maske und der entsprechenden STV-FoIge wird durch ein entsprechendes Korrelationszeichen angezeigt. Auf diese weise wird periodisch einsMessung für die Schlüsselwort-Wahrscheinlichkeit für jedes der gewünschten Schlüsselworte berechnet.
Die Ausgangs-Korrelationszeichen zwischen der gespeicherten Maske und den in Parametern aufgelösten Sprachsignalen oder STV-Daten gehen in die ausgangsseitige Korrelationsinformation des Korrelationskreises 15 ein. Diese ausgangsseitige Korrelation^-Information wird durch den Entscheidungs-Punktions-Kreis 17, der ein
-/-609884/099S
Rechner oder eine spezielle Logik sein kann, in ein Gesamt-Xhnlichkeitsmaß kombiniert. Die Entscheidungsfunktion 17 besitzt intern Schwellwerte für dieses Ähnlichkeitsmaß, um für jedes Schlüsselwort, das erfaßt wurde, ein das Erscheinen anzeigendes Entscheidungs-Ausgangssignal zu erzeugen. Die unter der Entscheidungsfunktion vorgenommene Kombination der Korrelationsdaten berücksichtigt sowohl die zeitliche Folge der Unterelemente des Schlüsselwortes als auch die Veränderbarkeit der Gliederungsrate (articulation rate).
Ein System-Zeitgenerator 19 erzeugt über interne, nicht dargestellte Teilerstufen ausgangsseitig Taktzeitimpulse von 1 MHz, 100 KHz und 100 Hz, die selektiv an die Kreise der Pig. I angelegt sind, damit sie in der oben beschriebenen Weise arbeiten können. Im folgenden sollen die Komponenten der Fig. 1 in größeren Einzelheiten erläutert werden, damit die Erfindung besser verständlich ist.
Die Fig. 2 zeigt ein Blockschaltbild des Sprach-Prozessors 11 der Fig. 1. Das eingangsseitige kontinuierliche Sprachsignal wird gesteuert verstärkt durch einen automatischen Verstärkungssteuerkreis 21, bevor es an die Vor-Anhebestufen 23 angelegt wird. Diese Vor-Anhebestufen 23 heben das Frequenzspektrum des Signals von dem Schaltkreis 21 beispielsweise um 6 Decibel pro Oktave an, bevor das resultierende vorangehobene Signal an einen
6 0 988 h /0999
Spektralanalysator 25 gelangt. Der Spektralanalysator 25 kann eine Filterbank von nicht-dargestellten aufeinanderfolgenden 200 Hs-Bandpaß-Filtern aufweisen, zwecks Trennung der verschiedenen Frequenzkomponenten in dem vorangehobenen Signal.
Die verschiedenen getrennten Frequenskomponenten des Spektralanalysators 25 durchlaufen zunächst eine Gleichrichtung mittels der Dioden 27\ - 27K und werden anschließend mittels Tiefpaßfilter 29,, - 29K gefiltert, bevor sie an übliche logarithmische Verstärker 31-j - 31K angelegt werden, die die analogen Sprechparameter S. - S-. erzeugen. Die Ausgangssignale von vorbestimmten der Filter 29-j - 29K können weiterhin an einen Grundzug-Herausnehmer 33, der lineare oder nicht-lineare Funktionen dieser vorgewählten Filter-Ausgangssignale erzeugt, angelegt werden, zwecks Erzeugung der analogen Sprechparameter SK+.. - S . Eine vorbestirnmte Anzahl und Kombination von analogen Sprechparametern der logarithmischen Verstärker 31-, - 31K und des Grundzug-Herausnehmers 33 kann in der nachfolgenden Signalverarbeitung verwendet werden» Zum Zweck der vorliegenden Beschreibung ist angenommen, daß die gesamte Anzahl der analogen Sprechparameter, die behandelt werden, N ist, wobei N = 16 ist. Die spektralen Bestimmungswerte oder analogen Sprechparameter S^ - S.g (da N=l6) des Sprach-Prozessors 11 werden an den STV-Generator 13 angelegt, zwecks Erzeugung einer entsprechenden STV-Information.
609884/0999
In Pig. 3 ist ein Blockschaltbild eines derartigen STV-Cenerators 13 dargestellt. Bei der Erklärung der Arbeitsweise des Schaltkreises 13 der Pig. 3 wird weiterhin auf die Impulsdiagramme der Fig. 4 Bezug genommen. Das 100-Hz-Signal (Kurve 41) von dem System-Zeitgenerator 19 wird mittels eines Differenziergliedes und eines negativen Begrenzers 43 differenziert bzw. nach dem Negativen hin begrenzt zwecks Erzeugung eines Lade-Start-Impulses (SOL), dargestellt in der Kurve 45 der Fig. 3. Dieser SOL-Impuls setzt das Flip-Flop 47 zwecks Anschaltung des Pulsgatters 49. Das Pulsgatter 49 schaltet das UND-Gatter 51 an, damit dieses eine vorbestimmte Zahl von 100 KHz-Impulsen des System-Zeitgensrators 19 durchläßt, und zwar als eine 100 KHz-Folge von 16 Impulsen, dargestellt durch die Kurve 53. Diese 100 KHz-Impulsfolge wird mittels eines Verzögerungskreises 55 um 5 Mikrosekunden ( ,usec) verzögert, bevor sie als verzögerte 100 KHz-Folge von 16 Impulsen (Kurve 57) an den Zähleingang (C) des Zählers 59 angelegt wird, damit seine Zählfolge eingeleitet wird. Der Zählstand des Zählers 59 wird als Ausgangssignal an einen Vergleicher 61 geführt, indem er mit einem Zählstand N = 16 verglichen wird. Erreicht daher der Zählstand des Zählers 6l den Wert 16, dann erzeugt der Vergleicher einen Lade-Löschimpuls 63, der dazu verwendet wird, den Zähler 59 auf den Zählstand Null zurückzustellen und das Flip-Flop 47 zu löschen, damit verhindert wird, daß irgendwelche nachfolgenden Impulse das UND-Gatter 51 passieren und vom Zähler 59 gezählt werden. Der Lade-Löschimpuls 63 wird
6U9884/0999 "'"
mittels eines Verzögerungskreises 65 um 10 Mlkrosekunden verzögert zwecks Erzeugung eines Lade-Ende-Impulses 67 (EOL)» Die SOL- und EOL-Impulse werden an eine zentrale Steuereinheit 87 in Fig. 5 angelegt, deren Arbeitsweise im nachfolgenden beschrieben wird.
Die 100 KHz-Impulsfolge 53 des UND-Gatters 51 wird an den Schaltschritt-Eingang eines N bzw. -16-kanaligen Multiplexers69 angelegt. Der Multiplexer 69 schaltet bei jedem der 16 Impulse der 100 KHz-Impulsfolge um eine Position weiter. Die analogen Sprechparameter S. *" S £ des Sprachprozessors 11 (Fig. 2) werden parallel an den .-.Multiplexer 69 angelegt. Mit jedem der an dem Schaltschritt-Eingang angelegten Impulsen der ΐβ Impulse der 100 KHs-Impulsfolge führt der Multiplexer 69 hinsichtlich der S^ - S ,--Eingangssignale einen Zeit-Multiplexvorgang durch, so daß sie nacheinander
(ADC)
an einen Analog/Digital-Umsetzer 73/angelegt werden. Der Multiplexer erzeugt weiterhin Abtastimpulse 71, die an den Analog/ Digital-Umsetzer 73 angelegt werden, damit dieser Umsetzer in der Lage ist, nacheinander die nacheinander erscheinenden spektralen-Vergleichssignale S1 - S.g zu digitalisieren. Die l6 nacheinander erzeugten digitalisierten spektralen Vergleiche bilden einen spektralen Zeitvektor (STV). Jede 10 msec, wird ein neuer spektraler Zeitvektor erzeugt. Diese 10 msec.-Periode ist die Zwischenimpuls-Periode der 100 Hz-Impulse des System-Zeit-
609884/0999
Generators 19. Nachdem eip neuer STV mittels des Analog/Digitäl-Umsetzers erzeugt ist, wird der Multiplexer 69 zwecks Vorbereitung des Startes des nächsten Ladezustandes durch den EOL-Impuls in seine anfängliche Schaltschritt-Position zurückgestellt.
Jeder der digitalisferten S1-S g Spektral- Schätzwerte ist ein binäres Wort, das z.B» aus 6 Bits bestehen kann. Es soll an dieser Stelle klargestellt werden, daß der Begriff "Wort" im vorliegenden Zusammenhang ein binäres Wort bedeutet, während der Begriff "Schlüsselwort" ein Wort des Wörterbuches bedeutet, das in dem eingangsseitigen Sprachsignal erfaßt werden soll.
Die spektralen Schätzwerte oder analogen Sprechparameter S1 bis S1^ werden nacheinander herausgegeben, weil der Analog/ Digital-Umsetzer 73 annähernd 10 ,usec benötigt, um pro Abtastwert eine Analog/Digital-Umwandlung durchzuführen. Daher dauert es annähernd l60 ,usec, bis alle 16 Kanäle der seriell dargestellten Sprechparameter S1 - S1^ digitalisiert sind. Wie bereits oben erwähnt wurde, enthalten die 16 aufeinanderfolgend erzeugten digitalisierten Spektral-Bestimmungswerte S.-S.g einen spektralen Zeitvektor (STV). In dem vorliegenden Beispiel besteht daher jeder STV aus einer seriellen Folge von 16 binären Worten, wobei jedes Wort 6 Bit lang ist. Nachdem jeder der spektralen Bestimmungswerte S1-S^ digitalisiert ist, erzeugt der Analog/
609884/0999
Digital-Umsetzer 73 ein Daten-Verfügbarkeitssignal 75, das an- zeigt, daß die STV-Daten für die Benutzung bereitstehen.
In Fig. 5 werden die STV-Daten und Daten zur Verfügung stellende Signale nach Fig. 3 an einen Speicher mit direktem Zugriff 8l (RAM) und eine RAM-Steuerung 83 in einer RAM-Einheit 85, die später noch erläutert wird, angelegt, während die SOL- und EOL-Impulse des STV-Generators 13 der Fig. 3 an die Zentralsteuerung 87 angelegt werden. Die Zentralsteuerung 87 erzeugt Lade- und Laufgatter, die die Dauer der entsprechenden Lade-und Lauf-Arbeitszustände steuern. Zu diesem Zeitpunkt erscheint es zweckmäßig, das Blockschaltbild der Zentralsteuerung 87 in Fig. 6 und die Impulsediagramme der Fig. 7 zu erläutern, damit die Arbeitsweise der Zentralsteuerung .besser verständlich ist.
In Fig. 6 setzt der SOL-Impuls 45 (Fig. 3, 4 und 7) ein Ladein Betrieb
Flip-Flop 89,/zwecks Starten des Lade-Arbeitszustandes durch Erzeugung eines "!"-Zustandes an seinem Q-Ausgang, der dem Last-Gatter 91 der Fig. 7 entspricht. Ungefähr I60 usec. später löscht der EOL-Impuls 67 (Fig. 3, 4 und 7) das Lade-Flip-Flop 89, um das Lade-Tor zu beenden, und damit das Ende des Lade-Arbeitszustandes herbeizuführen. Zur selben Zeit, zu der der
EOL-Impuls das Lade-Flip-Flop 89 löscht, setzt er das Lauf-Flipin Gang
Flop 93/i um den Lauf-Arbeitszustand zu starten, indem an seinem
Q-Ausgang ein "!"-Zustand erzeugt wird, der dem Lauf-Tor 95
609884/0999
entspricht. Nach ungefähr 7 msec, wird ein "Ende des Laufes"-Impuls (EOR) oder Bit 97 vom Zustand des binär "1" von dem Maskenkreis 99 in Fig. 5 angelegt, um das Lauf-Flip-Flop zu löschen und das Lauftor 95 zu beenden und damit das Ende des Lauf-Arbeitszustandes herbeizuführen. Die Dauer der Lade- und Lauf-Arbeits· zustände wird von der Dauer der entsprechenden Lade- und Lauf-Torsignale 91 und 95 bestimmt. Während jedes Ladezustandes wird ©in neuer STV-Wert erzeugt, während alle Korrelationen innerhalb des Lauf-Zustandes durchgeführt werden. Wie aus der Kurve 95 hervorgeht, liegt zwischen dem Ende des Lauf-Tores und dem nächsten SOL-Impuls Jl5 eine Zeit von ungefähr 2,84 msec. Diese Zeit von 2,84 msec, erlaubt eine zusätzliche Verzögerung bis zu 2,84 msec, bevor der EOR-Impuls angelegt wird, um das Lauf-Tor 95 zu beenden, sofern das System einen längeren Lauf-Arbeitszustand erfordert. Das Lauf-Tor 95 und die 1 MHz-Taktimpulse werden an die Eingänge eines UND-Gatters 96 angelegt. Zusätzlich wird ein Trainer-Kommandeosignal (von dem Trainer Io5 in Fig. 5) vom Zustand binär "1" an den invertierenden Eingang des UND-Gatters 96 angelegt. Dieses Trainer-Kommandosignal vom Zustand "1" wird nur deshalb angelegt, um das UND-Gatter 96 abzuschalten, wenn der Trainer Io5 die Speicherung Von neuen Masken-Daten in der Maskeneinheit 91 (Fig. 5) wünscht. Die Arbeitsweise des Trainers Io5 und der Maskeneinheit 99 werden später in Verbindung mit der Fig. 8 erläutert.
609884/0999
Wenn kein Trainer-Kommandosignal vom Zustand "1" an das UND-Gatter 96 angelegt ist, dann ist das UND-Gatter nicht mehr länger in dem abgeschalteten Zustand. Dadurch ist es der Zentralsteuerung 87 möglich, Signale zu erzeugen, die die Speichereinheit 85 und die Maskeneinheit 99 .derart betätigen, daß sie gleichzeitig einen Lese-Vorgang durchführen. Dieser Lese-Vorgang tritt nur auf, wenn ein Lauf-Torsignal, jedoch kein Trainer-Kommando signal an das UND-Gatter 96 angelegt ist. Wenn das Lauf-Torsignal 95 während eines Lesevorganges an das UND-Gatter 96 angelegt ist, dann ist das UND-Gatter 96 durch das Lauf-EPorsignal derart angeschaltet, daß es die 1 MHz-Taktimpulse als Zählircpulse durchläßt. Dese Zählimpulse werden mittels eines Verzögerungskreises 98 ebenfalls um ungefähr 100 Nano-Sekunden (nsec) zur Erzeugung von Lese-Impulsen verzögert. Diese Zähl- und Leseimpulse werden sowohl an den Speicher 85 als auch an die Maskeneinheit 99 (Fig. 8 und lo) angelegt, derart, daß sie gleichzeitig eine Ausgabe; der- entsprechenden Inhalte bewirken zwecks Durchführung einer später noch zu erläuternden Korrelation. Aus dem vorhergehenden ist ersichtlich, daß die Zentralsteuerung 87 immer dann keine Zähl- und Leseimpulse erzeugt, wenn das UND-Gatter durch Anlegen des Trainer-Kommandosignals mit dem Zustand "1" an seinen invertierenden Eingang abgeschaltet ist.
Wie aus der Pig. 5 hervorgaht, werden die Zähl- und Leseimpulse der Zentraisteuerung 87 an eine Masken-Speichersteuerung lol
609884/ÖS99
und an einen Masken-Speicher Io3 in der Maskeneinheit 99 angelegt, damit die Masken-Speichersteuerung lol in der Lage ist, die Lese-Schreib-Vorgänge des Masken-Speichers Io3 zu steuern. Dieser Maskenspebher Io3 kann ein Kernspeicher sein, mit Wort-Adress-Stellen, die bei der Stelle D beginnen und sich nacheinander bis zu dem Ende des letzten gespeicherten Wortes fortsetzen. Verbunden mit der Maskeneinheit 99 ist ferner der Trainer Io5, der ein logischer Schaltkreis oder ein Computer sein kann. Der Trainer Io5 trainiert oder steuert die Maskeneinheit 99 derart, daß sie irgendwelche gewünschte Dyaden und/oder Triaden speichert, die ein oder mehrere gewünschte Schlüsselworte enthalten können. Damit die Wirkungsweise der Maskeneinheit 99 besser verständlich ist, soll Bezug auf die Fig. 8 genommen werden.
Aus Pig« 8 geht hervor, daß immer dann, wenn der Trainer Io5 wünscht, daß neue Daten in den Maskenspeicher Io3 eingeschrieben werden müssen, er ein Trainer-Kommandosignal vom Zustand "1" sowohl an den Wahlschalter Io7 in der Masken-Speichersteuerung lol als auch an den invertierenden Eingang des im vorstehenden erläuterten UND-Gatters 96 (Fig. 6) sendet. Wie oben erwähnt, schaltet die Umkehrung des Zustandes "1" des Trainer-Kommandosignals das UND-Gatter 96 ab. Zur selben Zeit steuert der "1"-Zustand des Trainer-Kommandosignals den Wahlschalter Io7 derart, daß es nut? Trainer-Adressen möglich ist, durch den Schreib-Eingang des Schalters Io7 zu dem Maskenspeicher Io3 zu gelangen.
609884/0999
Jedes Schreib-Kommando von dem Drainer Io5 schaltet den Maskenspeicher Io3 derartig an, daß Masken-Daten von dem Trainer Io5 zusammen mit den zugeordneten Trainer-Adressen in den Masken-Speicher io3 eingeschrieben werden.
Wenn kein Trainer-Kommandosignal vom Zustand "1" an den Wahlschalter Io7 angelegt ist (bzw. an das UND-Gatter der Fig. 6), dann gelangen intern in der Masken-Speichersteuerung lol erzeugte Adressen durch einen Lese-Eingang des Wahlschalters Io7 hindurch zu dem Maskenspeicher Io3 zu dem Zweck einer Lese-Operation. Diese Lese-Operation kann nur dann auftreten, wenn kein Trainer-Kommandosignal vom Zustand "1" an den Wahlschalter Io7 (und das UND-Gatter 95 in Fig. 6) angelegt ist. Während eines Lesevorganges werden Lese- und Zählimpulse der Zentralsteuerung 87 (Fig. 6) an den Maskenspeicher Io3 und an den Zähleingang eines Zählers Io9 angelegt. Zu jedem Zeitpunkt, zu dem ein Impuls von dem Zähler Io9 gezählt wird, wird eine interne Adresse erzeugt, die über den Leseeingang des Wahlschalters Io7 als Lese-Adresse zu dem Maskenspeicher Io3 gelangt. Die Leseimpulse, die, wie im Zusammenhang mit der Fig. 6 erläutert wurde, um IOD nsec. verzögerte Zählimpulse sind, schalten den Maskenspeicher Io3 derart an, daß er nacheinander während des Lauf-Zustandes seinen Inhalt ausliest. Ss soll darauf hingewiesen werden, daß dadurch, daß die Verzögerung von 100 nsec. zwischen den entsprechenden Zähl- und Leseimpulsen vorhanden ist, jede interne
3 09884/0999
Adresse des Zählers Io9 In einem stabilisierten Zustand ist, bevor der Leseimpuls den Masken-Speicher Io3 anweist, nacheinander seinen Inhalt auszulesen * Zu jedem Zeitpunkt, zu dem ein Leseimpuls an den Maskenspeicher Io3 angelegt ist, wird ein Wort von 18 Bits, das an einer Adressenstelle gespeichert ist, die zu diesem "Zeitpunkt intern durch den Zähler Io9 adressiert ist, aus dem Maskenspeicher Io3 ausgelesen.
Dieses Wort von 18 Bits kann nacheinander folgende Informationen enthalten: 6 Bits mit Informationen r. über die Amplitude,
5 Bits mit Informationen θ über die Schwellwerte, 5 Bits mit Informationen w. über die Bewertung und zwei Signale von je 1 Bit. Das erste Signal von 1 Bit ändert sich von dem Zustand binär "0" zu einem Zustand binär "1", d.h. dem Signal "Ende der Maske" (EOM) an dem Ende jeder während des Lauf-Zustandes aus dem Maskenspeicher Io3 ausgelesenen Masken. Das zweite Signal von 1 Bit ändert sich von dem Zustand binär "0" zu dem Zustand binär "1", d.h. dem Signalende des Laufes (EOR), nachdem während des Lauf-Zustandes alle Masken aus dem Maskenspeicher Io3 ausgelesen sind. Dieses Signal EOR wird dazu verwendet, den Zähler Io9 zurückzustellen und, wie im vorstehenden erwähnt, das Flip-Flop 93 (Fig. 6) zurückzustellen,um damit den Lauf-Torimpuls und den Lauf-Zustand zu beenden. Der Zähler Io9 wird deshalb zurückgestellt, damit sichergestellt ist, daß zu Beginn des nächsten Lauf-Zustandes die internen Adressen des Zählers Io9 wieder bei Null beginnen.
609884/0999
Wie es aus den Fig. 5 und 8 hervorgeht, ist der Maskenspeicher Io3 in der Lage, 8192 Worte von 18 Bits zu speichern. Diese Speicherfähigkeit des Maskenspeichers Io3 ist in der Pig. 9 dargestellt. Im speziellen zeigt die Fig. 9 verschiedene beispielhafte Adressenstellen des Maskenspeichers Io3. Es soll in Erinnerung gerufen werden, daß die gespeicherten Masken von verschiedener Länge sein können, und daß sie in der Länge von 1 bis 16 STV-Daten variieren können. Es ist weiterhin sich zu vergegenwärtigen, daß jede STV-Information als Beispiel auf eine Länge von l6 Worten festgelegt wurde, wobei jedes Wort 6 Bits umfaßte. Daher kann für eine in jeder Maske des Maskenspeichers lo.3 gespeicherte Dyade oder Triade die Maske in der Länge von 16 V/orten bis zu 256 Worten schwanken.
Bei der Erzeugung jeder der in Fig. 9 dargestellten, in dem Speicher Io3 zu speichernden Masken bestimmt eine geübte Person, die angemessene Kenntnisse von akustischer Phonetik hat, die Länge jeder Maske, durch Beobachtung der Trainings-Spektrogramme, so daß diese Person das erfindungsgemäße System trainieren kann, indem sie die Arbeitsweise des Trainers Io5 der Fig. 5 steuert.
Γη einigen Fällen v/erden eine Vielzahl von Masken pro Dyade oder Triade verwendet, und zwar im Hinblick auf eine freie Variations- und den Zwischensprecher-Effekt. Bei der Erzeugung einer derartigen Maskenvielfalt, untersucht die geschulte Person die Spek-
609884/0999 -'"
trogramme derart, daß sie vielleicht 10 Masken-Abtastwerte einer Dyade oder Triade findet und sie dann typischerweise gruppiert, z.B. in Drei-Masken-Untergruppen, um so die Spanne für die freie Variation und den Zwischensprecher-Effekt für diese Dyade oder Triade vorzugeben.
Der Begriff "freie Veränderung" kann definiert werden als das Äußerungsbild von verschiedenen phonetischen Darstellungen bzw. Tönen, die dieselbe semantische Information tragen. Dieser Begriff berücksichtigt die Tatsache, daß es an sich immer einen idealen Weg gibt, um etwas zu sagen. Jede Person hat nun im Sprechen eine Reihe Abweichung von diesem idealen Weg. Diese freie Veränderung kann verursacht werden durch Dialekt, ProsodLe (eine emotionale Äußerung durch den Sprecher) oder durch Satzbetonungen. Drei Typen von freien Veränderungen, die auftreten können, sind: Der Austausch eines Tones für einen anderen ("da" oder "tha" für "the"), das Weglassen einer Silbe ("pat" anstelle von "part") und das Einfügen eines Tones in das Schlüsselwort (indem man " "uh" am Ende von "park" hinzuführt). Der Zwischensprecher-Effekt oder die Zwischensprecher-Veränderung ist dadurch definiert, daß die Äußerungen desselben Tones durch verschiedene Sprecher In verschiedenen charakteristischen Resonanzen für dasselbe phonetische Ereignis zum Ausdruck kommen.
609884/0999
Nachdem die oben genannten 10 Masken-Abtastwerte in drei Masken-Untergruppen aufgeteilt sind5 werden die Komponenten in den Masken jeder der drei Masken-Untergruppen geraittelt«, um auf diese Weise eine einzelne Maske für die betreffende Dyade oder Triade in dieser Untergruppe festzulegen= Die Vielfalt von drei Masken für eine Dyade oder Triade ist dann seriell in dem Speicher Io3 gespeichert, und zwar in benachbarten Stellenjr sie? wird nachfolgend in paralleler Arbeitsweise behandelte
Ss ist in Erinnerung zu rufen, daß es ungeähr hh verschiedene Töne oder phonetische Ereignisse in der englischen Sprache gibt und daß das Erkennungssystem gemäß der Erfiödung auf Dyaden und/ oder Triaden basiert,, xtfobei eine Dyade zwei phonetische Ereignisse und eine Triade drei phonetische Ereignisse beinhaltet. Aus diesem Grunde können ungefähr 1936 verschiedene Dyaden und/ oder Triaden vorkommen. Wenn in dem System nach der Erfindung 500 bis 700 Dyaden und/oder Triaden verwendet werden, dann können über 90# der Schlüsselworte eines Standards-Englisch-Wörterbuches in genügender Weise erkannt werden.
Bei Speicherung von 1 Dyade oder Triade in jeder Maske des Maskenspeichers 103 kann das System gemäß der Erfindung ein unbegrenztes Vokabular haben, wenn genügend Masken benutzt werden, und das System ist groß genug ausgelegt, daß ein Entscheidungs-
609884/0999
Ausgang für jedes der gewünschten Schlüsselworte errechnet wird. Auf diese Weise besitzt die Erfindung die Fähigkeit der Erkennung eines unbegrenzten Vokabulars in kontinuierlicher Sprache, Die Erfindung kann jedoch auch bei folgenden beispielhaften Anwendungen für ein Erkennen von einem begrenzten Vokabular eingerichtet sein: Gepäck-Zielsteuerungj Zip-Code-Benutzung; Eingabe von Fernsteuerungsdaten üder ein Telefon; z.B. für Verkaufs-Order; stimmverstärkte Worterkennung zur Steuerung der Arbeitsweise von Maschinen in einer Fabrik oder der internen Arbeitsweise eines Flugzeuges, und ausgewähltes Wort-Beobachten oder Vorsortieren von Sprachinhalten, indem das System so ausgebildet ist, daß es eine begrenzte Anzahl von interessierenden Schlüsselworten in Nachrichtensendungen erkennt. Bei der Anwendung in der Erkennung eines begrenzten Vokabulars können die Masken in dem Maskenspeicher 103 zusammen in Reihe gruppiert werden, um so das Schlüsselwort oder die Schlüsselworte, die zu erkennen sind, zu bestimmen, jedoch ist dies, absolut gesehen, nicht notwendig. Es ist dabei verständlich, daß der Unterschied zwischen der Fähigkeit des Erkennens eines unbegrenzten und der Fähigkeit der Erkennung eines begrenzten Vokabulars allein in dem Aufwand zur Realisierung des Systems liegt.
Da, wie im vorstehenden in der Diskussion im Zusammenhang mit der Fig. 8 festgestellt wurde, jedes Wort aus dem Masken-Speicher Io3
609884/0999
in einer Mikrosekunde ausgelesen werden kann - entsprechend den angelegten 1 MHz-Zähl- und Leseimpulsen - so dauert es 8192,usec» oder 8,192 msec, um alle Worte aus dem Speicher IO3 auszulesen, wenn dieser Speicher gefüllt ist. In der Fig. 9 sind jedoch nur ungefähr 7000 Worte von 18 Bits, die in dem Speicher IO3 gespeichert sind, dargestellt, wobei es dem Speicher IO3 möglich ist, zusätzliche 1192 Worte von 18 Bits in den verbleibenden 1,192 msec, zu speichern, wenn es die Arbeitsweise des Systems erfordert.
In Fig. 9 sind M-Kasken im gespeicherten Sustand im Speicher 103 dargestellt. Die Wortlänge jeder Maske ist direkt unter der Maskennummer angezeigt, während die Adress-Stellen des Wortes in jeder Maske durch den zugeordneten Zahlenbereich angezeigt sind. Beispielsweise ist die Maske 2 ein Wort mit einer Länge von 128 Bits, wobei diese Worte in den Adressenstellen 257 bis 38A untergebracht sind (entsprechend den Adressenstellen in binärer Schreibweise von: 0000100000001 bis 0000110000000). Das EOM-Signal vom Zustand 11I" ist enthalten in dem Wort 000000000000000010, das auf jede der Masken folgt, um das Ende der betreffenden Maske anzuzeigen. Beispielsweise kann das binäre Wort 000000000000000010
EO
dass das/5-Signal vom Zustand "1" enthält, an der Adressenstelle 385 (binäre Adressenstelle 0000110000001) gefunden werden, die das Ende der Maske 2 folgt. Das Signal EOR mit dem Zustand
609884/0999
binär "1" ist in dem Wort 000000000000000001 enthalten, das in der Adressenstelle 7000 steht (binäre Adress-Stelle 1101101011000), also eine Adressenstelle, die auf das EOM-Signal folgt, das auf die letzte Maske (Maske M) folgt, die in dem Speicher 103 gespeichert ist. Es sei in Erinnerung gerufen, daß dieses EOR-Signal in Fig. 6 dazu benutzt wird, das Lauf-Fllp-Flop 93 zurückzusetzen, um auf diese Weise das Lauf-Torsignal zu beenden, und es wird in Fig. 8 dazu verwendet, den Zähler Io9 zurückzustellen.
Es sei nun auf die Fig. 5 zurückgegangen; wie bereits vorher erwähnt, werden die STV-Daten und die Daten, die von den Signalen des Analog/Digital-Umsetzers 73 (Fig. 3) zur Verfügung gestellt werden, an den Speicher 81 und die Speichersteuerung 83 in der Speichereinheit 85 angelegt. Zusätzlich wird das EOL-Signal von dem Verzögerungskreis 65 (Fig. 3), die EOM-Signale von dem Maskenspeicher 103, das Lade-Gattersignal und die Zählimpulse der Zentralsteuerung 87 angelegt, während die Lese-Impulse der Zentralsteuerung 87 an den
Speicher 81 angelegt werden. Damit die Arbeitsweise der Speichereinheit 85 besser verständlich ist, sollen nunmehr die Figuren 10, HA und HB näher erläutert werden.
Der Speicher 8l mit direktem Zugriff in Fig. 10 (und Fig. 5) entspricht einem Spektrogramm, bei dem die Frequenzkomponenten
609884/0999
in den Speicher gespeicherten STV-Daten vertikal entlang einer vertikalen Frequenzachse angeordnet sind, wobei benachbarte Daten der gespeicherten STV-Datenfolge durch eine Zeitspanne von 10 msec, entlang einer orthogonalen Zeitachse voneinander getrennt sind. Jede 10 msec, wird ein neuer STV-Wert in dem Speicher 81 gespeichert. Auf diese Weise wird ein Muster entwickelt, das das Spektrogramm bildet.*Der Speicher 8l kann ein Festkörper-Speicher sein mit einer Wortlänge, die zwischen einer und Io24 Stellen feld-wählbar ist» Der Speicher 8l muß im Betriebszustand eine Speicher-Wortlänge aufweisen, die mindestens so lang ist, wie die längste Maske, die in dem Maskenspeicher Io3 gespeichert ist.
Jede Maske hat, wie die Fig. 9 zeigt, eine Wortlänge, die gleich ist einigen integralen Vielfachen von 16 Worten, da jede Maske in der Länge zwischen 1 und 16 STV-Werten aufnimmt und jeder STV-Wert in der Länge 16 digitalisierte spektrale Bestimmungswerte oder Worte aufweist. Da die längste in Fig. 9 gezeigte Maske (Maske 1) 256 Wörter lang ist, oder im Äquivalenten die Länge von 16 STV-Daten aufweist, soll im folgenden angenommen werden, daß die Wortlänge des Speichers 81 so gewählt wurde, daß zu irgendeiner gegebenen Zeit der Speicher 8l 256 Worte oder 16 STV-Werte speichert.
609884/0999
Die Adressenstellen für diese ίβ STV-Daten, die in dem Speicher 8l während verschiedener Lade- und Laufzuständen gespeichert worden sind, sind in den Fig. HA und HB dargestellt. Für den
oder Rollover-Adressierung Speicher 81 wird dabei die MODULO-Adressierung/oder Adressierung durch überspeichern verwendet. Die Adressenstellen für die 256 Worte sind'in dem Bereich 0 bis 255 des Speichers 81 gespeichert. Da 255 die Adressenstelle mit der höchsten Nummer ist, wird die Adressierung als MODULO 255-Adressierung bezeichnet. Bei der MODULO-255-Adressierung gleicht der Speicher 8l, wenn er adressiert ist, arbeitsmäßig einem Kreis, so wie es in den Fig. HA und HB dargestellt ist. Wenn, sowohl in dem Lade- als in dem Lauf-Zustand die Adressenstelle 255 erreicht ist, dann beginnt die nächste Adresse in diesem Arbeitszustand mit Null und steigt in der gemäß der Fig» HA und HB gezeigten Pfeilrichtung an.
Die Fig. HA zeigt STV-Daten 1 bis 16, wobei der Wert STV 1 in den Lade-Adress-Stellen ο bis 15, der Viert STV 2 in den Lade-Adress-Stellen 16-31, der Wert STV 3 in den Lade-Adress-Stellen 32-47... und der Wert STVI6 in den Lade-Adress-Stellen 24o-255 gespeichert sind. In Fig. HA ist der Wert STV 1 der älteste STV-Wert, da er zuerst gespeichert wurde, während der Wert STV 16 der neueste-Wert von STV ist, da er zuletzt gespeichert wurde. Während des sechzehnten Lade-Zustandes werden die digitalisierten spektralen Bestimmungswerte oder Frequenzkomponenten-Worte von
609884/0999
STV l6 nacheinander in den Lade-Adress-Stellen 24o~255 gespeichert. Der erste digitalisierte spektrale Bestiinmungswert von · STV i6 wurde in die Lade««Adress-Stellen 2*lo zu Beginn des sech- . zehnten Lade-Zustandes geschrieben, und der letzte oder sechzehnte digitalisierte spektrale Bestimmungswert von STV 16 vmrde am Ende des sechzehnten Lade-Zustandes in die Lade-Adress-Stelle 255 geschrieben.
Da der Speicher 81 256 Worte in 256 Adressenstellen speichert, muß ein synchroner Lade-Zähler 121, der während des Lade-Zustandes Lade-Adressen an den Speicher anlegt, vergleichsweise 256 Adress-Zählstände oder Lade-Adressen besitzen. Diese 256 Adressen-Zählstände haben einen Bereich von O (00000000) bis 255 (11111111). Für die nachstehende Erläuterung sei angenommen, daß der letzte Zählstand oder die Lade-Adresse des synchronen Zähbrs 121 einen Wert von 255 gehabt hat, so wie es in Fig. HA an dem Ende des sechzehnten Lade-Zustandes dargestellt ist. Dieser Zählstand von 255 wird mit einer festen Zahl W„ in einem Vergleicher 123 verglichen. Der Vergleicher 123 kann aus UND-Gattern aufgebaut sein. Die Zahl ¥„ ist derartig feld-vorgewählt, daß sie gleich ist der letzten oder der größten Lade-Adresse, die von dem Lade-Zähler 121 benötigt wird, wobei diese Zahl in dem vorliegenden Beispiel 255 ist. Wenn der Zählstand des Zählers 121 den Wert von W ,d.h. 255» erreicht, dann erzeugt der.Vergleicher
609884/0999
123 ein Signal vom Zustand binär "1" und legt dieses Signal an den Rückstelleingang des Zählers 121 an. Der synchrone Zähler 121 arbeitet derart, daß, wenn immer ein Signal vom Zustand "1" an seinen Rückstelleingang angelegt wird, das nächste eine Information enthaltendes Signal 75 (Pig. 1O das von dem Analog/ Digital-Umsetzer 73 in Fig. 3 an den Zähleingang angelegt ist, den Ladezähler 121 auf den Adressenzählstand 0 (00000000) zurückstellt*
Während des nächsten, also z.B. des siebzehnten Lade-Zustandes, wird das Ladesignal 91 (Fig. 7) von dem Lade-Flip-Flop 89 (Fig.6) an einen Wahlschalter 125 angelegt, derart, daß die Speichersteue-
RAM
rung/83 in dem Lade-Zustand arbeitet. Während dieses siebzehnten Lade-Zustandes werden die 16 Daten enthaltenden Impulse 75 von dem Analog/Digital-Umsetzer 73 (Fig. 3), die also während der Erzeugung der Werte STV 17 auftreten, an den Zähleingang des Lade-Zählers* 121 angelegt. Da im vorstehenden erläutert wurde, daß an dem Ende des sechzehnten Lade-Zustandes der Zählstand des Zählers 121 den Wert von 255 besessen hat, stellt der erste eine Information tragende Impuls während des nächsten oder siebzehnten Lade-Zustandes den Zähler 121 auf den Zählstand 0 zurück, so wie es in Fig. HB zu Beginn des siebzehnten Lade-Zustandes dargestellt ist. Jeder der verbleibenden fünfzehn Informationen tragenden Impulse veranlaßt den Zähler 121 seine ausgangsseitige
609884/0999
ΐ S 1^ ^
53-- τ '■-.•.-η.π ST-ji
, Sssftl^iraZn^ngSl^S^tQ Sin ^V-J"Ζ5^ Zulu -'BΧΠΘΞ?
O-Li. C ί j
. ?Ξ G1 =.— ■ T
ist zu ersehen, daß am Ende des siebzehnten Lade-Zustandes der STV-WSrt 17 in die Lade-Adress-Stelle 0-15 eingeschrieben worden ist, die vorher von dem Wert STV-I ..elegt war, der der älteste gespeicherte STV-Wert an dem Ende des sechzehnten Lade-Zustandes war, wogegen die STV-Werte 2-16 in den Adressenstellen verbleiben, die sie am Ende des sechzehnten Ladezustandes belegt hatten. Während des achtzehnten Lade-Zustandes (nicht dargestellt) wird der Viert STV-2 entfernt, während der Wert STV-18 in die Speicher-Adress-Stellen 16-31 eingeschrieben v/ird. Es ist daraus ersichtlich, daß jede 10 msec, ein neuer STV-Wert in dem Speicher 8l abgespeichert wird, wogegen der älteste STV-Wert aus dem Speicher he-r.ausfällt. Man kann daher sagen, daß zu einem bestimmten Zeitpunkt der Speicher 0,16 Sekunden oder l60 msec von digitalisierten spektralen Bestimmungswerten oder Zeitabcastwerten einer durch Parameter dargestellten kontinuierlichen Sprache enthält.
Wie es im Zusammenhang mit der Fig. 6 erläutert wurde, beendet die Erzeugung des EOL-Impulses (Fig. 3) das Lade-Signal 91 zwecks Beendigung des Lade-Zustandes und erzeugt das Lauf-Signal 95, das den Lauf-Zustand startet. Der EOL-Impuls gelangt weiterhin durch das ODER-Gatter 129 hindurch zu dem Ladeeingang eines Lauf-Zählers 131. Der Lauf-Zähler 131 ist ein voreingestellter Zähler, der mittels des EOL-Impulses in der Lage ist, die Strom-Einstelladresse einzuladen, d.h. an seinem Ausgang bereitzustellen.
609884/0999
Die Strom-Voreinstell-Adresse kann aufgefaßt werden als die letzte Lade-Adresse, die von dem Lade-Zähler 121 an den Voreinstell-Adresselngang des Zählers 131 zu der Zeit angelegt wirds zu der der EOL-Inpuls erzeugt wird. Diese Voreinstell-Adresse erseheint an dem Ausgang des Lauf-Zählers 13I0 bevor der Zähler 131 während des folgenden Lauf-Zustandes anfängte zu zählen.
Herrn bei der Beendigung des Ladezustandes das Lade-Signal 91 mittels dss EOL-Impulses beendet ist8 dann beginnt die Speicher» Steuerung S3, in dem Lauf-Zustand zu arbeiten & Wenn durch den Trainer Ic5 kein Trainer-Komraandosignal vom Zustand "1" erzeugt wirdj so "iie es früher in Verbindung mit der Pig. 6 erläutert vjurdes. darm ?:5-r-len die Lsse- bzw0 die Zahl-Impulse der Zentralsteuerung 87 (Pigo 6) an den Speicher 81 bzw» an den Zähleingang des Lauf-Zählers 131 angelegt.
Der erste 1 MHz-Zählimpuls, der während des Lauf-Zustandes erscheint, verändert den ausgangsseitigen, die Lauf-Adresse darstellenden Zählstand des Lauf-Zählers 31 um einen Betrag von Eins. Dadurch ist die erste Lauf-Adresse, die am Ausgang des Zählers 131 zu Beginn des Lauf-Zustandes erscheint, um Eins größer als die Strom-Voreinstell-Adresse (oder die letzte Lade-Adresse in dem ersten Ladezustand). Beispielsweise ist., wie in Fig. HA dargestellt, der letzte Lade-Adressen-Zählstand an dem
.609884/0999
In ds i·: sechzehnten Lade-Zustand.es gleich 255. Während des sechiiehnt-■ Lauf· Zustandes startet die Lauf-Adresse des Zählers 131 mit s.i.se!n LaufrAdressen-Zählstandj der um Eins größer ist als die \'i---zte Lade-Adresse von 255, nämlich Null. Jeder der nachfolgende. 1 ■'iH'c-Zählimpulse j, die innerhalb der Zeitperiode auftreten, Ln der- eine Maske aus dem Speicher ausgelesen wird, veranlaßt de η Zähler 131, seinen ausgai.gsssitigen Lauf-Adressenzählstand. um einen Betrag von Eins zu erhöhen.
Jeder Lauf-Adressenzählstand des Lauf-Zählers 131 wird in einem Vergleicher 133 mit der Zahl W verglichen, die in dem vorliegenden Beispiel gleich 255 ist. Erreicht der Lauf-Adressenzählstand vor dem Ende der Maske nicht den Zählstand 255, dann geht ein EOM-Impuls oder ein Signal, das mit einer derartigen Maske verbunden ist j durch das ODER-Gatter 129 durch, damit der Zähler 131 sein Ausgangssignal, nänlich die Strom-Voreinstell-Adresse einlädt. Auf diese Weise starten die Lauf-Adressen, die nacheinander erscheinen, wenn die folgende Maske ausgelesen wird, mit einem Adressen-Zählstand, der um Eins größer 1st als die Strom-Voreinstell-Adresse, wobei sie bis zu dem Ende der folgenden Maske zunehmen» Wenn andererseits der Lauf-Adressenzählstand des Zählers .131 vor dem Ende einer Maske den Wert 255 erreicht, dann erzeugt der Vergleicher 133 ein Signal vom Zustand binär !tl" -na legt dieses Signal an dem Rückstelleingang des Lauf-
609884/0999
Zählers 131 an. Dieses Signal vom Zustand "1" stellt den Zähler 131 auf den Adressen-Zählstand Null mittels des nächsten auftretenden 1 MHz-Zählimpulses zurück. Dadurch kann der Lauf-Zähler 131 von seiner Strom-Voreinstell-Adresse bis zu einem Zählstand von 255 aufwärts zählen und dann von dem Zählstand Null aufwärts bis zu dem Ende der Maske, wo zu diesem Zeitpunkt ein EOM- Impuls erzeugt wird, den Zählvorgang fortsetzen.
Wie es oben gezeigt wurde, gelangt an dem Ende jeder aus dem Maskenspeicher Io3 (Fig. 8) ausgelesenen Maske ein EOM-Impuls durch das ODER-Gatter 129 zu dem Lade-Eingang des Laufzählers 131. Jeder EOM-Impuls arbeitet derart, .so ivie es auch der EOL-Irapuls an dem Ende des vorhergehenden Ladezustandes tut, daß der Zähler 131 die voreingestellte Adresse'an seinen Ausgang abgibt, bevor mit dem Auslesen der nächsten Maske begonnen wird.
Der erste 1 MHz-Zählimpuls, der während der Zeit erscheint, in der die nächste Maske desselben Lauf-Zustandes ausgelesen wird, beeinflußt den Lauf-Adressenzählstand dahingehend, daß er um Eins größer ist als die Strom-Voreinstelladresse. Während irgendeines gegebenen Lauf-Zustandes ist die voreingestellte Adresse für jede ausgelesene Maske dieselbe. Während des folgenden Lauf-Zustandes ist die Voreinstell-Adresse für diesen folgenden Laufzustand von derjenigen des vorhergehenden Lauf-Zu-
609884/0999
Standes um einen Zählstand von 16 verschieden. Beispielsweise ist, so wie es in den Fig- 11A und liB gezeigt ist, die Voreinstelladresse (oder die letzte Lade-Adresse) an dem Ende des sechzehnten Ladezustandes und damit während des sechzehnten Lauf-Zustandes, gleich dem Wert von 255, während die Voreinstell-Adresse unmittelbar bevor und während des siebzehnten Lauf-Zustandes gleich 15 ist. In gleicher V/eise besitzen die Voreinstell-Adressen für den achtzehnten, neunzehnten und zwanzigsten Lauf-Zustand (nicht gezeigt) den VJert von 31, ^7 bzw, 63.
Aus der vorstehenden Beschreibung der Arbeitsweise des Lauf-Zählers 131 ist entnehnibar, daß während eines gegebenen Laufzustandes der erste EOL-Impuls die Strom-Voreinstelladresse für die ersten während dieses gegebenen Laufzustandes auszulesenden Maske in den Zähler 131 einlädt, und daß der EOM-Impuls entsprechend die Strom-Voreinstelladresse für die nachfolgende während des gegebenen Lauf-Zustandes aus dem Speicher Io3 auszulesenden Maske in den Zähler 131 einlädt. Auf diese Weise wird zu Beginn irgendeines gegebenen Laufzustandes und zu Beginn jeder während des Lauf-Zustandes ausgelesenen Maske die geeignete Voreinstell-Adresse in den Lauf-Zähler 131 eingeladen. Dadurch ist sichergestellt, daß der Speicher 81 geeignet adressiert ist, wenn eine neue Maske während irgendeines gegebenen Laufzustandes aus dem Masken-Speicher Io3 ausgelesen wird. Auf diese Weise kann ein
609884/0999
geeignetes Zeitverhalten in der Korrelation jeder der in dem Speicher Io3 gespeicherten Masken mit den im Speicher 81 gespeicherten STV-Werten erzielt werden.
Der Grund dafür, daß während des 'Laufzustandes die Lauf-Adressen bei einem Zählstand beginnen, der um Eins größer ist als die letzte Lade-Adresse in dem ersten Lade-Zustand, liegt darin, daß die Folge der STV-WErte, die. mit jeder gespeicherten Maske zu korrelieren sind, bei dem ältesten STV-Wert beginnt und sich bis zum neuesten STV-WErt fortsetzt, Es wurde weiter oben gezeigt in Verbindung mit Fig. HA, daß der Viert STV-16 der neueste STV-Wert ist, der in dem Speicher 81 nach dem sechzehnten Lade-Zustand gespeichert wird, und daß der Wert STV-16 im Speicher an den Lade-Adresspositionen 2^o bis 255 abgespeichert ist. Dadurch beginnen während des sechzehnten Lauf-Zustandes die Lauf-Adressen für jede Maske bei Null und steigen nacheinander bis zu dem Ende dieser Maske an, wobei danach die Lauf-Adressen für die folgende Maske bei Null beginnen und nacheinander bis zu dem Ende der folgenden Maske ansteigen usw. In gleicher Weise, wie es bei Fig. HB gezeigt ist, starten während des sechzehnten Lauf-Zustandes die Lauf-Adressen für jede Maske bei 16, was um Eins größer ist als die letzte Lade-Adresse von 15, die am Ende des siebzehnten Lade-Zustandes auftritt und bis zum Ende der Maske anwächst, usw.
609884/0999
Während eines Lauf-Zustandes werden die Lauf-Adressen des Laufzählers 131 über einen Lauf-Eingang des Wahlschalters 125 an den Speicher 81 angelegt, da während des Laufzustandes kein Lade-Signal an dem Schalter 125 anliegt.
Es soll nochmals in Erinnerung gerufen werden, daß die Lese-Impulse, die an dem Speicher 81 anliegen, um 100 nsec. verzögerte Zähl-Impulse sind. Dadurch sind die Laufadressen, die während des Lauf-Zustandes erscheinen, in einem stabilen Zustand, bevor die Lesesignale oder Impulskommandos den Speicher 8l veranlassen, nacheinander Worte auszulesen,und zwar eine solche Anzahl, die gleich der Zahl von Worten ist, die eine Maske enthält, die zu dieser Zeit aus dem Maskenspeicher Io3 ausgelesen wird.
Jedesmal, wenn während des Lauf-Zustandes einer Lauf-Adresse und ein Lese-Impuls an dem Speicher 81 anliegen, wird ein Wort von einer Länge von 6 Bits aus dem Speicher 8l ausgelesen. Die 6-Bit-Wörter, die während des Lauf-Zustandes aus dem Speicher 81 ausgelesen werden, werden als das x.-Signal bezeichnet.
Zurückblickend auf die Fig. 5 soll weiterhin in Erinnerung gerufen v/erden, daß der Speicher 81 während des Lade-Zustand-Teiles jede 10 msec, mit Daten aufgefüllt wird, indem der neueste STV-WErt gespeichert wird, während der älteste STV-Wert heraus-
609884/0999
- 1*0 -
fällt. Weiterhin werden während des Lauf-Zustand-Telles jede 10 msec, alle Wortkomponenten in jeder Maske des Maskenspeichers Io3 (Fig. 8 und 5) mit dem entsprechenden Wortkomponenten, die im Speicher 8l gespeichert sind, korreliert, indem eine Folge von Korrelationsfunktionen errechnet wird auf einer Komponente durch Komponentenbasis und indem alle diese Korrelationsfunktio- nen aufsummiert werden, urn so für jede Maske ein Korrelations-Datensignal zu erzeugen. Zur Durchführung dieser Korrelation werden, wie es in der Fig. 5 angezeigt ist, das x.-Signal des Speichers 8l zusammen mit den r., Θ., w. EOM- und EOR-Signale des Maskenspeichers Io3 an die arithmetische-Informationsquellen-Einheit 151 (pipeline) angelegt, die nunmehr näher erläutert werden soll.
Diese arithmetische Informationsquellen-Einheit 151 führt eine Reihe von mathematischen Operationen bei der Korrelierung des x.-Signales mit den Ausgangssignalen der Maskenspeicher-Einheit Io3 durch. Die Informationsquellen-Einheit 151 ist für vieraufeinanderfolgende arithmetische Funktionen ausgelegt, die jeweils von der benachbarten arithmetischen Funktion durch Halte-Register getrennt gehalten werden. Im einzelnen besteht die arithmetische Informationsquellen-Einheit 151 aus einem Vergleichs- oder Ähnlichkeits-Funktionskreis 153, aus Halteregistern 155> 159 und l63» aus Schwellwerk und Wertungsfunktions-Änderern 157 und 161,
609884/0999
- kl -
wie aus einem Summenakkumulator 165. Die Halteregister 155, 159 und l63 werden zweckmäßig aus üblichen Kreisen aufgebaut, wie sie aus dem Stand der Technik bekannt sind. Bei der Realisierung des Vergleichsfunktionskreises 153 und der Schellwert- und Wertungsfunktlonsänderer 157 und I6I sind jedoch verschiedene Wege möglich, und zwar abhängig von dem Typ der Korrelation, der in der arithmetischen Informationsquellen-Einheit 151 benutzt wird. Die verschiedenen Realisierungsmöglichkeiten der Schaltkreise 153, 157 und 161, ebenso wie die Realisierung des Suminenakkunrulators 165 wird später noch erläutert. Derzeit soll nur eine generelle Diskussion der Arbeitsweise der Schaltkreise der arithmetischen Informationsquellen-Einheit 151 gegeben werden.
Bei jedem 1 MHz-Lese-Impuls während des Lauf-Zustandes wird aus dem Speicher 8l ein 6-Bit-Wort x. und ein 18-Bit-Wort (bestehend aus dem 6-Bit-Wort r. , dem 5~Bit-Wort Θ. , dem 5-Bit-V/ort w. und dem EOM- und EOR-Signal, die jeweils aus einem Bit bestehen) aus dem Maskenspeicher Io3 ausgelesen. Die x,- und r.-Worte werden von der Vergleichs funktion 153 dazu benutzt, um ein c.-Wort zu erzeugen. Dieses e.-Wort kann in der Länge bis zu 12 Bits schwanken, abhängig von dem Typ der Korrelations-Operation, die von der arithmetischen Informationsquellen-Einheit 151 durchgeführt wird. Die c., Θ. und w.-Worte sowie die EOM- und EOR-Bits werden während jeder 1 MHz-Taktimpulsperiode in das Halte-Register 155 eingetaktet und dort zeitlich gespeichert.
-/-6U9884/0999
Die c. und θ -Worte des Halteregisters 155 werden selektiv von dem Schwellwert-Funktionsänderer 157 dazu benutzt, um ein t.-Wort zu erzeugen, das bis zu 12 Bits in der Breite schwanken kanrs abhängig von dem Typ der Korrelations-Operation, die von der Informationsquellen-Einheit 151 durchgeführt wird. Das t.-Wort
des Punktionsänderers 157 und das w.-Wort sowie die EOM- und EOR-Bits des Halteregisters 155 werden während jeder 1 MHz-Taktimpulsperiode in das Halteregister 159 eingetaktet und zeitlich in Ihm gespeichert.
Die t.- und w.-Worte des Halte-Registers 159 itferden selektiv von dem Wertungsfunktions-Änderer 161 dazu benutzt, ein m.-Wort zu erzeugen, das bis zu 12 Bits in der Breite schwanken kann, je nach dem, welcher Typ von Korrelations-Operation von der Informationsquellen-Einheit 151 durchgeführt wird. Das m.-Wort des Funktions-Änderers 161 und die EOM- und EOR-Bits des Halte-Registers 159 v/erden während jeder 1 MHz-Taktimpulsfolge in das Halte-Register I63 eingetaktet und dor*t zeitlich gespeichert.
Bei jedem 1 MHz-Taktimpulszeltpunkt während des Lauf-Torsignals v/erden die Daten in einem neuen m.-Wort an den Summenakkumulator 165 angelegt, und zu dem addiert, was vorher bereits akkumuliert worden ist. Jede neue Datensumme ist ein 18-Bit-Korrelations-Datenwort d, die als Ausgangssignal der arithmetischen
609884/0999
Informationsquellen-Einheit 151 erzeugt worden ist. Ära Ende jeder der aus dem Maskenspeicher Io3 ausgelesenen Masken wird ein EOM-Signal vom Zustand "1" von dem Halteregister 163 über einen 100 nsec.-Verzögerungskreis 167 an den Summenakkumulator 165 angelegt, um den Akkumulator 165 für den Start der nächsten Maske zu löschen*
Individuelle Korrelations-Operationen zwischen den Bezugs-Maskenschablonen (ausgelesen aus dem Speicher Io3) und der digitalisierten in Parameter aufgelösten kontinuierlichen Sprache (ausgelesen aus dem Speicher 8l) werden unter Benutzung einer Unterscheidungsfunktion (discriminant function)errechnet. Die arithmetische Informationsquellen-Einheit 151 kann so ausgelegt werden, daß sie irgendeine von vielen verschiedenen Typen von UniBrscheidungsfunktionen oder Korrelations-Operationen durchführt. Verschiedene UnterscheidungsEudlrtionen und ihre zugeordneten mathematischen Operationen sind in Fig» 12 für einen jeden von 5 beispielshaften Typen von arithmetischen Informationsquellen-Einheiten 151 mathematisch dargestellt. Diese 5 Typen von Unterscheidungsfunktionen sind:
609884/0999
Typ Unterscheidunffsfunktion (Discriminant Function) Nr. 1 Schwellwert«Entfernungsfunktion
(Threshold Distance Function) Nr. 2 Ungewichteter Absolutwert der Entfernungsfunktion
(Unweighted Absolute Value Distance Function) Nr. 3 Gewichteter Absolutwert der Entfernungsfunktion
(Weighted Absolute Value Distance Function) Nr. k Euklidische quadratische Abstands-Funktion
(Euclidean Distance Squared Function) Nr. 5 Skalar-Produkt einer Funktion mit 2 Vektoren (Dot Product of Two Vectors Function)
Zum Zwecke der folgenden Diskussion in Bezug auf die Fig. 5 und 12 soll sich r. auf die Komponenten einer gegebenen Maske ausge-. drückt als Vektoren und x. auf die entsprechenden, dem Vergleich unterworfenen Komponenten der digitalisierten in Parametern aufgelösten Sprachsignale beziehen.
Das Maß zum Messen des Grades der Übereinstimmung zwischen zwei Vektoren r. und x., die einen Gewichtsvektor w. und einen Schwellwertvektor 0. besitzen, kann im allgemeinen ausgedrückt werden als yL .,
d -J
609884/0999
wobei P1 = FCr1, X1 Q1),
η = die Zahl der Komponenten oder Wörter in der gegebenen Maske
und i = 1, 2 ..., η ist.
Die Vektoren lassen sich schreiben:
ri = rr2» '·*» rn
Xj. = X., *2* ♦·'» X n
9I = Ql> g2> ·"» θη
Zusätzlich soll angenommen werden, daß die Komponenten voneinander unabhängig sind.
Die Unterscheidungsfunktion für die Lösung von d in der obigen allgemeinen Gleichung oder in Fig. 12 kann Schwellwerte Θ. aufweisen oder auch nicht, und das Gewicht w., das jeder Dimension zugeordnet ist, kann einheitlich sein. Beispielswelse kann, wie in Fig. 12 zu ersehen ist, der ungevrichtete Absolutwert der .Entfernungsfunktion vom Typ 2 nur Vektoren x^ und r. aufweisen, wobei
Pi
und w. = 1.
GU9884/Ü999
In gleicher Weise ist die euklidische quadratische Abstandsfunktion vom Typ 4 erfüllt unter Verwendung von
F. = (x. - r. ) , wobei w. = 1 ist,
und das Skalar-Produkt der beiden Vektorfunktionen vom Typ 5 ist erfüllt unter Verwendung von
. = xArAt wobei w. = 1 ist.
Andererseits sieht der gewichtete Absolutwert der Distanzxunkt.ion vom Typ 3 Vektoren x., r. und w. vor, wenn auch
P1 = Jx1 - r
Die Schwellwerts-Entfernungsfunkiton vom Typ 1 sieht alle Vektoren x. , r. Θ. und v/. vor, wobei
P1 = P (
- r.
Der Minimalwert von d in der Gleichung d =
oder am Ausgang des SummenτAkkumulators I65 entspricht der nahekommendsten Übereinstimmung in der Korrelation von x. und r..
609884/0999
Wie es in Fig. 12 gezeigt ist, kann für die meisten Vergleichsfunktionen c. die Beziehung zwischen x. und r. ausgedrückt werl ι χ %
den in Termaic. = x. - r. , wie in Fig. 12 für die Funktionentypen 1 bis k dargestellt ist. Indem man diese verschiedenen Ausdrücke anstelle von x. und r. einführt, wird die Unabhängigkeitsfunktion wesentlich verändert. Die im vorhergehenden postulierte Annahme der Unabhängigkeit zwischen zwei einzelnen Komponenten von x. und r. ist nicht mahr länger notwendig. Die neue Annahme ist, daß der Betrag von x. - r. (mit i = 1, 2 ... n) unabhängig ist. Die frühere Annahme ist in der Erkennung von Mustern weit verbreitet, wenngleich sie offensichtlich keine Gültigkeit hat. Mit der neuen Annahme existiert jedoch ein größerer Grad von Gültigkeit. Angenommen ist nur, daß das Zwischenmerkmal-Rauschen (interfeature noise) unabhängig ist.
Die Vergleichs-Funktionen 153 für die Typen 1 bis H haben jeweils die Eigenschaft, daß die Differenzen Jx. - r. klein sein sollen im Hinblick auf eine gute Übereinstimmung, und daß nur einige große Differentiale eine schlechte Metrik verursachen.
Eine Veränderung in dem Schwellwertsfunktions-Änderer 157 zu der Vergleichs funktion vom Typ 1 "begrenzt das Ausmaß, bis zu dem eine einzelne Komponente das übereinstimmungsmaß abwerten kann. Solch eine Grenze stellt üblicherweise einen Schwellwert dar, der entsprechend in der Schwellwert-Entfernungs funktion vom Typ 1 dargestellt ist. -/-
G09884/0999
Um nunmehr im einzelnen die fünf obengenannten beispielhaften Typen von arithmetischen Informationsquellen-Einheiten 151 zu besehreiben, soll erneut Bezug genommen werden auf die Fig. 12 als auch auf die beiden Typen von Vergleichsfunktionen 153 dargestellt in den Fig. 13A und 13B, auf die drei Typen von Schwellwertfunktions-Snderer 157, dargestellt in den Fig. 14A, l4B und lACj auf zwei- Typen von Gewichtsfunktions-Snderern 161, dargestellt in den Fig. 15A und 15B sowie auf den Summen-Akkumulator l65, dargestellt in der Fig. l6.
Beim Typ Nr. 1 kann die "Schwellwert~Entfernungsfunktion"-Cpera~ tion definiert werden als die Summe i-gewichteten (w.) absoluten Werten der Differenzen zwischen entsprechenden Komponenten der Größen x. und r., wobei die Differenzen kleiner sind als der vorgewählte Wert der Schwelle der Größe O^ und wobei i = 1, 2 ... η ist. Diese erste Funktion kann ausgedrückt werden durch: η
2_, -ι / -1--1 I = I
- r
e.
wobei i = 1, 2 ... η und η = der Zahl von Worten in einer gegebenen Maske ist. Es ist ersichtlich, daß in dieser Funktion vom Typ 1 sowohl die Schwel1werte θ. als auch die Gewichte w verwendet werden.
609884/0999
Bei der Erläuterung der Arbeitsweise der Schwellwertentfernungs-Punktion der arithmetischen Informationsquellen-Einheit vom Typ Nr. 1 soll nunmehr auf den spezifischen Vergleichsfunktionskreis 153A in der Pig. 13A, auf den spezifischen Schwellwert-Funktions-Änderer 157A der Fig. 1^A, auf den spezifischen Gewichtsfunktions-Änderer lölA in Fig. 15A als auch auf den Summenakkumulator 165 der Fig. :l6 Bezug genommen werden.
Der Vergleichsfunktionskreis 153A der Fig. 13A erzeugt Werte c^ , d.h. die absoluten Werte der Differenz zwischen entsprechenden Komponenten von den zwei Zahlen oder Größen x. und r.. Im einzelnen wird das 6-Bit-Slgnal x. direkt an einen Kombinations~ kreis 2ol angelegt, während von dem 6~Bit-Signal r. zunächst mittels logischer Inverter oder NAND-Gatter 2o3 bis 2o8 das Komplement gebildet wird, bevor es an den Kombinationskreis 2ol angefegt wird. Damit der Kombinierer 2ol in der Lage ist, als Ausgangssignal das arithmetische Zweier-Komplement zu erzeugen, wird ferner eine binäre "1" an den Kombinierer 2ol zwecks Addition zu dem Komplementärsignal von r.« gelegt. Die Signale χ. , rT und "1" werden in dem Kombinierer 2ol summiert, der ein Ausgangssignal von 6 Bits erzeugt, die entsprechend an die zugeordneten ersten Eingänge von Exklusiv-ODER-Gatter 211-216 angelegt werden. Ein Übertrags-Ausgangsbit von dem Kombinierer 2ol wird durch ein NAND-Gatter 219 logisch invertiert, bevor es an
609884/0999
die zweiten Eingänge der Exklusiv-ODER-Gatter 211-216 angelegt wird. Ein Übertrags-Ausgangssignal vom Zustand "1" von dem Kombinierer 2ol wird durch das NAND-Gatter 219 invertiert, um die Exklusiv-ODER-Gatter 211-216 zu veranlassen, als Wiederholer der zugeordneten Bits, die an ihren ersten Eingängen anliegen, zu arbeiten. Umgekehrt wird ein Übertrags-Ausgangssignal des Kombinierers 2öl vom Zustand "0" durch das NAND-Gatter 219 invertiert, damit es die Exklusiv-ODER-Gatter 211-216 veranlaßt, als Inverter für die zugeordneten Bits, die an ihren ersten Eingängen anliegen, zu arbeiten.
Das 6-Bit-Ausgangssignal der Exklusiv-ODER-Gatter 211-216 wird in einem zweiten Kombiniererkreis 221 mit einer zweiten 6-Bit-Zahl summiert, die aus 5 Bits mit dem Wert "0" und dem 1-Bit-Ausgangssignal des NAND-Gatter 219 besteht. Daher ist diese zweite 6-Bit-Zahl entweder 000000 (Null) oder 000001 (Eins), je nach dem, ob das Bit des übertrag-Ausganges den Wert binär "1" oder "0" besitzt. Ein Übertrag-Ein-Bit vom Zustand "0" (d.h. kein Übertrag-Ein) wird durch den Kombinierer 221 dahingehend verwendet, daß die beiden Eingangssignale von jeweils 6-Bit aufaddiert werden. Das Ausgangssignal des Kombinierers ist ein 6-Bit-Wort c., das gleich dem absoluten Wert der Differenz zwischen jeder der entsprechenden Komponenten von x. und F., ist»
609884/0999
Zur Erläuterung der arithmetischen Zweior-Komplement-Arbeitsweise der Vergleichsfuntion 153A der Fig. 13A soll zuerst angenommen werden, daß x± = 5 (oder 000101) und r± = 3 (oder 000011) für einen ersten Zeitpunkt sei. In diesem Fall erzeugt die Addition von 00000 (oder 1) zu 111100 (das Komplement von r^, oder rT) den Wert von 111101 (rT + Dj die in dem Kombinierer 2ol gebildete Summe von 000101 (X1) und 111101 (F^ + 1) ist 000010 (oder 2) mit einem Übertragsausgang von Eins; die Inversion des Übertrags-Ausganges 1 durch das NAND-Gatter 219 veranlaßt die Exklusiv-ODER-Gatter 211-216, an ihren Ausgängen ihre Eingänge vom Wert 000010 zu wiederholen und bewirkt, daß der Wert 000000 in dem Kombinierer 221 zu dem Ausgangssignal 000010 der Gatter 211-216 addiert wird, zwecks Erzeugung eines 6-Bit c.-Ausgangssignaln, das zu dieser Zeit den Wert von 000010 (oder 2) hat.
Es sei nun angenommen, daß x. = 3 (oder 000011) und r = 5 ! (000101) ist. In diesem zweiten Fall erzeugt die Addition von 000001 (oder 1) zu 111010 (r^) den Wert von 111011 (F^ +1); in dem Kombinierer 2ol ist die Summe von 000011 (x.) und 111011 (rT + 1) = 111110 mit einem Übertragsausgang von Null} die Invertierung des Null-Übertragsausganges durch das NAND-Gatter veranlaßt die Exklusiv-ODER-Gatter 211-216, ihre Eingangssignale
vom Wert 111110 zu invertieren, um das Signal 000001 zu erzeugen, und es wird weiterhin veranlaßt, daß der Wert vonOOOOOl in dem Kombinierer 221 zu dein Signal 000001 addiert wird, um ein 6~Bit-Ausgangssignal für c. mit dem Wert 000010 (oder 2) zu erzeugen.
609884/0999 ~'~
Der Vergleichsfunktionskreis 157A der Fig. 13A hat die Eigenschaft, daß er verlangt5 daß der Wert von c„ 6 oder die Differenz
Ix1 - r^ I klein sein muß,, damit eine gute Übereinstimmung zwischen Xj und r, zu erzielen ist,, und daß bereits einige große Differenzen eins schlechte Übereinstimmung verursachen können.
Das Ausgangssignal c - von dem Vergleichsfunktionskreis 153A der Flg. 13A v;ird in der Amplitude mit einem Schwellwertsignal Θ. in dem Schwellwertfunktions-Ä'nderer 157A9 der in Pig. I1IA dargestellt ist, verglichen. Der Schwellwertfunktions-Änderer 157A enthält einen Vergleicher 225, der ein 1-Bit-t.-Signal vom Zustand binär "1" (t4 = 1) erzeugt, immer dann, wenn die Amplitude von c. größer ist als der Schwellwert Θ.. Immer dann, wenn c. gleich oder kleiner als -der Schwellwert G. ist, wird ein t^Sfenal von Zustand binär "0" (t± = 0) erzeugt.
Wie es in dem spezifischen Gewiehtsfunktions-Ä'nderer 16IA der Fig. 15A dargestellt ist, wird das t.-Ausgangssignal des Schwellwert funktions-Änderers 157A der Fig. 14A in einem Multiplizierer 229 mit der 5-Bit-Gewichtsinformation w. multipliziert, wodurch ein 5-Bit-Ausgangswort m. gebildet wird. Dieses m.-Ausgangswort von dem Multiplizierer 229 wird an den Summen-Akkumulator 165 der Fig. l6 angelegt.
609884/0999
In Fig. l6 löst das Lauf-Torsignal von B1Ig. 6 ein UND-Gatter aus, derart, daß es während des Lauf-Zustandes über einen 100 nsec.-Verzögerungskreis 235 1 MHz-Taktimpulse an den Takteingang eines Schieberegisters 237 durchlaßt. Es sei daran erinnert ( siehe Fig. 5 ), daß zu jeder 1 MHz-Taktimpulszeit ein neues m.-Wort in dein Halteregister 163 gespeichert und an den Summen-Akkumulator I65 angelegt wird. Jedes m.-Wort des Halteregisters I63 wird in einem Kombinationskreis 239 zu dem, was bereits vorher akkumuliert worden ist, hinzuaddiert, und ist nunmehr an dem Ausgang des Schieberegisters 237, um eine neue Summe zu erzeugen. Nachdem jede Summe sich stabilisiert hat, taktet 100 nsee, verzögerter 1 MHz-Taktimpuls von dem Verzögerungskreis 235 diese neue Summe In das Schieberegister 237· Das Register 237 enthält an seinem Ausgang eine laufende Gesamtsumme der vorher erzeugten m.-Worte für eine gegebene Maske, die aus dem Maskenspeicher Io3 ausgelesen ist, (Fig. 5). Diese laufende Gesamtsumme von m.-Worten an dem Ausgang des Schieberegisters ist d, wobei
und 1=1, 2 ... n, und η = die Anzahl der Worte in einer gegebenen Maske ist. Daraus ist ersichtlich, daß zu jedem Zeitpunkt ein neues in^-Signal, das an den Eingang des Summen-Akkumulators
609884/0999
165 angelegt ist, in dem Kombinierer 235 zu demjenigen hinzuaddiert wird, was vorher in dem Register 237 für die zugeordnete Kacke akkumuliert worden ist, wobei es als ein neuer d-Wert an dem Ausgang des Summen-Akkumulators 165 erscheint.
Andern Ende jeder Maske gelangt ein EOM-Bit von dem Halte-Register 163 durch einen 500 nsec.-Verzögerungskreis 2^11 zu dem Rückstelleingang des Schieberegisters 237· Dieses verzögerte EOM-Bit stellt alle Q-Ausgänge (nicht gezeigt) der Register auf den binären Zustand "0", so daß das Register 237 beim Start der nächsten Maske gelöscht ist.
In Bezug auf die Maske 2 soll numehr die akkumulierende Arbeitsweise des Summen-Akkumulators 165 erläutert werden. So wie es in Fig. 9 dargestellt ist, ist die Maske 2 acht STV-Werte lang und enthält 128 V/orte in diesen 8-STV-Werten. Daher werden, wenn die Maske 2 nacheinander aus dem Maskenspeicher io3 ausgelesen wird, insgesamt 128 m.-Worte erzeugt. Daher kann das Schieberegister 237 die Summe dieser 128 m.-..Worte speichern, bevor ein verzögertes EOM-Signal von dem Verzögerungskreis 2*il das Schieberegister für das nachfolgende m.-Wort der Maske 3 löscht. Wenn in dem obengenannten Beispiel die Summe von 90 m.-Worten in dem Register 237 gespeichert ist, dann wird das 91» m.-Wort zu dieser Summe hinzugezählt, und, nachdem das Register 237 erneut getaktet wurde, speichert dieses Register diese Summe von *
—/— 609884/0999
91 m.-Worten. Es ist daher ersichtlich, daß ein neues d-Ausgangs· signal, d.h. eine laufende Summe von m.-Worten jede 10 msec, als Antwort auf das Anlegen von jeweils eines neuen m.-Wortes an den Kombinierer 239 erzeugt wird. Jedes dieser d-Ausgangssigiiale kann beispielsweise ein 18-Bit-Wort sein. Während jedes Lauf-Zustandes werden daher für die Maske 2 durch das Register 237 insgesamt 128 d-Worte bzw. Ausgangssignale erzeugt. Jedoch wird, wie später gezeigt werden wird, nur das letzte oder das größte dieser 128 d-Worte (d2) nachfolgend als das Masken-2-Korrelations-Datensignal verwendet.
Zurück zur Fig. 12; der Typ Nr. 2, die Betragsnorm, kann definiert werden als die Summe von i-absoluten Wertender Differenzen zwischen entsprechenden Komponenten der Größen x. und r., wobei i = 1, 2 ... η ist. Diese zweite Punktion läßt sich ausdrücken durch:
d- \ ν - r
— J· Aj — J. j
wobei i = 1, 2 ... η und η = der Anzahl von Worten in einer gegebenen Maske ist.
Es ist ersichtlich, daß in dieser Punktion vom Typ Nr. 2 die gewichteten Worte w. vom gleichen Gewicht sind und daß der Schwellwert 9. nicht verwendet wird.
609884/0999
In der Darstellung der Betragsnorm der arithmetischen Informationsquellen-Einheit vom Typ Nr. 2 können die spezifische Vergleichsfunktion 153A der Fig. 13A, der spezifische Schwellwertfunktions-Änderer 157C der Fig. 14C, der spezifische Gewichtsfunk ti ons -Anderer l6lB der Fig. 15B und der Summeη-Akkumulator 165 der Fig. l6 verwendet werden. Die Vergleichsfunktion 153A der Fig* 13A und der 'Summenakkumulator I65 der Fig. l6 wurden bereits im vorhergehenden erläutert. Die Fig. 1^C zeigt an, daß der Schwellwertfunktions-Änderer 157C als eine gerade Leitung 2^5 dargestellt ist. Daher wird der Schwellwert θ in dem Schwellwertfunktions-A'nderer 157C der Fig. 1^C nicht verwendet, und daher ist t. = c.» Der Gewichtsfunktions-Ä'nderer I6IB der Fig. 15B zeigt ebenfalls eine durchgezogene Linie 247, um darzustellen, daß das Gewicht, daß jeder -Komponente oder Dimension des Signales tj zugeordnet ist, gleich ist. Daher ist m. = t. = c. , wobei jedes der m. und t.-Worte ein 6-Bit-Wort ist, da jeder Wert von c. ein 6-Bit-Wort ist.
Bei der spezifischen Darstellung der Betragsnorm von dem Typ Nr.2 kann die arithmetische Infomationsquellen-Einheit 15I der Fig, vereinfacht werden, indem die Halte-Register 155, 159 und 163 s.owie die Schwellwert- und Gewichtsfunktions-Änderer 157 und 161 weggelassen werden, und indem» das c.-Wort (von dem Vergleichs-Funktionskreis 153A der Fig. 13A) und das EOM-Bit (von dem Masken-
609884/0999
speicher Io3) direkt an den Summen-Akkumulator I65 angelegt werden, und in dem entsprechend die EOM- und EOR-Bits (von dem Mas» kenspeicher Io3) an die verbleibenden Plätze, angezdgt in Fig,5, angelegt werden.
Zurück zur Fig. 12; die gewichtete Betragsnorm vom Typ Nr. 3 kann definiert werden als die Summe der i-gewichteten (w )-abso~ luten Werte der Differenzen zwischen entsprechenden Komponenten der Größen x. und r., wobei i = 1, 2 ... η ist. Diese dritte Funktion kann ausgedrückt werden durch die Beziehung:
n_
w.
"i
xi - ri
wobei i = 1, 2 ... η und η = der Zahl der V/orte in einer gegebenen Maske ist.
Es ist ersichtlich, daß in diesem Funktionstyp Nr. 3 die Schwellwert-Worte Θ. nicht verwendet werden.
Bei der Darstellung der gewichteten Betragsnorm der arithmetischen Informationsquellen-Einheit vom Typ Nr. 3 können die spezifische Vergleichsfunktion 153A der Fig. 13A, der spezifische Scliwellwertfunktions-Änderer 157C der Fig. l4C, der spezifische Gewichtsfunktions-Änderer I6IA der Fig. 15A und der Summen-Akkumulator 165 der Fig. l6 verwendet werden. Alle diese Kreise
609884/0999
sind bereits im vorstehenden erläutert worden und bedürfen daher keiner v/eiteren Erläuterung. Wie #doch aus Fig. 12 hervorgeht, sind die Bit-Längen für die Worte c., t^t m^ und d bei dam Punktionstyp Nr. 3 = 6, 6, 11 und 18. Es sei angemerkt, daß sich der Punktionstyp Nr. 3 von dem Funktionstyp Nr. 1 dadurch unterscheidet, daß keine Schwelle θ vorgesehen ist. Bei der Darstellung dieses Funktionstyps Nr. 3 kann daher die arithmetische Informationsquellen-Einheit 151 der Fig. 5 vereinfacht v/erden, indem man den Schwellwertfunktions -Änderer 157 und die Halte-Register 159 wegläßt, und indem man die c. - und w.-Worte des Halte-Registers 155 direkt an den Gewichtsfunktions-Änderer l6l anlegt (da t. = c. und w. = w. ist), und indem die EOM- und EOR-Worte des Halte-Registers 155 direkt an das Halte-Register I63 angelegt werden.
Zurück zur Pig. 12; der Punktionstyp Nr. 4, die euklidische quadratische Abstandsfunktion kann definiert werden als die Summe der Quadrate der i-Differenzen zwischen entsprechenden Komponenten der Größen x. und r., wobei i = 1, 2 ... η ist. Diese vierte Punktion kann ausgedrückt werden durch die Beziehung:
wobei i = 1, 2 ... η und η die Anzahl der Worte in einer gegebenen Maske ist.
609884/0999
Es ist ersichtlich, daß in diesem Funktionstyp Nr. l\ jedes der gewlchteten Worte w. vom gleichen Gewicht sind, und daß keine Schwellwert-Worte Θ.verwendet werden.
Für die Darstellung der euklidischen quadratischen Abstandsfunktion der arithmetischen Informationsquellen-Einheit vom Typ Nr. k können die spezifische Vergleichs funktion 153A der Fig. 13A, der spezifische Schwellwertfunktions-Änderer 157B der Fig. 1^B, der spezifische Gewichtsfunktions-Änderer l6lB der Fig. 15B ui:d der Summen-Akkumulator I65 der Fig. 16 verwendet werden. Es wird dabei nunmehr nur noch der Schwellwertfunktions-Änderer 157B in der Fig. l4B im einzelnen erläutert, da die verbleibenden, im vorstehenden aufgezählten Kreise bereits vorher erläutert worden sind.
Der Schwellwertfunktions-Änderer 157B der Fig. 14B enthält einen quadrierenden bzw. multiplizierenden Schaltkreis 2^9, der, da keine Sehwellwerte Θ. verwendet werden, das 6-Bit-Eingangssignal c. quadriert, indem es dieses mit sich selbst multipliziert, um dadurch,ein 12-Bit-Ausgangssignal t. zu erzeugen, das = c^· c,
ρ
oder c. ist. Wie in Fig. 12 angedeutet, sind die Bit-Längen für die Worte m. bzw. d in dem Funktionstyp Nr. 4 gleich 12 bzw. 18.
609884/0999
Für die spezifische Darstellung des Funktionstyps Nr. H, der euklidischen quadratischen Abstandsfunktion, kann die arithmetische Informationsquellen-Einheit 151 der Fig. 5 dadurch vereinfacht werden, indem man den Gewichtsfunktions-Änderer l6l und die Halteregister 163 wegläßt, und indem man direkt die t.-Worte und das EOM-Bit des Halteregisters 159 direkt an den Summen-Akkumulator 165 anlegt, und indem man die EOM- und EOR-Bits des Halteregisters 159 an die verbleibenden Stellen, angezeigt in Fig. 5, anlegt.
Zurück zur Fig. 12; der Funktionstyp Nr. 5, die Funktion des Skalar-Produktes.von zwei Vektoren, kann aufgefaßt werden durch die Summe der !-Produkte von entsprechenden Komponenten der Größen x. und r., wobei i =1, 2 ... η ist. Diese fünfte Funktion kann ausgedrückt werden durch:
a Λ
41
4t
wobei i = 1, 2 ... η und η die Zahl der V/orte in einer gegebenen Maske ist.
Es ist ersichtlich, daß in diesem Funktionstyp Nr. 5 die gewichteten Worte w. vom gleichen Gewicht sind, und daß keine Schwellwert-Worte 0. verwendet werden.
609884/0999
- 6l -
Bei der Darstellung der Punktion des Skalar-Produktes von zwei Vektoren der arithmetischen Informationsquellen-Einheit vom Typ Nr. 5 kann die spezifische Vergleichs funktion 153B dor Fig. 13B, der spezifische Schwellwertfunktions-Änderer 157C der Fig. l4C, der spezifische Gewichtsfunktions-Xnderer l6lB der Fig. 15B und der Summe η-Akkumulator 165 der Fig. 16 verwendet werden. Dabei soll nur die Vergleichsfunktion 153B der Fig. 13B im einzelnen diskutiert werden, da der Rest der oben bezeichneten Schaltkreise· bereits im vorstehenden diskutiert worden ist.
Die Vergleichsfunktion 153B der Fig. d 3B enthält sinen Multiplizierer 251, der entsprechende Komponenten der x. und r^-Worte miteinander multipliziert, um ein 12-Bit-Wort oA zu erzeugen. In diesem Fall ist c. gleich dem Produkt x.»r.. Wie in Fig. 12 dargestellt ist», sind die Bit-Längen für den Typ Nr. 5 für jedes der Worte t., m. und d gleich 12, 12 bzw. 18.
Für die spezifische Darstellung des Funktionstyps Nr. 5, dem skalaran Produkt von zwei Vektorfunktionen, kann die arithmetische Informationsquellen-Einheit 151 der Fig. 5 dadurch vereinfacht werden, indem die Halte-Register 155, 159 und I63 sowie die Schwellwert- und Gewichtsfunktions-Veränderer 157 und I6I weggelassen werden, und indem das t.-Wort (von der Vergleichsfunktion 153B der Fig. 13B) und das EOM-BIt (von dem Maskenspeicher Io3) direkt an den Summen-Akkumulator l65 angelegt werden,
609884/0999
sowie indem die EOM- und EOr-Bits (von dem Maskenspeicher I03) an die in Pig» 5 angezeigten verbleibenden Plätze angelegt werden,
Die korrelierende Ai-beitsweise der arithmetischen Informationsquellen-Einheit 151 soll nunniahr weiter analysiert v/erden. Im einzelnen soll die korrelierende Arbeitsweise der Einheit 151 vom Typ Nr. 1 (Fig. 12) in Verbindung mit z.B. einer l6-Wortelangen Maske X unter Bezugnahme auf die Fig. 17 analysiert werden, da diese Einheit vom Typ Nr. 1 sowohl Schwellwerte Θ. als auch Gewichte w. benutzt. Es sei jedoch betonts daß von der gegebenen Information eine ähnliche Analyse mit bekannten Mittein für die anderen Typen von arithmetischen Informationsquellen-Einheiten 151 (Fig. 12) durchgeführt werden können.
Es sei nun angenommen, wie es in der Fig. 17 zum Ausdruck kommt, daß die Größen x^, r., Θ. und w. für die l6-Wort-lange Maske X ihre entsprechenden angezeigten Werte während der l6 aufeinanderfolgenden Perioden von 1 MHz^Zählimpulsen (von der Zentralsteuerung 87) erzeugen. In dieser 16-Wort-langen Maske ist i = 1, 2 ... 16. .Es ist ersichtlich, daß jedes der c^-Worte ( von der Vergleichsfunktion 153A der Fig. 13A) gleich dem Absolutwert der Differenz zwischen den entsprechenden x^- und r.-Worten ist. Immer dann, wenn die Werte dieser e.^-Worte die entsprechenden Schwellwerte 9. übersteigen, sind die t.-Worte (von dem Schwell-
609884/0999
wertfunktions-Änderer 157A der Pig* l4A) gleich 1* Für alle anderen Werte von c. und O sind die Werte für die t.-Worte gleich O, Die Multiplikationen der entsprechenden Werte der tj~ und w. V/orte erzeugen die m.-Worte (von dem Gewichtsfunktions-A'nderer l6lA der Pig. 15A). Immer dann, wenn ein t.-Wort gleich 1 ist, ist der Wert des zugeordneten resultierenden in^-Wortes gleich dem V/ert des zugeordneten Gewichtwortes w. . Wenn ein t.-Wort gleich 0 ist, dann ist das zugeordnete resultierende m.-Wort gleich 0. Die Aufsummierung oder die laufende Summe der vorher akkumulierten m.-Worte mit dem V/ert des neuesten m. -Wortes ist dargestellt, und zwar mit einer Endsumme an dem Ausgang des Summen-Akkumulators 165 der Fig* 6, dar während der letzten oder der l6, Zählimpulsperiode für die Maske X den V/ert von 31 hat. Diese Endsumme von 31 ist das Ausgangs-Korrelations-Datenslgnal d, für die Maske X.
Zurück zur Fig. 5» die d-Werte des Summeη-Akkumulators I65 in der arithmetischen Informationsquellen-Einheit 15I werden über eine zusammengesetzte Leitung 3ol an den "Daten-Ein"-Eingang eines "first-in, first-out" Datenspeicherkreises 3o3 (FIFO) angelegt. Dieser FIFO-Datenspeicherkreis 3o3 kann aus einer Anordnung von 18 parallel arbeitenden FIFO-Schieberegistern (nicht dargestellt) bestehen, und zwar von einem Typ, wie sie von der Firma Fairchild mit der Teile-Nr. A7K3341191 hergestellt werden.
609884/0999
Jedes FIFO-Schieberegister in dem Kreis 3o3 hat "Dafcen-Ein"^ "Fensterimpuls-Ein" und "Fensterimpuls-Aus"-Eingänge und einen "Daten-Aus"-Aus gang.
Die 18 Bits in jedem der d-Werte, die von dem SummenTAkkumulator 165 erzeugt werden, v/erden an die entsprechenden "Daten-Ein"-Eingange der 18 FIFO-Schieberegister in dem Kreis 3o3 angelegt. Alle 18 "Fensterimpuls-Ein"-Eingänge sind untereinander verbunden, damit sie gemeinsam jedes EOM-Bit von dem Halte-Register 163 empfangen können. Dadurch schaltet jedes EOM-Bit die 18 FIFO-Schieberegister derart an, daß sie nur die 18 Bit in dem letzten d-Wort, die erzeugt werden, bevor das EOM-Bit eintrifft,, empfängt. Es ist daher ersichtlich, daß für jede Maske, die aus dem Maskenspeicher 303 ausgelesen wird, nur die 18 Bits in einem d-Wort in den Kreis 3o3 verschoben werden. Das d-Wort, das in dem Kreis 3o3 für jede Maske gespeichert ist, ist dasjenige vom gröfatcn Viert und entspricht damit der letzten akkumulierten Summe, die in dem Summen-Akkumulator I65 erzeugt worden ist, bevor dieser Akkumulator I65 durch das verzögerte EOM-ßit von dem Verzögerungskreis I67 gelöscht wurde.
Die Anordnung der FIFO-Schieberegister in dem Kreis 303 verschiebt intern parallel die 18 Bits in jedem empfangenen d-Wort in die erste freie Stelle. Dadurch ist es dem Kreis 3o3 möglich, für
609884/0999
jede Maske, die während des Lauf-Zustandes aus dem Maskenspeicher Io3 ausgelesen wird, nacheinander ein d~Wort zu speichern.
Wie es kurz in Verbindung mit den Fig. 18 und 19 in größeren Einzelheiten erläutert werden solj, wird das EOR (Ende des Laufs)-Bit von dem Halte-Register 163 an die Entscheidungsfunktion 17 angelegt» Als Antwort auf jedes EOR-Bit erzeugt die Entscheidungsfunktion 1?' eine Folge von FIFO-Ausgangs-Fensterimpulsen. Alle "Fensterimpuls-Aus"-Ausgänge des Kreises 3o3 sind ζugammerM-:eschaltet, damit sie gemeinsam jeden FIFO-Ausgangs-Fensterimpuls erhalten» Auf diese Weise veranlaßt jede der Folge von FIFO-Ausgangs-Fensterimpulsen alle 18 FIFO-Schieberegister gemeinsam ein zugeordnetes l8-3it langes Korrelatlons-Datenwort d fiL- eine zugeordnete Maske, die vorher aus dem Maskenspeicher Io3 ausgelesen worden ist, auszulesen. Da, wie in Fig. 9 angezeigt, M-verschiedene Masken in dem Maakenspeicher Io3 abgespeichert sind, sind M-verschiedene Korrelat!ons-Datenworte (d , d? ... d ) vorhanden, die nacheinander aus dem FIFO-Kreis 3° 3 ausgelesen werden. Die Folge der Korrelations-Datenworte werden der Entscheidungsfunktion 17 zugeführt. Unter Bezugnahme auf die Fig. 18 und 19 soll nun die Arbeitsweise dieser Entscheidungsfunktion 17 einzelnen näher erläutert werden.
609884/0999
Die Fig. l8 zeigt einen ersten Teil der Entscheidungsfunktion 17. Während des Betriebes setzt das EOR-Bit von dem Halte-Register 163 (Fig. 5) ein Flip-Flop 311, derart, daß sein Q-Ausgang ein Signal mit dem Zustand "1" führt. Dieses Signal vom Zustand "1" schaltet ein UND-Gatter 313 an, das 100 KHz-Taktimpulse (von dem Systemzeitgenerator 19 der Fig. 1) an den Zähleingang eines Zählers 315 und an einen 100 nsec.-Verzögerungskreis 317 durchläßt. Jeder 100 KHz-Impuls von dem UND-Gatter 313 wird durch den Zähler 315 gezählt zwecks Erzeugung eines Adressen-Zählstandes, der an den Adress-Eingang eines Demultiplexers 319 angelegt vird. Jeder der 100 KHz-Impulse, die mittels des Zählers 315 gezählt werden, werden ferner mittels des Verzögerungskreises 317 um 100 nsec. verzögert zwecks Erzeugung eines FIFO~Ausgangs-Fensterimpulses. Das Ausgangssignal des Verzögerungskreises 317 bildet daher eine Folge von FIFO-Ausgangs-Fensterimpulsen, die den FIB1O-Datenspeicher-Schaltkreis 3o3 (Fig. 5) derart anschalten, daß er nacheinander l8 Bit-breite FIFO-Korrelations-Datensignale d*-d
ι m
ausliest und sie an den Demultiplexer 319 anlegt.
Jeder Adressenzählstand von dem Zähler 315 ist in einem stabilisierten Zustand, bevor eines der zugeordneten Datensignale d^-d an den Demultiplexer 319 angelegt werden. Die FIFO-Ausgangs-Fensterimpulse des Verzögerungskreises 317 werden weiterhin an den Demultiplexer 319 angelegt. Der Demultiplexer 319 kann aus
609884/0999
einem Satz von elektronischen Schaltern bestehen, die nacheinander von den Adressen des Zählers 315 adressiert werden, damit die seriell erzeugten d.-d -Eingangs-Datensignale in parallele Ausgangssignale d.-d umgewandelt werden. Zur selben Zeit wandelt der Demultiplexer 319 die Folge der FIFO-Ausgangs-Fensterimpulse des Verzögerungskreises 317 in parallele Ausgangs-Fenstersignale, Fenster, bis Fenster .
1 m
Jeder Ausgangs-Adress-Zählstand des Zählers 315 wird an einen Eingang eines Vergleichers 321 angelegt. Die Zahl M, die gJeich der Zahl der in dem Maskenspeicher· Io3 (Fig. 5) gespeicherten Masken ist, wird an den zweiten Eingang des VcrgIeichers 321 angelegt. Wenn der Adress-Zählstand des Zählers 315 gleich der Zahl M ist, erzeugt der Vergleicher 321 einen Anschalt-Impuls, der das Flip-Flop 311 zurückstellt, damitteine 100 KHz-Impulse mehr das UND-Gatter 313 passieren können. De.-1 Anschalt-Impuls stellt ferner den Zähler 315 auf den Zählstand Null zurück. Da:; Flip-Flop 311 und der Zähler 315 verbleiben in diesem zurückgestellten Zustand, bis aufgrund des folgenden EOR-Bits neue FIFO-Korrelations-Datensignale demultiplext werden. Die Masken-Korre» lations-Datensignale d.-d , die Fensterimpuls-Signale, bis und der Anschalt-Impuls werden an einen zweiten Teil de*· Entscheidungsfunktion 17 angelegt, so wie es in der Fig. 19 dargestellt ist.
60988-4/0999
Die Flg. 19 zeigt den zweiten Teil der Entscheidungsfunktion 17, und zwar für den Fall von vier Masken, d.h. M = 4♦ Natürlich kann die Verwirklichung auch leicht nach höheren Werten hin a.usgedehnt vier den, z.B. auf den Fall von 27 Masken, d.h. M = 27. Um innerhalb einer Abtastperiode mehr als 27 Masken zu korrelieren, können eine vorbestimmte Anzahl von asynchronen Korrelationskreisen 15 (Fig. 5) parallel arbeiten, um gleichzeitig eine vergleichbare Zahl von parallelen Strömen von Ausgangs-Korrelationsdaten zu erzeugen. Wenn jedoch, wie es in Fig. 1 dargestellt ist, nur ein asynchroner Korrelationskreis benutzt wird, dann können innerhalb einer Abtastperiode mehr als 27 Masken dadurch korreliert v/erden, indem man grundsätzlich innerhalb der gewählten Abtastperiode die Zeit, die für jede Masken-Korrelation notwendig ist, senkt. In diesen letzteren Fall können,
Ka3ken um das System der Erfindung auf-beispielsweise mindestens 500/ auszudehnen, die folgenden Änderungen gemacht werden: Gef-enwärtiger Stand der Technik, schnellere Speicher können für den Speicher 8l mit direktem Zugriff und den Maskenspeicher Io3 verwendet werden; die Wort-Speicherkapazität des Maskenspeichers Io3 kann auch beispielsweise 131072 V/orte ausgedehnt werden; es kann anstelle des dargestellten 1 MHz-Taktes ein 10 MHz-Takt verwendet werden, um die Worte aus den Speichern 8l und Io3 auszulesen und um die anderen Zeitoperationen in dem System durchzuführen; schließlich kann eine Abtastzeit von 20 msec, anstelle
609884/0999
von 10 msec, in dem System verwendet werden, Indem man eine Abtastfrequenz von 50 Hz anstelle der dargestellten 100 Hz verwendet. Natürlich kann auch eine Kombination dieser beiden Fälle dazu verwendet v/erden, die Anzahl von Maskenkorrelationen innerhalb einer Abtastpsriode zu erhöhen. Es ist daher ersichtlich, daß mittels der obengenannten Maßnahmen das System der Erfindung leicht so ausgelegt v/erden kann, daß es mit irgendeiner gewünschten Anzahl von Masken arbeiten kann.
Es sei in Erinnerung gerufen, daß die V/orte in jeder Maske des Maskenspeichers Io3 fortlaufend mit den zugeordneten STV-Werten, d.h. den digitalisierten Sprachwerten, die in dem Speicher Sl (Fig. 5) gespeichert sind, verglichen werden; daß ferner ein Korrelations-Datensignal d die Summe dieser Vergleiche für eine gegebene Maske darstellt; daß ferner ein Korrelations-Datensignal d. - d für jede Maske 1 - M des Speichers Io3 erzeugt wird; und daß schließlich die relative Amplitude jedes dieser Signole d. - d ein Maß für die Über eins timmung zwischen Masken In dem Speicher Io3 und den zugeordneten Sprachsignalen, gespeichert in dem Speicher 8l, sind.
Wie es bereits oben beschrieben wurde, repräsentieren die Masken in dem Maskenspeicher Io3 (Fig. 5) jeweils einen dyadischen oder triadischen phonetischen Ton. Für den Fall der vier Masken, der
609884/0999
in der Pig. 19 dargestellt ist, sei angenommen, daß das Schlüsselwort "Los Angeles" angezeigt werden soll. Phonetisch läßt, sich das Schlüsselwort "Los Angeles" in die Tongruppen "Los", "An", "ge" und "les" zerlegen. Zum Zwecke der nachfolgenden Beschreibung soll, wenn die Masken 1 bis 4 den Tongruppen "Los", "An", "ge" und "les" entsprechen.
Während jeder 10 meec.-Periode werden neue Masken-Korrelationsdatonsignale d. , do, d, und dj, erzeugt und über eine zusammengesetzte Leitung entsprechend an Pufferregister 331, 333 und 335 sowie an einen Kombinationskreis 337 angelegt. Jede 10 msec, wird mittels dar Fensterimpulse 1 bis 3 der neueste Wert von d, , d~ und d-, in die Register 331, 333 und 335 eingeschoben bzw. dort gespeichert. Die Pufferregister 331, 333, und 335 können jeweils aus 18 parallelen, nicht dargestellten Schieberegistern bestehen, v/obei jedes Schieberegister 128 in Reihe geschaltete Flip-Flops (nicht dargestellt) besitzt. Daher kann jedes der Puffer-Register 331, 333 und 335 für einen gegebenen Zeitpunkt 128 benachbarte verschiedene Werte für die zugeordnete Größe d enthalten. Beispielsweise enthält das Puffer-Register 331
Werte
128 aufeinanderfolgaxe/des Korrelations-Signals d1 für die Maske Da jede 10 msec, ein anderer Wert von d. erzeugt wird, sind die Register 331 (als auch jedes der Register 33 und 335) zeitlich gesehen 1280 msec. lang.
609884/0999
Verbunden mit den Puffer-Registern 331, 333 und 335 sind Beobachtungsfenster, die innerhalb der zugeordneten Register 331, 333 und 335 entsprechend den Zeiten des Erscheinens der phonetischen Töne in dem gewünschten Schlüsselwort, das in diesem Beispiel "Los Angeles" ist, zeitlich untereinander angeordnet sind. Da beispielsweise der Ton "Los" vor dem Ton "An" erscheint, ist das Fenster in dem Register 331 rechts neben dem Fenster in dem Register 333 angeordnet. Da in gleicher Weise der Ton "An" vor dem Ton "ge" erscheint, ist das Fenster in dem Register 333 rechts nebem dem Fennter 335 angeordnet. Da der Ton "les" zuletzt in dem Wort "Los Angeles" erscheint, wird er direkt an den Kombinierer 337 angelegt.
Jedes der Beobachtungsfenster in den Registern 331, 333 und 335 kann, zeitlich gesehen, eine Länge aufweisen, die zwischen 30 und 200 msec, liegt. Die Länge oder die Zeitdauer eines Beobachtungsfensters wird grundsätzlich von dem Betrag der Änderungen in der Sprachgeschwindigkeit (rate of speech) für die zugeordnete Dyade oder Triade bestimmt. Je mehr Variationen in der Sprachgeschwindigkeit vorhanden sind, je länger ist das Fenster. Andererseits werden die Grenzen des Fensters (oder das Nahekommen der Fenster untereinander) von dem Trainingssatz der Äußerungen bestimmt. Eine Grenze des Fensters wird durch den nächstliegenden Zeitpunkt bestimmt, bei dem die Maske und die folgende
609884/0999
benachbarte Maske immer zusammen beobachtet werden können, wogegen die andere Grenze durch den entferntest liegenden Zeitpunkt bestimmt wird, bei dem sie immer abseits beobachtet werden. Bei der Bestimmung der Länge und der Grenzen der Beobachtungsfenster für ein gewünschtes Schlüsselwort, untersucht die Person, die den Trainer Io5 (Pig, 5) trainiert, alle verwendeten Trainingsdaten, und mißt statistisch die Bereiche jeder der Zeitänderungen bzw. Änderungen der entsprechenden Masken untereinander. Man erhält jedes Fenster aus den Trainingsdaten, indem man für den zugeordneten Dyaden- öder den Triaden-Ton in jedem gewünschten Schlüsselwort den Bereich oder die Extremwerte der zeitlichen Änderungen in der Sprachgeschwindigkeit beobachtet und indem man an jedem Ende des Bereiches einen Zuschlag von 20 % hinzufügt. Jedes Fenster ist dadurch der empirische Bereich dieser Veränderungen, der ausgedehnt worden ist, um begrenzten zusätzlichen Abweichungen, die in den Trainingsdaten gefunden werden, Genüge zu tun.
Jedes der Fenster in Fig. 19 bezieht sich auf die letzte Maske. Wie aus Fig. 19 für den Fall von vier Masken hervorgeht, bezieht sich jedes der Fenster für die Pufferregister 331, 533 und 335 auf die Maske 4 oder mehr im einzelnen auf das gerade anstehende Masken-Jj-Korrelationsdatensignal dj.. Je weiter das Fenster in dem Pufferregister von dem laufenden d^-Wert für die letzte Maske (Maske k) entfernt liegt, je weiter ist das Beobachtungs-
-/-609884/0999
fenster. Beispielsweise ist in dem Puffer-Register 331 das Fenster zwischen den Masken 1 und 4 das breiteste, weil es zeitlich gesehen am weitesten von dem laufenden dj,-Wert entfernt ist. Andererseits ist in dem Pufferregister 335 das Fenster zwischen den Masken 3 und 4 das schmälste, weil es zeitlich gesehen am nächsten zu dem laufenden d^-Wert liegt.
Die Fenster in den Puffer-Registern 331, 333 und 335 sind stationär, wenn die Korrelationswerte d. - d-, durch die Puffer hindurchgeschoben werden. Die verschiedenen d~V.Terte (vond., dp und d,), die in den Fenstern der Pufferregister 331, 333 und 335 enthalten sind, werden entsprechend auf da?; Maximum, d.h. einen Peak ansprechende Detektoren 339, 3^1 und 3l\J> angelegt. Jeder Peak-Detektor erfaßt innerhalb des ihm zugeordneten Fensters das Maximum des d-Wertes. Die beste Übereinstimmung zwischen einer Maske und dem spekfcrografischen Signal, das in dem Speicher 8l gespeichert ist, wird durch diesen Peak-Wrt angezeigt, der also eine nahe Korrelation zwischen dieser Maske und ihrem zugeordneten Teil des gewünschten Schlüsselwortes anzeigt. Wie bereits oben herausgestellt wurde, ermöglicht es eine geeignete Breite und eine geeignete Anordnung der Fenster untereinander, daß die Peaks für die zugeordneten Komponenten eines gewünschten Schlüsselwortes gleichzeitig erzeugt werden, wenn das gewünschte Schlüsselwort auftritt« Der laufende Wert von d^ zusammen mit den Maximal-
609884/0999
werten von d., dp und d,, die innerhalb ihrer zugeordneten Fenster erzeugt werden, werden in einem Kombinationskreis 337 aufsummiert, um ein Schluß-Entscheidungsfunktionssignal zu erzeugen. Aufgrund dieser Darstellung ist ersichtlbh, daß das Schluß-Entscheidungsfunktionssignal die Summe des vorliegenden Korrelationswertes für die letzte Maske (Maske 4) und die Maximal-Vier te, die, zurückschauend, in den Fenstern von vorhergehenden Masken vorhanden waren. Dabei wird jede 10 msec, ein neuer Wert der Sohluß-Entscheidungsfunktion errechnet.
Die Amplitude jedes Schluß-Entscheidungsfunktionssignals ist kennzeichnend dafür, ob in der zu analysierenden Sprache ein gewünschtes Schlüsselwort enthalten ist oder nicht. Um daher bestimmen zu können, ob ein gewünschtes Schlüsselwort vorhanden ist oder auch nicht, wird jedes Schluß-Entscheidungsfunktionssignal und ein Entscheidungs-Schwellwertsignal 0 an das Schwellwertgatter 3^5 angelegt. Das Entscheidungs-Schwellwertsignal 0 wird empirisch beim Trainieren des Trainers Io5 (Fig. 5) abgeleitet. Aufgrund des Anlegens des Anschalt-Signals des Vergleichers 321 (Fig. 18) erzeugt das Schwellwert-Gatter 3^5 ein Entscheidungs-Aus gangs signal. Dieses Entscheidungs-Ausgangssignal ist ein Signal vom Zustand binär "1",immer dann, wenn das Schluß-Entscheidungs funktionssignal größer als die Ertscheidungsschwelle 0 ist; in allen anderen Fällen hat es den Zustand binär "0". Jede
609884/0999
• ^ - 75 -
10 msec, wird ein neuer Wert des Entscheidungs-Ausgangssignals errechnet, indem eine neu entwickelte Schluß-Entscheidungsfunktion mit der Ent s ehe i dungs schwel le 0 verglichen wird. Ein Entscheidungs-Ausgangssignal am Schwellwertgatter 3^5 vom Zustand binär "1" zeigt an, daß die korrelierten Werte der Sprach-Eingangssignale und der Masken, die dieses Schlüsselwort ausmachen, in richtiger Weise erfaßt worden sind mit den geeigneten Peak-Werten und daß das gewünschte Schlüsselwort erfaßt worden ist. Dieses Entscheldungs-Ausgangssignal vom Zustand "1" kann dazu verwendet werden, mittels eines nicht gezeigten Ausgangskreises eine Glocke ertönen zu lassen, ein Licht einzuschalten, bestimmte Kontrolleinrichtungen anzuschalten, die eine vorbestimmte Funktion ausüben, z»ß. das Starten oder Beenden der Arbeltsweise einiger anderer nicht dargestellter Einrichtungen. Entsprechend der Plazierung und der Breite der Fenster in dem Schaltkreis gemäß Fig. 19 können die'Masken-Korrelationen in einer Art und Welse kombiniert werden, die einer großen Änderungsbreite in der Sprachgeschwindigkeit angepaßt ist.
Es soll erwähnt werden, daß der Schaltkreis nach Fig. 19 gerade ein gegebenes Schlüsselwort erkennen kann. Wenn weitere Schlüsselworte erfaßt werden sollen, ist für jedes zusätzliche zn erfassende Schlüsselwort ein zusätzlicher Schaltkreis ähnlich demjenigen in Fig. 19 notwendig. In diesem Fall werden die geeigneten Signale der Korrelations-Datensignale A1 - dm in Verbindung
609884/0999
mit jedem zusätzlichen, auszuwählenden Schlüsselwort verwendet werden, mit einem Puffer-Register, das allen, und zwar den letzten Masken der Maskengruppe, die mit irgendeinem gegebenen Schlüsselwort verbunden ist, zugeordnet ist, und mit den Penstern in den Puffer-Registern, die in geeigneter Weise angeordnet sind, und die die geeigneten Abmessungen haben. Indem man kontinuierlich die Masken-Korrelationsdaten des Demultimplexers 319 (Fig. 18) in einer selektiven Art und V/Eise kombiniert, so wie es oben angeführt ist, kann irgendeine gegebene Zahl von Schlüsselworten durch das gesamte System erfaßt werden.
Werden beispielsweise drei Masken-Vielfache verwendet, und zwar im Hinblick auf die freie Variation und den Zwischensprechereffekt (wie oben diskutiert), dann kann ,jede der drei Masken in Reihe (oder auch parallel) mit den Ausgangssignalen des Speichers 81 korreliert werden. Die Korrelationsdatensignale von diesen drei Masken-Vielfachen können dann gleichzeitig an einen Maximumoder Peak-Detektor (nicht gezeigt) angelegt werden, der ähnlich den Peak-Detektoren 339j 3^1 und 3^3 ist, wobei der Maximum-Maskenkorrelationswert d der drei beispielsweise als einer der d-Werte an den Schaltkreis nach Pig. 19 angelegt wird. Indem Vielfach-Hasken verwendet werden, ist das System gemäß der Erfindung nicht nur aufnahmefähig hinsichtlich einer großen Anzahl von verschiedenen Sprechern, sondern kann auch eine breite freie
609884/Q999
Variation in der phonetischen Transkription der zu erfassenden Schxüsselworte zulassen.
Die Fig. 20 zeigt ein Blockschaltbild einer anderen Ausführungsform des zweiten Teiles der Entseheidungsfunktion 17 nach Fig.1, die anstelle der Anordnung nach Fig. 19 verwendet werden kann. Der in Fig. 2o dargestellte Schaltkreis bezieht sich ebenso wie der Schaltkreis nach Fig. 19 beispielhaft auf einen k-Maskenfall. Es ist offensichtlich, daß der Schaltkreis nach Flg. 2o in Übereinstimmung mit der hier gegebenen Lehr^ für die Benutzung von mähr als 4 Masken ausgedehnt werden kann. Der Schaltkreis nach Fig. 2o hatj ebenso wie derjenige nach Fig. 19» nur die Fähigkeit, ein Schlüsselwort zu erfassen. Damit das System der Erfindung in der Lage ist, irgendeine gegebene Zahl von Schlüsselworten zu erfassen, müssen in dem System eine entsprechende Anzahl von Schaltkreisen, ähnlich demjenigen gemäß Fig. 2o, vorgesehen werden.
Es sei in Erinnerung gerufen, daß in dem Schaltkreis der Fig. 19 die Fenster der Pufferregister 331, 333 und 335 in Bezug gesetzt wurden zu dem laufenden Masken-Korrelations-Datensignal d^, das von der letzten Maske, im dargestellten Beispiel die Maske 4, abgeleitet wurde. In dem Schaltkreis der Fig. 2o wird jedes Fenster bezogen auf das Korrelations-Datensignal, das von der fol-
609884/0999
genden benachbarten Maske und nicht von der letzten Maske abgeleitet wird.
In Fig. 2o werden die Masken-1-Korrelations-Datansignale d nacheinander jede 10 msec, durch die zugeordneten Fenster-1-Signale in ein Puffer-Register 351 eingetaktet. Das Register 351 hat ein Beobachtungsfenster, das im wesentlichen die ganze Speicherkapazität des Registers 351 umfaßt. Jede 10 msec, erfaßt ein Maximum« Detektor 353 den Peak-Wert d. des Beobachtungsfensters des Registers 351· Jedes Peak-Ausgangssignal d. des Maximum-Detektors 353 wird in einem Kombinationskreis 355 mit einem zugehörigen Masken-2-Korrelations-Datensignal dp summiert, zwecks Erzeugung eines ersten Entseheidungs-Funktionssignals für die Masken 1 und 2. Jede 10 msec, wird eine neue erste Entscheidungsfunktion erzeugt.
Die nacheinander erzeugte erste Entscheidungsfunktions-Signale des Kombinierers 355 werden mittels der zugehörigen Fenster-2-Signale in ein Puffer-Register 357 eingetaktet. Gleich dom Register 351 hat das Register 357 ein Beobachtungsfenster, das im wesentlichen die gesamte Speicherkapazität des Registers 357 umfaßt. Jede 10 msec, erfaßt ein Maximum-Detektor 359 den Peak-Wert des" ersten-Entscheidungsfunktionssignals, das innerhalb des Beobachtungsfensters des Registers 357 gespeichert ist. Jede
609884/0999
Peak-Erste-Entscheidungsfunktlon des Maximum-Detektors 359 wird in einem Kombinierer-Kreis J>6± mit einem zugeordneten Masken-3-Korrelations-Datensignal d-, auf summiert, zwecks Erzeugung eines zweiten Entscheidungs-Punktionssignals für die Masken 1,
2 und 3» Jede 10 msec, wird eine neue zweite Entscheidungsfunktion erzeugt*
Die nacheinander erzeugten zweiten Entscheidungs-Punktionssignale des Kombinierers 361 werden mittels zugeordneter Fenster-3-Signale in ein Puffer-Register 363 eingetaktet. Gldch den Registern 351 und 357 hat das Puffer-Register 363 Beobachtungsfenster,
das im wesentlichen die gesamte Speicherkapazität des Registers 363 ausmacht. Es ist daher ersichtlich, daß, obgleich die Register 351, 357 und 363 der Fig. 2o ähnlich zu den Registern 331, 333 und 335 der Fig. 19 sind, und hinsichtlich der Speicherkapazität wesentlich kleiner als die Register der Fig. 19 sind.
Jede 10 msec, erfaßt ein Maximum-Detektor 365 den Peak-Wert des
zweiten Entscheidungs-Funktionssignales, das innerhalb des Beobachtungsfensters in dem Speicher 363 gespeichert ist. Jede Peak-Zweite-Entscheidungsfunktion von dem Maximum-Detektor 365 wird in einem Kombinationskreis 367 mit einem zugeordneten Masken-VierT Korrelations-Datensignal du aufsummiert, zwecks Erzeugung eines dritten Entscheidungs-Funktionsignales für die Masken 1, 2, 3
609884/0999
und H. Da In der Fig, 20 nur ein Fall für vier Masken dargestellt ißt, ist dieses dritte Entsheidungs-Funktionssignal das Schluß-Ertscheidungs-Funktionssignalo Es ist daher ersichtlich, daß der Kreis nach Fig. 20 den die Entscheidung treffenden Maximaiwert oder die Ents cheidungs funktion üüer das Zeitfenst-er zwischen zwei benachbarte Masken piaziert und diesen Wert au der Entscheidungsfunktion der folgenden Maske addiert, usw.. Auf diese Art und weise wird die Schluß-Entscheidungsfunktion nacheinander in dem Schaltkreis nach Pig. 2o akkumuliert, und nicht am Ende wie in Fig. 19.
Die Schluß-Entscheidungsfunktion des Kombinierers 367 wird mit der empirisch abgeleiteten Entscheidungsschwelle 0 in einem Schwellwertgatter 369 verglichen, zwecks Erzeugung eines Entscheidungs-Ausgangssignals immer dann, wenn das Ansehaltsignal des Vergleichers 321 an das Gatter 369 angelegt ist. Ein Entscheidungs-Ausgangssignal vom Zustand binär "1" zeigt an5 daß ein vorbestimmtes Schlüsselwort erscheint, d.h. erfaßt wurdes während ein Entscheidungs-Funktionssignai vom Zustand binär "0" das Gegenteil anzeigt. Das Entscheidungs-Ausgangssignal vom Zustand "1" kann dazu verwendet werden, irgendeine Funktion auszuüben, so wie es in Besug auf die Fig. 19 bereits erläutert wurde. Immer dann, wenn es gewünscht wird, daß zusätzliche Schlüsselworte durch das System erfaßt werden sollen, dann sind ent-
609384/0999
sprechend dem vorher Gesagten für jedes zusätzliche Schlüsselwort ein zusätzlicher Kreis nach Fig. 2o bei der Realisierung des Systems notwendig.
Da bei der Verwirklichung gemäß Fig. 20 jedes der Fenster in den Puffer-Registern 351, 357 und 363 sich jeweils auf die folgende benachbarte Maske und nicht, wie in Fig. 19, auf die letzte Maske besieht, besitzt die Verwirklichung gemäß Fig. 2o gegenüber der Verwirklichung gemäß Fig. 19 verschiedene Vorteile.
Zunächst sind die Puffer-Register 351, 357 und 3o3 der Fig. 20 verhältnismäßig kurz in der Länge, da jedes Fenster im wesentlichen die gesamte Speicherkapazität umfaßt. Anders ausgedrückt, der Schaltkreis nach Fig. 19 benötigt eine relativ große Speicherkapazität für jedes der Register 331, 333 und 335, da jedes Fenster nur einen kleinen Teil der Speicherkapazität des zugeordneten der Register 331, 333 und 335 verwendet. Mit anderen Worten, in Fig. 20 ist gegenüber Fig. 19 eine geringere Puffer-Speicherkapazität notwendig, da der Speicherumfang, der in Fig.2o notwendig ist, nur der maximal zwischen zwei benachbarten Masken auftretenden Zeit entspricht, und nicht der maximalen Zeit zwischen der ersten und der letzten Maske nach Fig« 19. Daher ist für den Schaltkreis nach Fig. 2o ein geringerer Betrag an hardware im Vergleich zu der Fig, 19 notwendig.
609884/0999
Zum Zweiten sind die Fenster der Register in Fig. 2o jeweils von derselben Länge und schmaler als diejenigen der Register der Fig. 19» In B1Ig. 19 müssen die Fenster länger und langer gemacht werden, da sie immer weiter von der letzten Maske entfernt liegen. Wie in Fig. 19 gezeigt, erfordert das Register 331 ein längeres Fenster als das Register·333, das seinerseits ein längeres Fenster als das Register 335 erfordert. Bas ist bedingt durch die Tatsache, daß die Veränderungen in dem zeitlichen Auftreten umso größer sind, je größer der zeitliche Abstand eines Fensters von den Korrelationsdaten der letzten Maske ist. In Fig. 2o wird die Variation innerhalb eines Wortes gemessen, wogegen in Fig. 19 die Variation quer über das Wort gemessen wird. Die Variation der Maske 1 in Bezug auf die Maske 2 ist viel weniger als die Variation von Maske 1 in Bezug auf die letzte Maske4 Dadurch ist der Schaltkreis nach Fig. 2o für denseiben Bereich von Worten wie der Schaltkreis nach Fig. 19 empfänglich, jedoch mit viel schmaleren Fenstern.
Zum Dritten ist anzumerken, daß der Schaltkreis nach Fig. 2o genauer als derjenige nach Fig. 19 ist, weil die Fenster in Fig.2o schmaler als diejenigen in Fig. 19 sind. Die Fenäer in Fig. müssen langer sein, damit sie die geforderte Information aufnehmen können. Je breiter jedoch ein Fenster ist, umso mehr Werte sind in ihm gespeichert. Daher ist die Chance, eine falsche
609884/0999
Schlüsselwort-Erfassung zu erhalten, indem der falsche Wert aufgenommen wird, größer. Umgekehrt, wenn ein schmaleres Fenster gemäß Fig* 2o verwendet wird, ist die Beschreibung der zeitlichen Zusammenhänge in den Schlüsselwort-Äußerungen genauer, d.h. die Wahrscheinlichkeit einer Fehlbetätigung wird reduziert.
Die Erfindung bezieht sich somit auf ein System zum asynchronen Erfassen von einem oder mehreren Schlüsselworten in einer kontinuierlichen Sprachinformation, wobei das Eingangs-Sprachsignal mittels eines Sprach-Prozessors in eine Vielzahl von analogen Sprach-Parameter verwendelt wird, die Sprach-Parameter selektiv mittels eines STV-Generators in digitalisierte Sprach-Abtastwerte oderSTVs-Werte umgewandelt werden, folgen der digitalisierten Sprachabtastwerte kontinuierlich in einem asynchronen Korrelationskreis mit Unterelementen von einem oder mehrerer Schlüsselworte korreliert werden, um Korrelationsdaten zu erzeugen, wobei diese Korrelationsdaten selektiv einen Entscheidungs-Funktionsschaltkreis befähigen, für jedes vorbestimmte Schlüsselwort, das erfaßt worden ist, ein vorbestimmtes Entscheidungs-Ausgangssignal zu erzeugen.
Es sei betont, daß im Vorstehenden Ausführungsbeispiele beschrieben worden sind, und daß viele Veränderungen gemacht werden kön-
609884/0999
nen, ohne daß das Wesen der Erfindung verlassen wird* Beispielsweise kann das System nach Fig. 1 mit verschiedenen logischen Schaltkreisen und Zeitsignalen verwirklicht werden, es kann mit seriellen Daten anstelle von parallelen Daten oder umgekehrt arbeiten, und es kann, wie im Vorstehenden bereits angedeutet, sowohl bei der begrenzten, als auch bei der unbegrenzten Schlüsselworte/rfassung mit einer vorbestimmten Anzahl von Masken arbeiten.
609884/0999

Claims (1)

  1. Patentansprüche
    Iy System zum Erfassen von einem oder mehreren Schlüsselworten in kontinuierlicher Sprache, gekennzei chnet durch :
    einen Prozessor, der auf ein kontinuierliches Sprachsignal anspricht und von ihm kontinuierlich eine Vielzahl von Sprach· Parameter erzeugt, eine Generatoranordnung, die auf die Vielzahl der Sprach-Parameter anspricht, um periodisch digitalisierte Sprach-Abtastwerte davon zu erzeugen, eine Korreiationsanordnung, die auf eine vorbestimmte Folge der digitalisierten Sprach-Abtastwerte anspricht und eine Vielzahl von Korrelations-Datensignalen erzeugt und eine Ent seht;! dungs· Anordnung für jedes gewünschte Schlüsselwort, das jeweils auf zugeordnete der Korrelationsdatensignale anspricht zwecks Erzeugung eines Anzeige-Entscheidungsausgangssignals immer dann, vienn ein zugeordnetes Schlüsselwort erfaßt worden ist.
    2. System nach Anspruch !,dadurch gekennzeichnet, daß der Prozessor einmal Eingangsmittel zum Aufteilen des kontinuierlichen Sprachsignals in eine Vielzahl von vorbestimmten Prequenzkomponenten und zum anderen Parameter-Mittel enthält, die auf die Vielzahl der vorgewählten Frequenzkomponenten ansprechen und eine Vielzahl von Sprach-Parameter erzeugen.
    609884/0999
    3. System nach Anspruch 2,dadurch gekennzeichnet, daß die Parameter-Mittel zunächst erste Mittel enthalten, die auf die Vielzahl der vorgewählten Frequenzkomponenten ansprechen und eine Vielzahl von zugeordneten angezeigten Signalen erzeugen, und die zum anderen zweite Mittel besitzen, die auf die Vielzahl der zugeordneten angezeigten Signale ansprechen, um eine Vielzahl von Sprachparameter zu erzeugen»
    4. System nach Anspruch 2, d a d u r c h gekennzeichnet, daß die Generator-Anordnung zunächst Mittel enthält, die auf die Vielzahl der Sprachparameter ansprechen, um Zeitmultiplex-Sprachparameter zu erzeugen, und die weiterhin Umwandlungsmittel aufweisen, die digitalisierte Sprach-Abtastwerte als Antwort auf die Zeitmultiplex-Sprachparameter erzeugen«
    5. System nach Anspruch 4,dadurch gekennzeichnet, daß die Korrelationsmittel enthalten: erste Speichermittel zum Speichern der digitalisierten Sprach-Abtastwerte während eines ersten Betriebszustandes und zum aufeinanderfolgenden Auslesen von Pblgen von digitalisierten Sprach-Abtastwerten während eines zweiten Betriebszustandes, zweite Speichermittel, zum Speichern vorbestimmter digitalisierter Informationseinheiten, die jeweils Unterelementen
    609884/0999
    von mindestens einem vorbestimmten Schlüsselwort entsprechen und zum aufeinanderfolgenden Auslesen der gespeicherten Informationseinheiten während eines zweiten Betriebszustandes und Mittel zum aufeinanderfolgenden Korrelieren jedes der gespeicherten Informationseinheiten während des zweiten Betriübszustandes mit einer entsprechenden Folge von digitalisierten Sprach-Abtastwerten zwecks Erzeugung eines korrespondierenden Korrelations-Datensignals für jede gespeicherte Informationseinheit, wobei die Amplitude jedes Korrelations-Datensignals kennzeichnend für das Maß der Übereinstimmung zwischen zugeordneter gespeicherter Einheit und der entsprechenden Folge von digitalisierten Sprach-Abtastwerten ist«
    System nach Anspruch 5, d.a durch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine Vielzahl von Speichermittel zum Speichern entsprechender Folgen von vorbestimmten der Korrelations-Datensignale, wobei jedes dieser Speichermittel ein zugeordnetes Fenster besitzt, das eine vorbestimmte Folge von vorher gespeicherten Korrelations-Datensignalen, die mit diesen Speichermitteln verbunden sind, umfaßt,
    eine Vielzahl von Maximum-Detektoren, die entsprechend mit dem Fanster der Vielzahl von Speichermittel verbunden sind, um entsprechend innerhalb der Fenster die Spitzenwerte der Signale zu «.erzeugen,
    6Ü9884/0999
    ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signals der Vielzahl der Maximum-Detektoren zwecks Erzeugung einer Schluß-Entscheidungsfunktion und ein Schwellwert-Gatter zum Erzeugen eines Anzeige-Entscheidungs-Ausgangssignales immer dann, wenn die Amplitude der Schluß-Entscheidungsfunktion ein Entseheidungs-Schwellwertsignal überschreitet, wobei das Auftreten des Entscheidungs-Ausgangssignales kennzeichnend für das Erfassen eines Schlüsselwortes, das dem Entscheidungsmittel zugeordnet ist, ist.
    7. System nach Anspruch '!,dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine Vielzahl von Speichermitteln .zum Speichern entsprechender Polgen von vorbestimmten der» Korrelations-Datensignale, wo- · bei jedes Speichermittel ein zugeordnetes Fenster- besitzt, das eine vorbestimmte Folge von vorher gespeicherten Korrelations-Datensignalen, die mit diesen Speichermitteln verbunden sind, umfaßt,
    eine Vielzahl von Maximum-Detektoren, die entsprechend mit diesen Fenstern der Vielzahl von Speichermitteln verbunden sind zwecks Erzeugung des Spitzenwertes der Signale innerhalb dieser Fenster,
    6Ü9884/0999
    ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signale der Vielzahl von Maximum-Detektoren zwecks Erzeugung einer Schluß-Entscheidungsfunktion, und
    ein Schwellwert-Gatter zum Erzeugen eines Anzeige-Entscheidungs-Ausgangssignals immer dann, wenn die Amplitude der Schluß-Entscheidungsfunktion ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten des Ausgangs-Entscheidungssignals kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheidungsmitteln verbunden ist.
    8. System nach Anspruch ^,dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: Eine vorbestimmte Anzahl N von in Reihe geschalteten Signaleinheiten, wobei jede Sgnaleinheit ein Speicherkreis zum Speichern einer Folge von Signalen enthält, und dieser Speicherkreis ein Fenster aufweist, das im wesentlichen die gesamte Signalspeicherkapazität des Speichers umfaßt, und der ferner einen Maximum-Detektor aufweist, der mit diesem Fenster des Speicherkreises verbunden ist zwecks Erfassen des Spitzenwertes der in dem Fenster gespeicherten Signale und der einen Kombinierer aufweist, zwecks Erzeugung eines Summsn-Auagangssignales, dadurch, daß der Spitzenwert dieses
    609884/0999
    Maximum-Detektors mit einem vorbestimmten der Korrelations-Datensignale aufsummiert wird, und
    daß die Entscheidungsmittel ein Sehwellwert-Gatter aufweisen, an das die erste der in Reihe geschalteten Signaleinheiten, wie eine Folge von einem ersten vorausgewählten Korrelations-Datensignalspeicher, eine Folge der summierten Ausgangssignale Jedes Kombinierers der ersten N-I Kombinierer, angelegt an und gespeichert in dem Speicherkreis der folgenden der Signaleinheiten, und an das eine Folge der summierten Ausgangs signale der N-ten Korn ünierer angelegt sind, wobei das Schwellwert-Gatter ein Anzeige-Entschei dungs-Aus.gangssignal erzeugt, imner dann, wenn die Amplitude eines summierten Ausgangssignales des N-ten Kombinierers ein Entscheidungs-Schwellvrertsignal überschreitet, wobei das Auftreten des Entscheidungs-Ausgangssipjnales kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit diesen Entscheidungsmitteln verbunden ist.
    9. System nach Anspruch 8, dadurch gekennzeichnet, daß die Korrelationsmittel enthalten: erste Speichermittel zum Speichern der digitalisierten Sprach-Abtastwerte während eines ersten Betriebszustandes und zum aufeinanderfolgenden Auslesen von Folgen von digitalisierten Sprach-Abtastwerten während eines zweiten Betriebszustandes,
    -/-809884/0999
    zweite Speichermittel zum Speiehern vorausgewahlter digitalisierter Informationseinheiten, die jeweils Unterelementen von mindestens einem vorbestimmten Schlüsselwort entsprechen und zum aufeinanderfolgenden Auslesen der gespeicherten Informationseinheiten während eines zweiten Betriebszustandes und Mittel zum aufeinanderfolgenden Korrelieren Jedes der gespeicherten Informationseinheiten während des zweiten Betriebszustandes mit einer entsprechenden Folge von digitalisierten Sprach-Abtastwerten zwecks Erzeugung eines korrespondierenden Korrelations-Datensignals für jede gespeicherte Informationseinheit, wobei die Amplitude jedes Korrelations-Datensignals kennzeichnend für das Maß der Übereinstimmung zwischen zugeordneter gespeicherte Einheit und der entsprechenden Folge von digitalisierten Sprach-Abtastwerten ist.
    10« System nach Anspruch 2, dadurch gekennzeichnet, daß die Korrelationsmittel enthalten: erste Speichermittel zum Speichern der digitalisierten Sprach-Abtastwerte während eines ersten Betriebszustandes und zum aufeinanderfolgenden Auslesen von Folgen von digitalisierten Sprach-Abtastwerten während eines zweiten Betriebszustandes, zweite Speichermittel zum Speichern vorausgevrählter digitalisierter Informationseinheiten, die jeweils Unterelementen
    609884/0999
    von mindestens einemvorausgewähllim Schlüsselwort entsprechen und zum aufeinanderfolgenden Auslesen der gespeicherten Informationseinheiten während eines zweiten Betriebszustandes und Mittel zum aufeinanderfolgenden Korrelieren jedes der gespeicherten Informationseinheiten während des zweiten Betriebszustandes mit einer entsprechenden Folge von digitalisierten Sprach-Abtastwerten zv/ecks Erzeugung eines korrespondierenden Korrelations-Datensignals für jede gespeicherte Informationseinheit, wobei die Amplitude jedes Korrelations-Datensignals kennzeichnend für das Maß der Übereinstimmung zwischen zugeordneter gespeicherte Einheit und der entsprechenden Folge von digitalisierten Sprach-Abtastv/erten ist.
    11, System nach Anspruch 10, dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine Vielzahl von Speichermittel zum Speichern entsprechender Folgen von vorbestimmten der Korrelations-Datensignale, wobei jedes dieser Speichermittel ein zugeordnetes Fenster besitzt, das einevorausgewählte Folg^von vorher gespeicherten Korrelations-Datensignalen, die mit diesen Speichermitteln verbunden sind, umfaßt,
    eine Vielzahl von Maximum-Detektoren, die entsprechend mit dem Fenster der Vielzahl von Speichermittel verbunden sind, um entsprechend innerhalb de.r Fenster die Spitzenwerte der Signale zu erzeugen,
    609884/0999 ~f~
    ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signale der Vielzahl der Maximum-Detektoren zwecks Erzeugung einer Schluß-Entscheidungsfunktion, und
    ein Schwellwert-Gatter zum Erzeugen eines Anzeige-Entscheidungs-Ausgangssignals immer dann, wenn die Amplitude der Schluß-Entseheidungsfunktion ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten des Entscheidungs-Ausgangssignales kennzeichnend für das Erfassen eines Schlüsselwortes, das dem Entscheldungöriiit^el zugeordnet ist, ist.
    12. System nach Anspruch 10t dadurch gekennzeichnet, daft die Entscheidungsmittel enthalten: eine vcTciisgevjätirte Anzahl N von in Reihe geschalteten Signaleinheiten, wobei jede Signaleinheit besteht aus: einem Speicherkreis zum Speichern einer Folge von Signalen, der ein Fenster aufv:eist, das im wesentlichen die gesamte Signalspeicher—Kapazität umfaßt,
    einem Maximum-Detektor, der mit dem Fenster des Speicherkreises verbunden ist zwecks Erfassung des Spitzenwertes der in dem Fenster gespeicherten Signale, und einem Kombinierer zum Erzeugen eines Ausgangssignales durch Kombination des Spitzenwertes des Maximum-Detektors mit einem vorausgewäüten der Korrelations-Datensignale, und
    609884/0999
    daß die Entscheidungsmittel weiterhin ein Schwellwert-Gatter aufweisen, an das die erste der in Reihe geschalteten Signaleinheiten, die eine Folge von ersten vorausgezahlten Korrelations-Datensignalen speichert, eine Folge von Ausgangssignalen der Kombinierer in den ersten N-I Kombinierer, die angelegt und gespeichert sind in dem Speicherkreis der folgenden der Signaleinheiten, und an das eine Folge der Ausgangssignale der N-ten der Kombinierer angelegt ist, wobei das S-chwellwer-t-Gatter ein Anzeige-Entscheidungs-Ausgangssignal immer dann erzeugt, wenn die Amplitude eines Ausgangssignales der N-ten der Kombinierer ein Entscheidungs-Schwellwertsignal überschreitet s wobei das Auftreten dieses Entscheidungs-Ausgangssignales kennzeichnend ist für das Einfassen eines Schlüsselwortes, das mit den Entscheidungsmitteln verbunden ist»
    13. System nach Anspruch 2, dadurch gekennzeichnet, daß die Enfcscheidungsmittel enthalten: eine Vielzahl von Speichermitteln zum Speichern entsprechender Folgen von vorbestimmten der Korrelations-Datensignale, wobei jedes dieser Speichermittel ein zugeordnetes Fenster besitzt, das eine vorausgezahlte Folge von vorher gespeicherten Korrelations-Datensignalen, die mit diesen Speichermitteln verbunden sind, umfaßt,
    609884/0999
    eine Vielzahl von Maximum-Detektoren, die entsprechend mit dem Fenster der Vielzahl von Speichermittel verbunden sind, um entsprechend innerhalb der Fenster die Spitzenwerte der Signale zu erzeugen,
    ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signale der Vielzahl der Maximum-Detektoren zwecks Erzeugung einer Schluß-Entscheidungsfunktion und
    ein Schwellwert-Gatter zum Erzeugen eines Anzeige-Entscheidungs-Ausgangssignals immer dann, wenn die Amplitude der Schluß-Entscheidungsfunktion ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten des Entscheidungs-Ausgangssignals kennzeichnend für das Erfassen eines Schlüsselwortes, das dem Entscheidungsmittel zugeordnet 1st, ist.
    System nach Anspruch 2, dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: einevorausgewäMfc Anzahl N von in Reihe geschalteten Signaleinheiten, wobei jede Signaleinheit besteht aus: einem Speicherkreis zum Speichern einer Folge von Signalen, der ein Fenster aufweist, das im wesentlichen die gesamte Signalspeicher-Kapazität umfaßt,
    einem Maximum-Detektor, der mit dem Fenster des Speicherkreises verbunden ist zwecks Erfassung des Spitzenwertes
    609884/0999
    7613258
    der in dem Fenster gespeicherten Signale, und einem Kombinierer zum Erzeugen eines Ausgangssignals durch Kombination des Spitzenwertes des Maximum-Detektors mit einem vorausgezahlten der Korrelations-Datensignale, und daß die Entscheidungsmittel weiterhin ein Schwellwert-Gatter aufweisen, an das die erste der in Reihe geschalteten Signaleinheiten, die eine Folge von ersten vorausgezahlten KorrcO.ationc-Datensignalen speichert, eine Folge von Ausgangssignalen der Kombinierer in den ersten K-I Kombinierer, die angelegt und gespeichert sind in dem Speicherkreis der folgenden der Signalejnheiten, und an das eine Folge der Ausgangssignale der IT-ten Kombinierer angelegt ist, wobei das Scnwellv/ert-Gatter ein Anzeige-Eritschoidungs-Ausgangssignal immer dann erzeugt, wenn die Amplitude eines Ausgangssignales der N-ten der Kombinierer ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten dieses Entscheidungs-Ausgangssignales kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheidungsmitteln verbunden ist.
    15. System nach Anspruch 1, dadurch gekennzeichnet, daß die Generator-Anordnung zunächst Mittel enthält, die auf die Vielzahl der analogen Sprachpararaeter ansprechen, Ur1: Zeitmultiplex analoge Sprachparameter zu er-
    ■ ■, -; q
    zeugen, und die weiterhin Umwandlungsmittel aufweisen, die digitalisierte Sprach-Abtastwerte als Antwort auf die Zeitmultiplex analogen Sprachparameter erzeugen.
    l6« System nach Anspruch 15,dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine Vielzahl von Speichermitteln zum Speichern entsprechender Folgen von vorbestimmten der Korreltations-Datensignale, wobei jedes Speicherniittel ein zugeordnetes Fenster besitzt, das eine ausgewählte Folge von vorher gespeicherten Korrelations-Datensignalen, die mit diesen Speichermitteln verbunden sind, umfaßt,
    eine Vielzahl von Maximum-Detektoren, die entsprechend mit diesen Fenstern der Vielzahl von Speichermitteln verbunden sind zwecks Erzeugung des Spitzenwertes der Signale innerhalb dieser Fenster,
    ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signale der Vielzahl von Maximum-Detektoren zwecks Erzeugung einer Schluß-Entscheidungsfunktion, und
    ein Schwellwert-Gatter zum Erzeugen eines Anzeige-Entscheidungs-Ausgangssignals immer dann, wenn die Amplitude der Schluß-Entscheidungsfunktion ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten des Ausgangs-
    609884/0999
    - 99 -
    Entscheidungssignals kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheigungs51.Lt te In verbunden ist.
    17. System nach Anspruch 15, dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine ausgewählte Anzahl N von in Reihe geschalteten Signaleinheiten, viobei jede Signaleinheit besteht aus: einem Speicherkreis zum Speichern einer Folge von Signalen, der ein Fenster aufweist, das im wesentliehen die gesamte Signalspeicher,Kapazität umfaßt,
    einen Maximum-Detektor, der mit dem Fenster des Speicherkreises verbunden ist zwecks Erfassung des Spxtzenwertes der in dem Fenster gespeicherten Signale, und einem Kombinlerer zum Erzeugen eines Ausgangssignales durch Kombination des Spitzenwertes des Maximum-Detektors mit einem ausgewählten der Korrelations-Datensignale, und daß die Entscheidungsraittel weiterhin ein Schwellwert-Gatter aufweisen, an das die erste der in Reihe geschalteten Signaleinheiten, die eine Folge von ersten ausgewählten Korrelations-Datensignalen speichert, eine Folge von Ausgangs Signalen der Kombinierer in den ersten N- 1 Kombinierer, die angelegt und gespeichert sind in dem Speicherkreis der folgenden der Signaleinheiten, und an das eine Folge der Aus-
    609884/0999
    gangssignale der N-ten der Kombinierer angelegt int, wobei das Schwellwert-Gatter ein Anzeige-Entscheldungs-Ausgangssignal immer dann erzeugt, wenn die Amplitude eines Ausgangssignales der N-ten der Kombinierer ein Entscheidungs.Schwellwertsignal überschreitet, wobei das Auftreten dieses Entscheidungs-Ausgangssignales kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheidungsmitteln verbunden ist.
    18. System nach Anspruch 15, d a d u r c h gekennzeichnet, daß die Korrelationsinittel enthalten: erste Speichermittel zum Speichern der digitalisierten Sprach-Abtastwerte während eines ersten ßetriebszustandes und zum aufeinanderfolgenden Auslesen von Folgen von digitalisierten Sprach-Abtastwerten während eines zweiten Betriebszustandes,
    zweite Speichermittel, zum Speichern ausgewählten digitalisierter Informationseinheiten, die jeweils Unterelementen von mindestens einem vorbestimmten Schlüsselwort entsprechen und zum aufeinanderfolgenden Auslesen der gespeicherten Informationseinheiten während eines zweiten Betriebszustandes und Mittel zum aufeinanderfolgenden Korrelieren jedes der gespeicherten Informationseinheiten während des zweiten Betriebszustandes mit einer entsprechenden Folge von digitalisierten Sprpch-Abi'.pstwerten zwecks Erzeugung eines korrcs-
    pondierenden Korrelations-Datensignals für jede gespeicherte Informationseinheit, wobei die Amplitude jedes Korrelations-Datensignals kennzeichnend für das Maß der Übereinstimmung zwischen zugeordneter gespeicherter Einheit und der entsprechenden Folge von digitalisierten Sprach-Abtastwerten ist.
    19. System nach Anspruch 18,dadurch gekennzeichnet,-daß die Entscheidungsmittel enthalten: eine Vielzahl von Speichermitteln zum Speichern entsprechender Folgen von ausgewählten der Korrelations-Datensignale, wobei jedes Speichermittel ein zugeordnetes Fenster besitzt, das eine ausgewählte Folge von vorher gespeicherten Korrelations-Datensignalen, die mit diesen Speichermitteln verbunden sind, umfaßt,
    eine Vielzahl von Maximum-Detektoren, die entsprechend mit diesen Fenstern der Vielzahl von Speichermitteln verbunden sind zwecks Entwicklung des Spitzenwert-Signals innerhalb dieser Fenster,
    ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signale der Vielzahl von Maximum-Detektoren zwecks Erzeugung einer Schluß-Entscheidungsfunktion, und
    ein Schwellwert-Gatter zum Erzeugen eines Anzeige-Entscheidungs-Ausgangssignals immer dann, wenn die Amplitude der
    609884/0999
    Schluß-Entscheidungsfunktion ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten des Ausgangs-Entscheidungssignals kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheidungsmitteln verbunden ist.
    2o. System nach Anspruch 18, dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine ausgewählte Anzahl N von ih Reihe geschalteten Signaleinheiten, wobei jede Signaleinheit besteht aus: einem Speicherkreis zum Speichern einer Folge von Signalen, der ein Fenster aufweist, das im wesentlichen die gesamte Signalspeicher-Kapazität umfaßt,
    einem Maximum-Detektor, der mit dem Fenster des Speicherkreises verbunden ist zwecks Erfassung des Spitzenwertes der in dem Fenster gespeicherten Signale, und einem Kombinierer zum Erzeugen eines Ausgangssignaler. durch Kombination des Spitzenwertes des Maximum-Detektors mit einem ausgewählten der Korrelations-Datensignale, und daß die Entscheidungsmittel weiterhin ein Schwellwert-Gatter aufweisen, an das die erste der in Reihe geschalteten Signaleinheiten, die eine Folge von ersten vorbestimmten Korreltions-Datensignalen speichert, eine Folge von Ausgangssignalen der Kombinierer in den ersten N-I Kombinierer, die ange-
    609884/0999
    - tee -
    legt und gespeichert sind in dem Speicherkreis der fegenden der Signaleinheiten, und an das eine Folge der Ausgangssignale der N-ten der Kombinierer angelegt ist, wobei das Schwellwert-Gatter ein Anzeige-Entscheidungs-Ausgangssignal immer dann erzeugt, wenn die Amplitude eines Ausgangssignals der N-ten der Kombinierer ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten dieses Entseheidungs· Ausgangssignals kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheidungsmitteln verbunden ist.
    21. System nach Anspruch !,dadurch geken nzeichnet, daß die Korrelationsmittel enthalten: erste Speichermittel zum Speichern der digitalisierten Sprach-Abtastwerte während eines ersten Betriebszustandes und zum aufeinanderfolgenden Auslesen von Folgen von digitalisierten Sprach-Abtastwerten während eines zweiten Betriebszustandes,
    zweite Speichermittel, zum Speichern ausgewählter digitalisierter Informationseinheiten, die jeweils Unterelementen von mindestens einem ausgewählten Schlüsselwort entsprechen und zum aufeinanderfolgenden Auslesen der gespeicherten Informationseinheiten während eines zweiten Betriebszustandes und Mittel zum aufeinanderfolgenden Korrelieren jedes der gespeicherten Informationseinheiten während des zweiten Betriebszustandes mit einer entprechenden Folge von digitali-
    609884/0999
    sierten Sprach-Abtastwerten zwecks Erzeugung eines korrespondierenden Korrelations-Datensignals für jede gespeicherte Informationseinheit, wobei die Amplitude jedes Korrelations-Datensignals kennzeichnend für das Maß der Übereinstimmung zwischen zugeordneter gespeicherter Einheit und der entsprechenden Folge von digitalisierten Sprach-Abtastwerten ist.
    22, System nach Anspruch 21,dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine Vielzahl von Speichermitteln zum Speichern entsprechender Polgen von ausgewählten, der Korrelations- Datensignale, wobei jedes dieser Speichermittel ein zugeordnetes Fenster besitzt, das eine ausgewählte Folge von vorher gespeicherten Korrelations- Datensignalen, die mit diesen Speichermitteln verbunden sind, umfaßt,
    eine Vielzahl von Maximum-Detektoren, die entsprechend mit dem Fenster der Vielzahl von Speichermitteln verbunden sind, um entsprechend innerhalb der Fenster die Spitzenwerte der Signale zu erzeugen,
    ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signale der Vielzahl der Maxlmum-De-tektoren zwecks Erzeugung einer Schluß-Entscheidungsfunktion und
    609884/0999
    ein Schwellwert-Gatter zum Erzeugen eines Anzeige-Entscheidungs-Ausgangssignals immer dann, wenn die Amplitude der Schluß-Entscheidungsfunktion ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten des Entscheidungs· Ausgangssignales kennzeichnend für das Erfassen eines Schlüsselwortes, das dem Entscheidungsmittel zugeordnet ist, ist,
    23· System nach Anspruch 21,dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine ausgewählte Anzahl N von in Reihe geschalteten signaleinheiten, wobei jede Signaleinheit besteht aus: einem Speicherkreis zum Speichern einer Folge von Signalen, der ein Fenster aufweist, das im wesentlichen die gesamte Signalspeicher-Kapazität umfaßt,
    einem Maximum-Detektor, der mit dem Fenster des Speicherkreises verbunden ist zwecks Erfassung des Spitzenwertes der in dem Fenster gespeicherten Signale, und einem Kombinierer zum Erzeugen eines Ausgangssignales durch Kombination des Spitzenwertes des Maximum-Detektors mit einem ausgewählten der Korrelations-Datensignale, und daß die Entscheidungsmittel weiterhin ein Schwellwert-Gatter aufweisen, an das die erste der in Reihe geschalteten Signaleinheiten, die eine Folge von ersten ausgewählten Korrelations-Datensignalen speichert, eine Folge von Aus-
    -/-609884/0999
    j rs
    gangssignalen der Kombinierer in den ersten N-I Kombinierer, die angelegt und gespeichert sind In dem Speicherkreis der folgenden der Signaleinheiten, und an das eine Folge der Ausgangssignale der N-ten der Kombinierer angelegt ist, wobei das Schwellwert-Gatter ein Anzeige-Entscheidungs-Ausgangssignal immer dann erzeugt, wenn die Amplitude eines Ausgangssignales der N-ten der Kombinierer ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten dieses Entscheidungs-Ausgangssignales kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheidungs m _ittcln verbunden ist.
    24. System nach Anspruch !,dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine Vielzahl von Speichermitteln, zum Speichern entsprechender Polgen von ausgewählten der Korrelations-Datensignale, wobei jedes dieser Speichermittel ein zugeordnetes Fenster besitzt, das eine ausgewählte Folge von vorher gespeicherten Korrelations-Datensignalen, die mit diesen Speichermitteln verbunden sind, umfaßt,
    eine Vielzahl von Maximum-Detektoren, die entsprechend mit dem Fenster der Vielzahl von Speichermitteln verbunden sind, um entsprechend innerhalb der Fenster die Spitzenwerte der Signale zu erzeugen,
    609884/0999
    ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signale der Vielzahl der Maximum-Detektoren zwecks Erzeugung dLnev Schluß-Entscheidungsfunktion und
    ein SchweUwert-Gatter zum Erzeugen eines AnzeigerEntscheidungs-Ausgangssignales immer dann, wenn die Amplitude der Schluß-Entscheidungsfunktion an Ent sehe i dungs-S chwe Uwe rtsignal überschreitet, wobei das Auftreten des Entscheidungs-Ausgangs signale fs kennzeichnend für das Erfassen eines Schlüsselwortes, das dem Entscheidungsmittel zugeordnet ist, ist.
    25. System nach Anspruch 1, dadurch gekennzeichnet, daß die Entschexdungsmittel enthalten: eine ausgewählte Anzahl N von in Reihe geschalteten Signaleinheiten, wobei jede Signaleinheit besteht aus: einem Speicherkreis zum Speichern einer Folge von Signalen, der ein Fenster aufweist, das im wesentliehen die gesamte Signalspeicher-Kapazität umfaßt,
    einem Maximum-Detektor, der mit dem Fenster des Speicherkreises verbunden ist zwecks Erfassung des Spitzenwertes der in dem Fenster gespeicherten Signale, und einem Kombinierer zum Erzeugen eines Ausgangssignales durch Kombination des Spitzenwertes des Maximum-Detektors mit einem ausgewählten der Korrelati-ons-Datensignale, und
    609884/0999
    daß die Entscheidungsmittel weiterhin ein Schwellwert-Gatter aufweisen, an das die erste der in Reihe geschalteten Signaleinheiten, die eine Folge von ersten ausgewählten Korrelatbns-Datensignalen speichert, eine Folge von Ausgangssignalen der Kombinierer in den ersten N-I Kombinierer, die angelegt und gespeichert sind in dem Speicherkreis der folgenden der Signaleinheiten, und an das eine Folge der Ausgangssignale der N-ten der Kombinierer angelegt .ist, wobei das Schwellwert-Gatter ein Anzeige-Entscheidungs-Ausgangssignal immer dann erzeugt, wenn die Amplitude eines Ausgangssignales der N-ten der Kombinierer ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten dieses Entscheidungs-Ausgangssignales kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheidungsmitteln verbunden ist.
    26. System zum Erfassen von einem oder mehreren Schlüsselworten in kontinuierlicher Sprache, dadurch gekennzeichnet, daß das System enthält:
    Eingangsmittel zum Zerlegen eines kontinuierlichen Eingangs-Sprachsignales in eine Vielzahl von Frequenz-Komponenten, Parameter-Mittel zum Erzeugen einer Vielzahl von analogen Sprechparametern in Antwort auf die Vielzahl der Frequenzkomponenten,
    609884/0999
    Generator-Mittel zum periodischen Erzeugen digitalisierter Sprach-Abtastwerte der Vielzahl der analogen Sprach-Parame.ter, erste Speichermittel zum Speichern von Polgen der periodisch erzeugten digitalisierten Sprach-Abtastwerte, zweite Speichermittel zum Speichern vorgewählter digitalisierter Informations-Einheiten, die repräsentativ sind für Unterelemente von mindestens einem ausgewählten Schlüsselwort >
    Mittel zum Korrelieren jeder der gespeicherten Informationseinheiten mit einer entsprechenden Folge von digitalisierten Sprach-Abtastwerten während eines Lese-Betriebszustandes zur Erzeugung eines entsprechenden Korrelat!ons-Datensignals für jede gespeicherte Informations-Einheit, und ein Entscheidungsmittel für jedes gewünschte Schlüsselwort, wobei jedes Entscheidungsmittel auf das zugeordnete der Korrelations-Datensignale anspricht zwecks Erzeugung eines Anzeige-Entscheidungsausgangssignales, immer dann, wenn das zugeordnete Schlüsselwort erfaßt worden ist.
    27. System nach Anspruch 26, dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine Vielzahl von Speichermitteln zum Speichern entsprechender Folgen von vorbestimmten der Korrelations-Datensignale, wobei jedes dieser Speichermittel ein zugeordnetes Fenster
    609884/0999
    besitzt, das eine ausgewählte Folge von vorher gespeicherten Korrelations-Datensignalen,die mit diesen Speichermitteln verbunden sind, umfaßt,
    eine Vielzahl von Maximum-Detektoren, die entsprechend mit dem Fenster der Vielzahl von Speichermittelnverbunden sind, um entsprechend innerhalb der Fenster die Spitzenwerte der Signale zu erzeugen,
    ein Kombinierer zum Kombinieren eines vorbestimmten Korrelations-Datensignals mit den Spitzenwerten der Signale der Vielzahl der Maximum-Detektoren zwecks Erzeugung einer Schluß-Entscheidungsfunktion, und
    ein Schwellwert-Gatter zum Erzeugen eines Anzeige-Entscheidungs-Ausgangssignales immer dann, wenn die Amplitude der Schluß-Entscheidungs funkt ion ein Ents chei dungs -Schwel lv/ertsignal überschreitet, wobei das Auftreten des Entscheidungs-Ausgangssignales kennzeichnend für das Erfassen eines Schlüsselwortes, das dem Entscheidungsmittel zugeordnet ist, ist.
    28. System nach Anspruch 26, dadurch gekennzeichnet, daß die Entscheidungsmittel enthalten: eine ausgewählte Anzahl N von in Reihe geschalteten Signaleinheiten, wobei jede Signaleinheit besteht aus: einem Speicherkreis zum Speichern einer Folge von Signalen, der ein Fenster aufweist, das im wesentlichen die gesamte
    —/ — 609884/0999
    Signalspeicher-Kapazität umfaßt,
    einem Maximum-Detektor, der mit dem Fenster des Speicherkreises verbunden ist zwecks Erfassung des Spitzenwertes der in dem Fenster gespeicherten Signale, und einem Kombinierer zum Erzeugen eines Ausgangssignales durch Kombination des Spitzenwertes des Maximum-Detektors mit einem ausgewählte der Korrelations-Datensignale,, und daß die Entscheidungsmittel weiterhin ein Schwel.lwert<-Gatter aufweisen, an das die erste der in Reihe geschalteten Sig-naleinheiten, die eine Folge von ersten ausgewählte Korrelations-Datensignalen speichert, eine Folge von Ausgangssignalen der Kombinierer in den ersten N-I Kombinieser, die angelegt und gespeichert sind in dem Speicherkreis der folgenden der Signaleinheiten, und an das eine Folge von Ausgangssignalen der N-ten der Kombinierer· angelegt ist, wobei das Schwellwert-Gatter ein Anzeige-Entscheidungs-Ausgangssignal immer dann erzeugt, wenn die Amplitude eines Ausgangssignales der N-ten der Kombinierer ein Entscheidungs-Schwellwertsignal überschreitet, wobei das Auftreten dieses Entscheidungs-Ausgangssignales kennzeichnend ist für das Erfassen eines Schlüsselwortes, das mit den Entscheidungsmitteln verbunden ist.
    609884/0999
    29» System zum Erfassen von einem oder mehreren Schlüsselworten in kontinuierlicher Sprache, dadurch gekennzeichnet, daß das System enthält:
    erste Mittel, die auf das kontinuierliche Sprachsignal ansprechen und periodisch von ihm eine Vielzahl von digitalisierten Sprachparametern erzeugen,
    Korrelations-Mittel, die auf vorbestimmte Polgen der digitalisierten Sprach-Abtastwerte ansprechen und eine Vielzahl von Korrelations-Datensignalen erzeugen, und ein Entscheidungs-Mittel für jedes gewünschte Schlüsselwort, wobei jedes Entscheidungsmittel auf entsprechende der Korrelations-Datensignale anspricht zwecks Erzeugung eines Anzeige-Entscheidungs-Ausgangssignales immer dann, wenn das zugeordnete Schlüsselwort erfaßt worden ist.
    609884/0999
DE19762613258 1975-04-02 1976-03-27 System zur automatischen spracherkennung Granted DE2613258A1 (de)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US56456475A 1975-04-02 1975-04-02

Publications (2)

Publication Number Publication Date
DE2613258A1 true DE2613258A1 (de) 1976-10-21
DE2613258C2 DE2613258C2 (de) 1987-04-30

Family

ID=24254975

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19762613258 Granted DE2613258A1 (de) 1975-04-02 1976-03-27 System zur automatischen spracherkennung

Country Status (7)

Country Link
US (1) US4081607A (de)
JP (1) JPS51117802A (de)
BR (1) BR7600292A (de)
CA (1) CA1056504A (de)
DE (1) DE2613258A1 (de)
FR (1) FR2306481A1 (de)
GB (1) GB1508741A (de)

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4227176A (en) * 1978-04-27 1980-10-07 Dialog Systems, Inc. Continuous speech recognition method
US4771401A (en) * 1983-02-18 1988-09-13 Houghton Mifflin Company Apparatus and method for linguistic expression processing
US4674066A (en) * 1983-02-18 1987-06-16 Houghton Mifflin Company Textual database system using skeletonization and phonetic replacement to retrieve words matching or similar to query words
JPS6057475A (ja) * 1983-09-07 1985-04-03 Toshiba Corp パタ−ン認識方式
JPS60249194A (ja) * 1984-05-25 1985-12-09 株式会社日立製作所 会話型音声入出力方式
US5218668A (en) * 1984-09-28 1993-06-08 Itt Corporation Keyword recognition system and method using template concantenation model
US4783758A (en) * 1985-02-05 1988-11-08 Houghton Mifflin Company Automated word substitution using numerical rankings of structural disparity between misspelled words & candidate substitution words
GB8613327D0 (en) * 1986-06-02 1986-07-09 British Telecomm Speech processor
US5765131A (en) * 1986-10-03 1998-06-09 British Telecommunications Public Limited Company Language translation system and method
US4896358A (en) * 1987-03-17 1990-01-23 Itt Corporation Method and apparatus of rejecting false hypotheses in automatic speech recognizer systems
GB2207783B (en) * 1987-08-07 1991-05-22 Casio Computer Co Ltd Recording/reproducing apparatus with voice recognition function
US4980917A (en) * 1987-11-18 1990-12-25 Emerson & Stern Associates, Inc. Method and apparatus for determining articulatory parameters from speech data
US5231671A (en) * 1991-06-21 1993-07-27 Ivl Technologies, Ltd. Method and apparatus for generating vocal harmonies
US5428708A (en) * 1991-06-21 1995-06-27 Ivl Technologies Ltd. Musical entertainment system
US5567901A (en) * 1995-01-18 1996-10-22 Ivl Technologies Ltd. Method and apparatus for changing the timbre and/or pitch of audio signals
US6046395A (en) * 1995-01-18 2000-04-04 Ivl Technologies Ltd. Method and apparatus for changing the timbre and/or pitch of audio signals
US6094476A (en) * 1997-03-24 2000-07-25 Octel Communications Corporation Speech-responsive voice messaging system and method
US6336092B1 (en) 1997-04-28 2002-01-01 Ivl Technologies Ltd Targeted vocal transformation
US6490561B1 (en) * 1997-06-25 2002-12-03 Dennis L. Wilson Continuous speech voice transcription
FI973093A (fi) * 1997-07-23 1999-01-24 Nokia Mobile Phones Ltd Menetelmä telepalvelun ohjaamiseksi ja päätelaite
US6871180B1 (en) * 1999-05-25 2005-03-22 Arbitron Inc. Decoding of information in audio signals
US6876991B1 (en) 1999-11-08 2005-04-05 Collaborative Decision Platforms, Llc. System, method and computer program product for a collaborative decision platform
US8095508B2 (en) * 2000-04-07 2012-01-10 Washington University Intelligent data storage and processing using FPGA devices
US6711558B1 (en) * 2000-04-07 2004-03-23 Washington University Associative database scanning and information retrieval
US7139743B2 (en) * 2000-04-07 2006-11-21 Washington University Associative database scanning and information retrieval using FPGA devices
US7716330B2 (en) 2001-10-19 2010-05-11 Global Velocity, Inc. System and method for controlling transmission of data packets over an information network
US20090161568A1 (en) * 2007-12-21 2009-06-25 Charles Kastner TCP data reassembly
US20090106251A1 (en) * 2001-10-24 2009-04-23 Harris Scott C Web based communication of information with reconfigurable format
US7711844B2 (en) * 2002-08-15 2010-05-04 Washington University Of St. Louis TCP-splitter: reliable packet monitoring methods and apparatus for high speed networks
US10572824B2 (en) 2003-05-23 2020-02-25 Ip Reservoir, Llc System and method for low latency multi-functional pipeline with correlation logic and selectively activated/deactivated pipelined data processing engines
EP1627331B1 (de) 2003-05-23 2017-09-20 IP Reservoir, LLC Intelligenter datenspeicher und entsprechende bearbeitung unter benutzung von fpga -geräten
US7602785B2 (en) 2004-02-09 2009-10-13 Washington University Method and system for performing longest prefix matching for network address lookup using bloom filters
US8670428B2 (en) * 2004-03-18 2014-03-11 Qualcomm Incorporated Signal acquisition in peer-to-peer communications
US7672845B2 (en) * 2004-06-22 2010-03-02 International Business Machines Corporation Method and system for keyword detection using voice-recognition
WO2006023948A2 (en) * 2004-08-24 2006-03-02 Washington University Methods and systems for content detection in a reconfigurable hardware
EP1859378A2 (de) * 2005-03-03 2007-11-28 Washington University Verfahren und vorrichtung zur durchführung einer biosequenz-ähnlichkeitssuche
US7702629B2 (en) * 2005-12-02 2010-04-20 Exegy Incorporated Method and device for high performance regular expression pattern matching
US7954114B2 (en) 2006-01-26 2011-05-31 Exegy Incorporated Firmware socket module for FPGA-based pipeline processing
US7636703B2 (en) * 2006-05-02 2009-12-22 Exegy Incorporated Method and apparatus for approximate pattern matching
US7840482B2 (en) * 2006-06-19 2010-11-23 Exegy Incorporated Method and system for high speed options pricing
US7921046B2 (en) * 2006-06-19 2011-04-05 Exegy Incorporated High speed processing of financial information using FPGA devices
JP5705395B2 (ja) * 2006-07-21 2015-04-22 テクトロニクス・インターナショナル・セールス・ゲーエムベーハー 信号分析装置
US20080086274A1 (en) * 2006-08-10 2008-04-10 Chamberlain Roger D Method and Apparatus for Protein Sequence Alignment Using FPGA Devices
US8326819B2 (en) 2006-11-13 2012-12-04 Exegy Incorporated Method and system for high performance data metatagging and data indexing using coprocessors
US7660793B2 (en) 2006-11-13 2010-02-09 Exegy Incorporated Method and system for high performance integration, processing and searching of structured and unstructured data using coprocessors
US8374986B2 (en) * 2008-05-15 2013-02-12 Exegy Incorporated Method and system for accelerated stream processing
US8036891B2 (en) * 2008-06-26 2011-10-11 California State University, Fresno Methods of identification using voice sound analysis
EP2370946A4 (de) 2008-12-15 2012-05-30 Exegy Inc Verfahren und vorrichtung zur hochgeschwindigkeitsverarbeitung von finanzmarkttiefendaten
US10037568B2 (en) 2010-12-09 2018-07-31 Ip Reservoir, Llc Method and apparatus for managing orders in financial markets
TWI406266B (zh) 2011-06-03 2013-08-21 Univ Nat Chiao Tung 語音辨識裝置及其辨識方法
US9990393B2 (en) 2012-03-27 2018-06-05 Ip Reservoir, Llc Intelligent feed switch
US11436672B2 (en) 2012-03-27 2022-09-06 Exegy Incorporated Intelligent switch for processing financial market data
US10650452B2 (en) 2012-03-27 2020-05-12 Ip Reservoir, Llc Offload processing of data packets
US10121196B2 (en) 2012-03-27 2018-11-06 Ip Reservoir, Llc Offload processing of data packets containing financial market data
US9336302B1 (en) 2012-07-20 2016-05-10 Zuci Realty Llc Insight and algorithmic clustering for automated synthesis
US10133802B2 (en) 2012-10-23 2018-11-20 Ip Reservoir, Llc Method and apparatus for accelerated record layout detection
EP2912579B1 (de) 2012-10-23 2020-08-19 IP Reservoir, LLC Verfahren und vorrichtung zur beschleunigten formatübersetzung von daten in einem begrenzten datenformat
US9633093B2 (en) 2012-10-23 2017-04-25 Ip Reservoir, Llc Method and apparatus for accelerated format translation of data in a delimited data format
GB2541577A (en) 2014-04-23 2017-02-22 Ip Reservoir Llc Method and apparatus for accelerated data translation
US10942943B2 (en) 2015-10-29 2021-03-09 Ip Reservoir, Llc Dynamic field data translation to support high performance stream data processing
US11205103B2 (en) 2016-12-09 2021-12-21 The Research Foundation for the State University Semisupervised autoencoder for sentiment analysis
EP3560135A4 (de) 2016-12-22 2020-08-05 IP Reservoir, LLC Rohrleitungen zum hardware-beschleunigten maschinellen lernen
US10311874B2 (en) 2017-09-01 2019-06-04 4Q Catalyst, LLC Methods and systems for voice-based programming of a voice-controlled device
CN109447886B (zh) * 2018-10-08 2023-04-11 陕西师范大学 结合emd-21嵌入的带恢复多载体密图分存方法
US10629226B1 (en) * 2018-10-29 2020-04-21 Bestechnic (Shanghai) Co., Ltd. Acoustic signal processing with voice activity detector having processor in an idle state
CN112735469A (zh) * 2020-10-28 2021-04-30 西安电子科技大学 低内存语音关键词检测方法、系统、介质、设备及终端
CN114817456B (zh) * 2022-03-10 2023-09-05 马上消费金融股份有限公司 关键词检测方法、装置、计算机设备及存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2326517A1 (de) * 1972-05-26 1973-12-06 Ibm Verfahren und schaltungsanordnung zum erkennen von gesprochenen woertern

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1172244A (en) * 1966-03-16 1969-11-26 Emi Ltd Improvements relating to Voice Operated Apparatus
FR2074813A1 (de) * 1970-01-30 1971-10-08 Lannionnais Electronique
US3816722A (en) * 1970-09-29 1974-06-11 Nippon Electric Co Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer
JPS5419722B2 (de) * 1971-09-23 1979-07-17
US3883850A (en) * 1972-06-19 1975-05-13 Threshold Tech Programmable word recognition apparatus
GB1435779A (en) * 1972-09-21 1976-05-12 Threshold Tech Word recognition

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2326517A1 (de) * 1972-05-26 1973-12-06 Ibm Verfahren und schaltungsanordnung zum erkennen von gesprochenen woertern

Also Published As

Publication number Publication date
BR7600292A (pt) 1976-10-05
US4081607A (en) 1978-03-28
CA1056504A (en) 1979-06-12
JPS5721720B2 (de) 1982-05-08
FR2306481A1 (fr) 1976-10-29
DE2613258C2 (de) 1987-04-30
FR2306481B1 (de) 1981-12-18
AU8730675A (en) 1977-06-09
GB1508741A (en) 1978-04-26
JPS51117802A (en) 1976-10-16

Similar Documents

Publication Publication Date Title
DE2613258A1 (de) System zur automatischen spracherkennung
DE2934489C2 (de)
DE3236832C2 (de) Verfahren und Gerät zur Sprachanalyse
DE3339288C2 (de)
DE3510660C2 (de)
DE3337353C2 (de) Sprachanalysator auf der Grundlage eines verborgenen Markov-Modells
DE2953262C2 (de)
DE60018886T2 (de) Adaptive Wavelet-Extraktion für die Spracherkennung
DE2820645A1 (de) Vorrichtung und verfahren zur spracherkennung
DE3242866C2 (de)
DE2918533A1 (de) Spracherkennungssystem
DE2659096C2 (de)
DE3236834A1 (de) Verfahren und geraet zur sprachanalyse
DE3236885A1 (de) Verfahren und geraet zur sprachanalyse
DE2659083C2 (de) Verfahren und Vorrichtung zur Sprechererkennung
DE2240557A1 (de) Spracherkennungsvorrichtung zum steuern von maschinen
DE2825186A1 (de) Verfahren zur verringerung der falschanzeige in spracherkennungsverfahren fuer kontinuierliche sprachsignale
DE2524804A1 (de) Verfahren und vorrichtung zur automatischen spracherkennung
DE2825110A1 (de) Verfahren zur erkennung kontinuierlicher sprachsignale
DE4031638C2 (de)
DE2752607A1 (de) Verfahren zur erkennung von sprache
DE19942178C1 (de) Verfahren zum Aufbereiten einer Datenbank für die automatische Sprachverarbeitung
DE112018007846T5 (de) Gesprochene-sprache-separationseinrichtung, gesprochene-sprache-separationsverfahren, gesprochene-sprache separationsprogramm und gesprochene-sprache-separationssystem
DE3043516C2 (de) Verfahren und Vorrichtung zur Spracherkennung
DE2020753A1 (de) Einrichtung zum Erkennen vorgegebener Sprachlaute

Legal Events

Date Code Title Description
OI Miscellaneous see part 1
8110 Request for examination paragraph 44
8125 Change of the main classification

Ipc: G10L 1/00

8128 New person/name/address of the agent

Representative=s name: GOERTZ, H., DIPL.-ING. FUCHS, J., DR.-ING. DIPL.-I

8125 Change of the main classification

Ipc: G10L 9/08

D2 Grant after examination
8364 No opposition during term of opposition