DE4029697A1 - Sprachgesteuertes fernbedienungssystem - Google Patents

Sprachgesteuertes fernbedienungssystem

Info

Publication number
DE4029697A1
DE4029697A1 DE4029697A DE4029697A DE4029697A1 DE 4029697 A1 DE4029697 A1 DE 4029697A1 DE 4029697 A DE4029697 A DE 4029697A DE 4029697 A DE4029697 A DE 4029697A DE 4029697 A1 DE4029697 A1 DE 4029697A1
Authority
DE
Germany
Prior art keywords
voice
signal
remote control
command
voice command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE4029697A
Other languages
English (en)
Other versions
DE4029697C2 (de
Inventor
Toshiyuki Kimura
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Pioneer Corp
Original Assignee
Pioneer Electronic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP1341625A external-priority patent/JPH03203796A/ja
Priority claimed from JP1341627A external-priority patent/JPH03203797A/ja
Priority claimed from JP1341626A external-priority patent/JPH03203795A/ja
Priority claimed from JP1341624A external-priority patent/JPH03202900A/ja
Application filed by Pioneer Electronic Corp filed Critical Pioneer Electronic Corp
Publication of DE4029697A1 publication Critical patent/DE4029697A1/de
Application granted granted Critical
Publication of DE4029697C2 publication Critical patent/DE4029697C2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B10/00Transmission systems employing electromagnetic waves other than radio-waves, e.g. infrared, visible or ultraviolet light, or employing corpuscular radiation, e.g. quantum communication
    • H04B10/11Arrangements specific to free-space transmission, i.e. transmission through air or vacuum
    • H04B10/114Indoor or close-range type systems
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C23/00Non-electrical signal transmission systems, e.g. optical systems
    • G08C23/04Non-electrical signal transmission systems, e.g. optical systems using light waves, e.g. infrared
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B1/00Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
    • H04B1/38Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
    • H04B1/40Circuits
    • H04B1/44Transmit/receive switching
    • H04B1/48Transmit/receive switching in circuits for connecting transmitter and receiver to a common transmission path, e.g. by energy of transmitter
    • GPHYSICS
    • G08SIGNALLING
    • G08CTRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
    • G08C2201/00Transmission systems of control signals via wireless link
    • G08C2201/30User interface
    • G08C2201/31Voice input
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02165Two microphones, one receiving mainly the noise signal and the other one mainly the speech signal

Description

Die vorliegende Erfindung betrifft ein Fernbedienungssy­ stem für die Fernbedienung verschiedener elektronischer Geräte und insbesondere ein Fernbedienungssystem für die Fernbedienung beispielsweise von audiovisuellen Geräten (AV-Geräten) durch Sprachbefehle gemäß dem Oberbegriff des Anspruches 1.
In den letzten Jahren sind verschiedene AV-Geräte wie etwa Stereoanlagen, Fernsehempfänger, Kassetten-Tape- Decks, Video-Tape-Decks, Compactdisc-Spieler, Laserbild­ plattenspieler oder ähnliches mit Fernbedienungssystemen ausgerüstet worden.
Ein Fernbedienungssystem besitzt einen Sender, der norma­ lerweise vom zu steuernden AV-Gerät entfernt angeordnet wird. Wenn der Sender betätigt wird, sendet er ein Fern­ bedienungssignal, etwa ein Infrarot-Fernbedienungssignal, aus, das von einem im zu steuernden AV-Gerät befindlichen Empfänger empfangen wird. Das empfangene Fernbedienungs­ signal wird dekodiert, um das AV-Gerät entsprechend dem Fernbedienungssignal zu steuern.
Kürzlich ist ein sprachgesteuertes Fernbedienungssystem entwickelt worden, das anstelle von über Tasten eingege­ benen Steuerbefehlen Sprachsteuerbefehle verwendet. Das sprachgesteuerte fernbedienungssystem besitzt ein an ei­ nem Sender angebrachtes Mikrophon, das einen Sprachbefehl in ein elektrisches Sprachsignal umwandelt, und eine Spracherkennungs-LSI-Schaltung (Großintegrationsschal­ tung), die ein einem durch das Sprachsignal dargestellten Sprachmuster entsprechendes Fernbedienungssignal erzeugt. Das auf diese Weise erzeugte Fernbedienungssignal wird an einen in einem zu steuernden AV-Gerät befindlichen Emp­ fänger gesendet.
Das erste Problem bei einem derartigen sprachgesteuerten Fernbedienungssystem besteht darin, daß das die Sprachbe­ fehle empfangende Mikrophon dazu neigt, neben den Sprach­ befehlen auch andere Geräusche aufzunehmen, so daß die Genauigkeit der Spracherkennung (Spracherkennungsrate) durch derartige Geräusche abgesenkt wird.
Gemäß einer bekannten Spracherkennungsverarbeitung wer­ den Sprachmuster der Sprachbefehle der Bedienungsperson als Standardmuster gespeichert, anschließend wird ein von der Bedienungsperson während des Gebrauchs des Fernbedie­ nungssystems eingegebener Sprachbefehl mit Standardmu­ stern verglichen, um zwischen diesen eine eventuelle Ähn­ lichkeit festzustellen. Dasjenige Standardmuster, das eine hohe Ähnlichkeit besitzt, wird dann als eingegebener Sprachbefehl betrachtet. Ein Nachteil einer solchen Spracherkennungsverarbeitung besteht darin, daß dann, wenn zum Zeitpunkt der Speicherung der Sprachbefehle der Bedienungsperson in der Nähe des Mikrophons des Fernbe­ dienungssystems Umgebungsgeräusche vorhanden sind, die Standardmuster als Kombinationen der Sprachbefehle und der Umgebungsgeräusche gespeichert werden, so daß ein später tatsächlich eingegebener Sprachbefehl falsch er­ kannt werden kann, falls dann kein Umgebungsgeräusch vor­ handen ist. Ein weiterer Nachteil besteht darin, daß selbst dann, wenn die Sprachbefehle der Bedienungsperson richtig gespeichert worden sind, ein tatsächlicher Sprachbefehl mit dem gespeicherten Standardmuster mögli­ cherweise nicht übereinstimmt, falls während des späteren Gebrauchs des Fernbedienungssystems Umgebungsgeräusche vorhanden sind und der Sprachbefehl falsch erkannt wird.
Das zweite Problem bei einem sprachgesteuerten Fernbedie­ nungssystem besteht darin, daß der von den Lautsprechern beispielsweise einer Stereoanlage wiedergegebene Schall als Umgebungsgeräusch wirken kann.
Genauer sendet der Sender eines herkömmlichen sprachge­ steuerten Fernbedienungssystems ungeachtet der Arbeits­ weise eines durch das Fernbedienungssystem ferngesteuer­ ten Informationswiedergabegerätes Fernbedienungssignale aus. Wenn das Informationswiedergabegerät ein Gerät ist, das aufgenommene Signale über Lautsprecher wiedergibt, also zum Beispiel eine Stereoanlage, so hat dies zum Er­ gebnis, daß außer den Sprachbefehlen der wiedergegebene Schall in der Umgebung des Sendermikrophons vorhanden ist.
Wenn die Intensität des vom Informationswiedergabegerät wiedergegebenen Schalls verhältnismäßig hoch ist, wird dieser wiedergegebene Schall ebenso wie die Sprachbefehle vom Mikrophon aufgenommen. Dies hat eine Absenkung der Spracherkennungsrate der Spracherkennungseinheit im sprachgesteuerten Fernbedienungssystem zur Folge.
Das dritte Problem eines sprachgesteuerten Fernbedie­ nungssystems betrifft die Anpassung der Spracherkennungs­ rate. Gemäß einem Spracherkennungsverfahren in einem her­ kömmlichen sprachgesteuerten Fernbedienungssystem wird ein über das Mikrophon eingegebener Sprachbefehl in Mu­ sterdaten umgewandelt, die anschließend mit einer Mehr­ zahl von bereits gespeicherten Standardmusterdaten ver­ glichen werden, so daß die Differenz zwischen den Sprach­ befehl-Musterdaten und den Standardmusterdaten bestimmt wird. Wenn eine der Standardmusterdateneinheiten eine ge­ ringere Differenz zu den Sprachbefehl-Musterdaten auf­ weist und vorgegebene Erkennungsbedingungen (wenn zum Beispiel die Differenz kleiner als eine vorgegebene Dif­ ferenz ist) erfüllt, werden Befehlsdaten, die diesem Standardmusterdatensatz entsprechen, ausgegeben. Wenn sämtliche Standardmusterdatensätze die vorgegebenen Er­ kennungsbedingungen nicht erfüllen, wird ein einen Erken­ nungsfehler darstellendes Zurückweisungssignal ausgege­ ben.
In Fällen, in denen keine saubere Spracherkennung erzielt wird und häufig Zurückweisungssignale erzeugt werden, kann die Bedienungsperson die vorgegebenen Erkennungsbe­ dingungen manuell abwandeln oder erneut Standardmusterda­ ten speichern, um dadurch die Spracherkennungsrate zu er­ höhen. Die manuelle Abwandlung der Erkennungsbedingungen ist jedoch für die Bedienungsperson unangenehm und lang­ wierig.
Das vierte Problem eines sprachgesteuerten Fernbedie­ nungssystems betrifft die Nichtübereinstimmung zwischen Sprachbefehlswörtern und gespeicherten Standardmustern. Die Standardmuster, die für die Spracherkennung notwendig sind, werden dadurch erzeugt, daß im voraus die Sprachbe­ fehle der Bedienungsperson als Musterdaten gespeichert werden. Wenn die Sprachbefehle gespeichert werden sollen. ist es üblich, die Sprachbefehle zu vereinfachen oder Schlüsselwörter für die Sprachbefehle zu verwenden. Bei­ spielsweise wird ein Steuerbefehl, der angibt, daß mit der Wiedergabe eines CD-Spielers begonnen werden soll, in einen Sprachbefehl umgewandelt, der in der Äußerung "PLAY" besteht. Da solche gespeicherten Standardmusterda­ ten nur bestimmte Merkmale der Sprachbefehle beinhalten, ist es nicht möglich, ursprüngliche Sprachbefehle aus den Standardmusterdaten zu rekonstruieren. Wenn daher die Be­ dienungsperson einen in Standardmusterdaten abgespeicher­ ten Sprachbefehl vergißt, kann sie das zu steuernde Gerät mittels Sprachbefehlen nicht mehr bedienen. Wenn dies ge­ schieht, muß die Bedienungsperson Sprachbefehle erneut speichern, was jedoch unangenehm und langwierig ist.
Es ist eine erste Aufgabe der vorliegenden Erfindung, ein sprachgesteuertes Fernbedienungssystem zu schaffen, das gegenüber Umgebungsgeräuschen weniger empfindlich ist, das eine erhöhte Spracherkennungsrate aufweist und bei dem die Auslösung eines fehlerhaften Betriebs verhindert wird.
Es ist eine zweite Aufgabe der vorliegenden Erfindung, ein sprachgesteuertes Fernbedienungssystem zu schaffen, das gegenüber einer verhältnismäßig hohen Intensität des von einem Informationswiedergabegerät wiedergegebenen Schalls weniger empfindlich ist und daher eine erhöhte Spracherkennungsrate besitzt.
Es ist eine dritte Aufgabe der vorliegenden Erfindung, ein sprachgesteuertes Fernbedienungssystem zu schaffen, das die Spracherkennungsbedingungen automatisch abwan­ delt, wenn aufgrund der Eingabe eines Sprachbefehls ein Zurückweisungssignal erzeugt wird, wodurch die Spracher­ kennungsrate erhöht wird.
Es ist eine vierte Aufgabe der vorliegenden Erfindung, ein sprachgesteuertes Fernbedienungssystem zu schaffen, das einen Sprachbefehl, der einem gespeicherten Standard­ musterdatensatz entspricht, wiedergeben kann, falls die Bedienungsperson den gespeicherten Sprachbefehl vergessen hat.
Die erste Aufgabe wird bei einem Fernbedienungssystem der gattungsgemäßen Art durch die Merkmale im kennzeichnenden Teil des Anspruches 1 gelöst.
Die weiteren Aufgaben werden bei einem Fernbedienungssy­ stem der gattungsgemäßen Art durch die Merkmale in den kennzeichnenden Teilen der Nebenansprüche 4, 7 und 8 ge­ löst.
Weitere Merkmale und Vorteile der Erfindung sind in den Unteransprüchen angegeben.
In einem erfindungsgemäßen sprachgesteuerten Fernbedie­ nungssystem wandelt ein erstes Mikrophon die Umgebungsge­ räusche und einen Sprachbefehl in ein erstes elektrisches Signal um, während ein zweites Mikrophon die Umgebungs­ geräusche in ein zweites elektrisches Signal umwandelt. Ein Umgebungsgeräusch-Beseitigungsmittel beseitigt auf der Grundlage des ersten und des zweiten elektrischen Si­ gnals aus dem ersten elektrischen Signal die Umgebungsge­ räuschkomponente und erzeugt ein Sprachbefehlssignal. Da­ her wird nur das Sprachbefehlssignal in eine Spracherken­ nungseinheit eingegeben, so daß das Sprachbefehlssignal durch das Umgebungsgeräusch nicht nachteilig beeinflußt wird. Folglich wird die Spracherkennungsrate erhöht, fer­ ner wird verhindert, daß der Sender einen fehlerhaften Betrieb auslöst.
Weiterhin erzeugt in einem erfindungsgemäßen sprachge­ steuerten Fernbedienungssystem ein Detektormittel ein De­ tektorsignal, das anzeigt, daß ein Sprachbefehl eingege­ ben werden soll. Aufgrund eines solchen Detektorsignals vom Detektormittel addiert ein Tondämpfungssteuermittel zu einem von einem Sender empfangenen Fernbedienungssi­ gnal ein Tondämpfungsbefehlssignal. Der Sender dekodiert das empfangene Fernbedienungssignal und gibt an das In­ formationswiedergabegerät ein dekodiertes Steuersignal. Aufgrund des dekodierten Signals senkt das Informations­ wiedergabegerät den Pegel eines Wiedergabeschallsignals ab. Da das Informationswiedergabegerät eine Tondämpfungs­ operation ausführt, bevor der Sprachbefehl tatsächlich gegeben wird, wird folglich vom Mikrophon des Senders nur der Sprachbefehl aufgenommen.
Wenn in einem erfindungsgemäßen sprachgesteuerten Fernbe­ dienungssystem ein Sprachbefehl von einem Spracherken­ nungsmittel zurückgewiesen wird, gibt ein Erkennungsbe­ dingung-Setzmittel einen Befehl zur automatischen Abwand­ lung der Erkennungsbedingung an das Spracherkennungsmit­ tel aus. Daher kann die Spracherkennungsrate erhöht wer­ den, ohne daß die Bedienungsperson die Erkennungsbedin­ gung anpassen muß.
In einem erfindungsgemäßen sprachgesteuerten Fernbedie­ nungssystem speichert eine Sprachspeichereinheit Daten eines Sprachbefehls. Aufgrund eines externen Wiedergabe­ befehlssignals liest eine Sprachwiedergabeeinheit die ge­ speicherten Sprachbefehlsdaten aus der Sprachspeicherein­ heit aus und wandelt die Sprachbefehlsdaten in eine Sprachausgabe um. Daher kann das dem Sprachbefehl ent­ sprechende Wort als Sprachausgabe wiedergegeben werden, falls dies notwendig ist.
Weiterhin arbeitet in einem erfindungsgemäßen sprachge­ steuerten Fernbedienungssystem eine Sprachspeichereinheit mit einer Registereinheit zusammen, um Sprachbefehlsdaten zu speichern, wenn von der Registereinheit Standardmu­ sterdaten erzeugt werden. Daher werden Sprachbefehlsdaten gleichzeitig mit der Speicherung von Standardmusterdaten gespeichert. Es ist nicht notwendig, Sprachbefehlsdaten für die Wiedergabe von Sprachbefehlswörtern einzeln zu speichern. Da die Sprachbefehle so, wie sie gespeichert worden sind, vollständig wiedergegeben werden können, kann das Fernbedienungssystem das zu steuernde Gerät mit den Sprachbefehlen richtig steuern.
Die Erfindung wird im folgenden anhand von bevorzugten Ausführungsformen mit Bezug auf die Zeichnungen näher er­ läutert; es zeigen:
Fig. 1 ein Blockschaltbild eines allgemeinen Fernbe­ dienungssystems;
Fig. 2 eine beispielhafte Darstellung eines Fernbe­ dienungssignals;
Fig. 3 ein Blockschaltbild des Senders eines allge­ meinen sprachgesteuerten Fernbedienungssy­ stems;
Fig. 4 eine perspektivische Ansicht des Senders ei­ nes sprachgesteuerten Fernbedienungssystems gemäß einer ersten Ausführungsform der vor­ liegenden Erfindung;
Fig. 5 ein Blockschaltbild des Senders des sprachge­ steuerten Fernbedienungssystems gemäß der er­ sten Ausführungsform;
Fig. 6 ein detailliertes Blockschaltbild des in Fig. 4 gezeigten Senders;
Fig. 7 ein Blockschaltbild einer Spracherkennungs­ schaltung gemäß der ersten Ausführungsform;
Fig. 8 ein detailliertes Blockschaltbild der Spracherkennungsschaltung gemäß der ersten Ausführungsform;
Fig. 9(a) eine Darstellung eines Analogprozessors;
Fig. 9(b) bis 9(h) Darstellungen von Signal-Wellenformen im in Fig. 9(a) gezeigten Analogprozessor;
Fig. 10 ein Flußdiagramm einer Operationsabfolge des Senders gemäß der ersten Ausführungsform;
Fig. 11 eine perspektivische Ansicht des Senders ei­ nes sprachgesteuerten Fernbedienungssystems gemäß einer zweiten Ausführungsform der vor­ liegenden Erfindung;
Fig. 12 ein Blockschaltbild des Senders des sprachge­ steuerten Fernbedienungssystems gemäß der zweiten Ausführungsform;
Fig. 13 ein detailliertes Blockschaltbild des in Fig. 11 gezeigten Senders;
Fig. 14 ein Blockschaltbild einer Spracherkennungs­ schaltung gemäß der zweiten Ausführungsform;
Fig. 15 ein Flußdiagramm einer Operationsabfolge des Senders gemäß der zweiten Ausführungsform;
Fig. 16 ein Blockschaltbild des Senders eines sprach­ gesteuerten Fernbedienungssystems gemäß einer dritten Ausführungsform;
Fig. 17 ein detailliertes Blockschaltbild des in Fig. 16 gezeigten Senders;
Fig. 18 ein Flußdiagramm einer Operationsabfolge des Senders gemäß der dritten Ausführungsform;
Fig. 19 eine perspektivische Ansicht des Senders ei­ nes sprachgesteuerten Fernbedienungssystems gemäß einer vierten Ausführungsform der vor­ liegenden Erfindung;
Fig. 20 ein Blockschaltbild des Senders des sprachge­ steuerten Fernbedienungssystems gemäß der vierten Ausführungsform;
Fig. 21 ein Blockschaltbild des Senders eines sprach­ gesteuerten Fernbedienungssystem gemäß einer fünften Ausführungsform der vorliegenden Er­ findung;
Fig. 22 ein detailliertes Blockschaltbild des Senders des sprachgesteuerten Fernbedienungssystems sowohl gemäß der vierten als auch gemäß der fünften Ausführungsform;
Fig. 23 ein Blockschaltbild einer Sprachbefehlauf­ nahme- und -wiedergabeschaltung sowohl gemäß der vierten als auch gemäß der fünften Aus­ führungsform; und
Fig. 24 ein Flußdiagramm einer Operationsabfolge der in Fig. 23 gezeigten Sprachbefehlaufnahme- und -wiedergabeschaltung.
Allgemeines Fernbedienungssystem
Zum besseren Verständnis der vorliegenden Erfindung wer­ den im folgenden zunächst ein allgemeines Fernbedienungs­ system und ein Sprach-Fernbedienungssignal beschrieben.
Wie in Fig. 1 gezeigt, umfaßt ein Fernbedienungssystem 100 einen Sender 101, der von einer von einem zu steuern­ den Gerät 103 wie etwa einem AV-Gerät entfernten Position ein Fernbedienungssignal aussendet, und einen Empfänger 102, der das ausgesendete Fernbedienungssignal empfängt, dieses dekodiert und die dekodierte Information an das zu steuernde Gerät 103 schickt.
In Fig. 2 ist ein allgemeines Fernbedienungssignal ge­ zeigt. Das Fernbedienungssignal besteht aus einem Leit­ kode, der die Datenübertragung einem Empfänger anzeigt, einem Abnehmerkode und einem invertierten Abnehmerkode, die ein zu steuerndes Gerät bezeichnen, und schließlich einem Datenkode und einem invertierten Datenkode, die einen Steuerbefehl für das zu steuernde Gerät bezeichnen. Der invertierte Abnehmerkode und der invertierte Daten­ kode werden zur Ermittlung eines Fehlers im Abnehmerkode bzw. im Datenkode verwendet.
In Fig. 3 ist schematisch der Sender 101 des sprachge­ steuerten Fernbedienungssystems 100 gezeigt. Der Sender 101 umfaßt ein Mikrophon M, das einen Sprachbefehl in ein elektrisches Signal umwandelt. Das umgewandelte elektri­ sche Signal wird in eine Spracherkennungsschaltung 15 eingegeben, wobei die Spracherkennungsschaltung 15 in Ge­ stalt einer Spracherkennungs-LSI-Schaltung oder ähnlichem vorliegt und einen Mikroprozessor enthält. Die Spracher­ kennungsschaltung 15 erkennt den Inhalt des eingegebenen elektrischen Signals und erzeugt diesem erkannten Inhalt entsprechende Steuerdaten. Der Sender 101 besitzt außer­ dem eine einen Mikroprozessor umfassende Steuerung 16. Auf der Grundlage der Steuerdaten von der Spracherken­ nungsschaltung 15 erzeugt die Steuerung 16 ein Fernbedie­ nungs-Befehlssignal SR und gibt dieses in eine Sende­ schaltung 17 ein, die anschließend eine Infrarotlicht- Emitterdiode D₁ aktiviert, so daß diese ein Fernbedie­ nungssignal Rc ausgibt. Die erwähnten Bestandteile des Senders 101 werden von einer Leistungsversorgungsschal­ tung 18 mit elektrischer Energie versorgt.
Wenn über das Mikrophon M ein Sprachbefehl empfangen wird, wandelt die Spracherkennungsschaltung 15 den Sprachbefehl in Musterdaten um. Die Spracherkennungs­ schaltung 1 vergleicht die Sprachbefehl-Musterdaten mit einer Mehrzahl von in ihr gespeicherten Standardmusterda­ ten und bestimmt den Abstand zwischen den Sprachbefehl- Musterdaten und den Standardmusterdaten; anschließend gibt die Spracherkennungsschaltung 15 Befehlsdaten aus, die denjenigen Standardmusterdaten entsprechen, deren Ab­ stand zu den Sprachbefehl-Musterdaten am kleinsten ist. Es kann auch eine andere Spracherkennungsverarbeitung zur Anwendung kommen, in der die Ähnlichkeit der verglichenen Musterdaten entsprechend einem einfachen Ähnlichkeitsver­ fahren bestimmt wird und Befehlsdaten, die den Standard­ musterdaten mit der höchsten Ähnlichkeit entsprechen, ausgegeben werden. Die so erzeugten Befehlsdaten werden in die Steuerschaltung 16 eingegeben.
Die Steuerschaltung 16 schickt ein den eingegebenen Be­ fehlsdaten entsprechendes Fernbedienungs-Befehlssignal SR an die Sendeschaltung 17. Aufgrund des gelieferten Fern­ bedienungs-Befehlssignal SR treibt die Sendeschaltung 17 die Infrarotlicht-Emitterdiode D1, so daß diese ein Fern­ bedienungssignal Rc aussendet. Das zu steuernde Gerät 103 wird auf diese Weise durch das Fernbedienungssignal Rc fernbedient.
Erste Ausführungsform
Nun wird mit Bezug auf die Fig. 4 bis 10 ein sprachge­ steuertes Fernbedienungssystem gemäß einer ersten Ausfüh­ rungsform der vorliegenden Erfindung beschrieben.
(Äußerer Aufbau)
Wie in Fig. 4 gezeigt, weist ein Sender 10A des sprachge­ steuerten Fernbedienungssystems ein einteiliges Gehäuse 11 auf, das der Bedienungsperson das freie Umhertragen des Senders erlaubt. Das Gehäuse 11 besitzt in seiner oberen Blende (vorderseitige Blende) ein Mikrophon M1 und an seiner unteren Blende (rückseitige Blende) ein wei­ teres Mikrophon M2. Das Mikrophon M1 wandelt den von der Bedienungsperson gegebenen Sprachbefehl in ein elektri­ sches Signal um. Das Mikrophon M2 dient zur Aufnahme des den Sender 10A umgebenden Geräusches. Ein Sendemittel (etwa eine Infrarotlicht-Emitterdiode D1) ist an einem Ende des Gehäuses 11 angebracht. Die Infrarotlicht-Emit­ terdiode D1 wird dazu verwendet, ein Fernbedienungssignal an den Empfänger eines (nicht gezeigten) entfernt ange­ ordneten, zu steuernden Gerätes zu senden. Auf einer Seite des Gehäuses 11 ist ein Spracheingabeschalter 12 (der im folgenden mit "Sprechschalter" bezeichnet wird) angeordnet, der im gedrückten Zustand geschlossen ist und automatisch geöffnet wird, wenn er losgelassen wird. Der Sprechschalter 12 kann ein automatisch zurückstellender Druckknopf oder ein (automatisch zurückstellender) Schie­ beschalter sein. Wenn ein Sprachbefehl eingegeben wird, wird der Sprechschalter 12 geschlossen, um den Sender 10A zu betätigen. Sonst ist der Sprechschalter 12 geöffnet, so daß der Sender 10A außer Betrieb gehalten wird. Das Gehäuse 11 besitzt an seiner Seite außerdem einen Be­ triebswahlschalter 13, der beispielsweise die Form eines Schiebeschalters besitzt. Der Betriebswahlschalter 13 dient der Auswahl einer der Betriebsarten zu einem be­ stimmten Zeitpunkt. Die Betriebsarten umfassen eine Sprachspeicherbetriebsart, in der der Sprachbefehl im Sender 10A gespeichert wird, und eine Spracherkennungsbe­ triebsart, in der ein Sprachbefehl erkannt wird, wie spä­ ter beschrieben werden wird. Das Gehäuse 11 beinhaltet die elektronische Schaltung des erfindungsgemäßen sprach­ gesteuerten Fernbedienungssystems.
(Aufbau der elektronischen Schaltungen)
In Fig. 5 ist ein Blockschaltbild der elektronischen Schaltung des Senders 10A des erfindungsgemäßen sprachge­ steuerten Fernbedienungssystems gezeigt. Der Sender 10A umfaßt zwei Mikrophone M1 und M2, wie oben beschrieben worden ist. Das erste Mikrophon M1 dient der Eingabe ei­ nes Sprachbefehls, während das zweite Mikrophon M2 der Aufnahme des den Sender 10A umgebenden Umgebungsschalls oder des Umgebungsgeräusches, das von den Sprachbefehlen verschieden ist, dient. Jedes der Mikrophone M1 und M2 wandelt ein einwirkendes Schallsignal in ein elektrisches Signal um, das an ein Geräuschbeseitigungsmittel 104 ge­ liefert wird. Das Geräuschbeseitigungsmittel 104 besei­ tigt die Umgebungsgeräuschkomponente auf der Grundlage der von den Mikrophonen M1 und M2 übertragenen elektri­ schen Signale und gibt lediglich ein dem eingegebenen Sprachbefehl entsprechendes elektrisches Signal an eine Spracherkennungsschaltung 2. Die Spracherkennungsschal­ tung 2 erkennt auf der Grundlage des vom Geräuschbeseiti­ gungsmittel 104 ausgegebenen elektrischen Signals den Sprachbefehl, erzeugt auf der Grundlage des Erkennungser­ gebnisses dem Sprachbefehl entsprechende Befehlsdaten und schickt diese Befehlsdaten an eine Sendeeinheit 4. Die Sendeeinheit 4 erzeugt ein Fernbedienungssignal Rc, das die Befehlsdaten der Spracherkennungsschaltung 2 dar­ stellt, und sendet dieses Fernbedienungssignal Rc an den Empfänger eines entfernt angeordneten zu steuernden Gerä­ tes.
In Fig. 6 ist die elektronische Schaltung des Senders 10A genauer gezeigt. Die Spracherkennungseinheit 2 (Fig. 5) umfaßt eine Spracherkennungsschaltung 15 und eine Steuer­ schaltung 16. Die Sendeeinheit 4 (Fig. 5) umfaßt eine Sendeschaltung 17 und eine mit dieser verbundene Infra­ rotlicht-Emitterdiode D1. Die Steuerschaltung 16 ist zwi­ schen die Spracherkennungsschaltung 15 und die Sende­ schaltung 17 geschaltet. Der Sprechschalter 12, der mit der Steuerschaltung 16 verbunden ist, versorgt die Steu­ erschaltung 16 mit einem Betriebssteuersignal Sc, das den Sender 10A nur dann betätigt, wenn ein Sprachbefehl ein­ gegeben wird. Der Sprechschalter 12 kann einen automa­ tisch zurückstellenden Schalter mit einem Druckknopf, ei­ nem Schiebeschalter oder ähnlichem aufweisen. Eine Lei­ stungsversorgungsschaltung 18 liefert über eine Lei­ stungsversorgungs-Steuerschaltung 14 und über Leistungs­ versorgungsleitungen an die Spracherkennungsschaltung 15, die Steuerschaltung 16 und die Sendeschaltung 17 elektri­ sche Energie.
Wie in Fig. 7 gezeigt, umfaßt die Spracherkennungsschal­ tung 15 einen Analogprozessor 21, der ein über die Mikro­ phone M1 und M2 empfangenes analoges Sprachbefehlssignal verarbeitet und das verarbeitete analoge Sprachbefehlssi­ gnal in Form von Zeitaufteilungs-Digitaldaten 20 ausgibt, einen Spracherkennungsprozessor 22, der den Sprachbefehl aufgrund der vom Analogprozessor 21 gelieferten Zeitauf­ teilungs-Digitaldaten 20 erkennt, einen Speicher 23, in dem Standardmusterdaten für die Spracherkennung gespei­ chert sind, und eine Schnittstelle 24, über die Signale an die Steuerschaltung 16 geliefert und von der Steuer­ schaltung 16 empfangen werden.
Wie in Fig. 8 gezeigt, umfaßt der Analogprozessor 21 im allgemeinen einen Verstärker 30a, der ein vom Mikrophon M1 übertragenes Sprachbefehlssignal auf einen geeigneten Pegel verstärkt, einen Verstärker 30b, der ein vom Mikro­ phon M2 übertragenes Sprachbefehlssignal auf einen ge­ eigneten Pegel verstärkt, einen Differenzverstärker 34, der als Geräuschbeseitigungsschaltung dient und ein Dif­ ferenzsignal erzeugt, das den Unterschied zwischen den Ausgangssignalen der Verstärker 30a und 30b angibt, eine Filterreihe 31, die ein Ausgangssignal vom Differenzver­ stärker 34 in Signale in verschiedenen Frequenzbändern unterteilt, gleichrichtet und die Signale in diesen ver­ schiedenen Frequenzbändern ausgibt, eine Ana­ log/Digitalwandler-Anordnung 32 (die im folgenden mit "A/D-Wandler-Anordnung" bezeichnet wird), die die Aus­ gangssignale der Filterreihe 31 in den verschiedenen Fre­ quenzbändern in Digitalsignale umwandelt, und eine Schnittstelle 33, die Signale an den Spracherkennungspro­ zessor 22 überträgt und von diesem Signale empfängt.
In Fig. 9(a) wird gezeigt, daß die Filterreihe 31 eine Bandpaßfilter-Anordnung 35, die das eingegebene Sprachsi­ gnal in Signale in einer Mehrzahl von Frequenzbändern (4 Frequenzbänder in Fig. 9(a)) unterteilt, eine Gleichrich­ teranordnung 36, die die Ausgangssignale der Bandpaßfil­ teranordnung 35 gleichrichtet und eine Tiefpaßfilteran­ ordnung 37, die aus den Ausgangssignalen von der Gleich­ richteranordnung 36 den Brumm entfernt.
Die Bandpaßfilteranordnung 35 umfaßt eine Mehrzahl (vier in Fig. 9(a)) von Bandpaßfiltern BPF0 bis BPF3, die ent­ sprechend ihren jeweiligen Frequenzbändern die Mittenfre­ quenzen f0, f1, f2 und f3 (f0 < f1 < f2 < f3) besitzen.
Die Gleichrichteranordnung 36 umfaßt vier Gleichrichter RCT0 bis RCT3, die mit den entsprechenden Bandpaßfiltern BPF0 bis BPF3 der Bandpaßfilteranordnung 35 in Reihe ge­ schaltet sind. Mit den Gleichrichtern RCT0 bis RCT3 wer­ den die Ausgangssignale in den jeweiligen Frequenzbändern der Bandpaßfilter BPF0 bis BPF3 gleichgerichtet.
Die Tiefpaßfilteranordnung 37 umfaßt vier Tiefpaßfilter LPF0 bis LPF3, die mit den jeweiligen Gleichrichtern RCT0 bis RCT3 der Gleichrichteranordnung 36 in Reihe geschal­ tet sind. Die Tiefpaßfilter LPF0 bis LPF3 beseitigen aus den gleichgerichteten Signalen in den entsprechenden Fre­ quenzbändern den Brumm.
Die A/D-Wandleranordnung 32 umfaßt vier A/D-Wandler ADC0 bis ADC3, die mit den jeweiligen Tiefpaßfiltern LPF0 bis LPF3 der Tiefpaßfilteranordnung 37 in Reihe geschaltet sind. Die A/D-Wandler ADC0 bis ADC3 wandeln die analogen Ausgangssignale der Tiefpaßfilter LPF0 bis LPF3 in Digi­ talsignale um.
Nun wird der Betrieb des Analogprozessors 21 beschrieben. Um der Kürze willen wird nur die Signalverarbeitung in einem Frequenzband (zum Beispiel im demjenigen des Band­ paßfilters BPF3) beschrieben. In den anderen Frequenzbän­ dern wird jedoch eine ähnliche Signalverarbeitung ausge­ führt.
Wenn auf das Mikrophon M1 ein Umgebungsgeräusch und ein Sprachbefehl einwirken, wird das elektrische Ausgangssi­ gnal des Mikrophons M1 durch den Verstärker 30a auf einen geeigneten Signalpegel verstärkt, wobei der Verstärker 30a ein verstärktes Signal Z1 (s. Fig. 9(c)) ausgibt. Wenn auf das Mikrophon M2 das Umgebungsgeräusch einwirkt, wird das elektrische Ausgangssignal des Mikrophons durch den Verstärker 30b auf einen geeigneten Signalpegel verstärkt, wobei der Verstärker 30b ein verstärktes Si­ gnal Z2 (s. Fig. 9(b)) ausgibt. Die Ausgangssignale der Verstärker 30a und 30b werden in den Differenzverstärker 34 eingegeben, der anschließend ein Differenzsignal A an das Bandpaßfilter BPF3 (s. Fig. 9(d)) ausgibt; das Band­ paßfilter BPF3 läßt nur ein seinem Frequenzband entspre­ chendes Signal B hindurch. Anschließend wird das Signal B an den Gleichrichter RCT3 gegeben (s. Fig. 9(e) ). Das Si­ gnal B wird durch den Gleichrichter RCT3 gleichgerichtet, woraufhin vom Gleichrichter RCT3 ein gleichgerichtetes Ausgangssignal C (s. Fig. 9(f)) an das Tiefpaßfilter LPF3 gesendet wird. Das Tiefpaßfilter LPF3 beseitigt Brummstö­ rungen, die im Signal C enthalten sein können, und er­ zeugt ein brummfreies Ausgangssignal D (s. Fig. 9(g)), das anschließend in den A/D-Wandler ADC3 eingegeben wird.
Schließlich wandelt der A/D-Wandler ADC3 das gelieferte Eingangssignal D in ein Signal E um, das aus 4-Bit-Zeit­ aufteilungs-Digitaldaten (1010), (0111), (0101), (0111), (1101), . . . zusammengesetzt ist, wie in Fig. 9(h) gezeigt ist.
Wie in Fig. 8 gezeigt, umfaßt der Spracherkennungsprozes­ sor 22 eine Systemsteuerschaltung 40, die Steuerbefehle von der Steuerschaltung 16 analysiert und verarbeitet und ferner die gesamte Operation des Spracherkennungsprozes­ sors 22 steuert, und einen Digitalprozessor 41, der die Abstandsberechnungen ausführt und den Speicher 23 steu­ ert.
Die Systemsteuerschaltung 40 umfaßt eine CPU 42 (Zentraleinheit), die den Gesamtbetrieb des Senders 10A steuert, ein ROM 43 (Nur-Lese-Speicher), in dem ein von der CPU 42 für die Gesamtoperation des Senders 10A abzu­ arbeitendes Steuerprogramm gespeichert ist, ein RAM 44 (Schreib-Lese-Speicher) , der vorübergehend Daten spei­ chert, und eine Schnittstelle 45, die sowohl an den Ana­ logprozessor 21 als auch an den Digitalprozessor 41 Daten überträgt und von diesen Prozessoren Daten empfängt.
Der Digitalprozessor 41 umfaßt eine Recheneinheit 46, die Abstandsberechnungen ausführt und auf der Grundlage der Ergebnisse der Abstandsberechnungen eingegebene Sprachbe­ fehle identifiziert, ein Daten-RAM 47, das die für die Abstandsberechnungen erforderlichen Daten speichert, ein ROM 48, in dem ein Programm für die Abstandsberechnungen gespeichert ist, ein Arbeits-RAM 49, das vorübergehend die verarbeiteten Daten speichert, eine Schnittstelle 50, die Daten sowohl an den Analogprozessor 21 als auch an die Systemsteuerschaltung 40 sendet und von diesen Daten empfängt, und eine Schnittstelle 51, die Daten an den Speicher 23 überträgt und von diesem empfängt.
Der Spracherkennungsprozessor 22 arbeitet wie folgt: Wenn von der Steuerschaltung 16 über die Schnittstelle 24 ein Steuerbefehl an den Spracherkennungsprozessor 22 gegeben wird, empfängt die Systemsteuerschaltung 40 den Steuerbe­ fehl über die Schnittstellen 50 und 45 und analysiert den empfangenen Steuerbefehl. Wenn das Analyseergebnis eine Spracherkennungsverarbeitung anzeigt, schickt die Sy­ stemsteuerschaltung 40 über die Schnittstellen 45 und 50 einen Befehl zur Spracherkennung an den Digitalprozessor 41.
Aufgrund eines Befehls von der Systemsteuerschaltung 40 leitet der Digitalprozessor 41 die Zeitaufteilungs-Di­ gitaldaten 20 (eingegebenes Sprachbefehlssignal) vom Ana­ logprozessor 21 über die Schnittstelle 50 in das Daten- RAM 47. Die Recheneinheit 46 liest aus dem Speicher 23, in dem eine Mehrzahl von Standardmusterdaten gespeichert ist, über die Schnittstelle 51 erste Standardmusterdaten aus. Dann bestimmt die Recheneinheit 46 aus einer Mehr­ zahl von Zeitaufteilungs-Digitaldaten, die die Lese-Stan­ dardmusterdaten bilden, den Logarithmus der ersten Zeit­ aufteilungs-Digitaldaten und außerdem den Logarithmus der ersten Zeitaufteilungs-Digitaldaten des eingegebenen Sprachbefehlssignals, anschließend bestimmt er die Diffe­ renzen zwischen diesen Logarithmen. Weiterhin quadriert die Recheneinheit 46 diese Differenzen und addiert die Quadrate, um einen Abstand D zu bestimmen. Daher ist der Abstand D durch
gegeben, wobei gilt:
x: Anzahl der Zeitaufteilungen,
f(t): eingegebene Sprachbefehlsdaten (Zeitaufteilungs-Di­ gitaldaten),
fs(t): Standardmusterdaten (Zeitaufteilungs-Digitalda­ ten).
Auf die gleiche Weise werden die Abstände D für sämtliche Standardmusterdaten berechnet. Je kleiner die berechneten Abstände, um so höher ist die Wahrscheinlichkeit, daß die Standardmusterdaten dem Sprachbefehl entsprechen. Das auf diese Weise erhaltene Erkennungsergebnis wird anschlie­ ßend in Form von Befehlsdaten über die Schnittstelle 24 an die Steuerschaltung 16 ausgegeben.
Nun wird wieder auf Fig. 6 Bezug genommen. Die Steuer­ schaltung 16 ist beispielsweise in einem Mikroprozessor ausgebildet. Der Mikroprozessor der Steuerschaltung 16 umfaßt eine CPU, ein ROM, ein RAM und eine Schnittstelle. Die CPU führt Rechenoperationen aus, wobei sie auf die im als Arbeitsspeicher dienenden RAM gespeicherten Daten Be­ zug nimmt und die Rechenoperationen gemäß des Algorithmus (s. Fig. 10) eines im ROM gespeicherten Steuerprogramms ausführt und dadurch die Gesamtoperation des Senders 10A bewirkt. Die Steuerschaltung 16 empfängt außerdem Unter­ brechungssignale vom Sprechschalter 12 und vom Betriebs­ wahlschalter 13 und führt Steuerfunktionen entsprechend den durch diese Unterbrechungssignale angezeigten Befeh­ len aus. Die Operation des Senders 10A unter Steuerung der Steuerschaltung 16 wird im folgenden beschrieben.
(Gesamtbetrieb)
Der Sender 10A arbeitet in Abhängigkeit davon, ob der Sprechschalter 12 gedrückt oder losgelassen ist (d. h. ein- oder ausgeschaltet ist). Wenn der Sprechschalter 12 gedrückt ist, kann der Sender 10A die Fernbedienungssi­ gnale senden, während der Sender dann, wenn der Sprech­ schalter 12 losgelassen ist, in einer Betriebsart mit niedrigem Leistungsverbrauch gehalten wird und auf ein­ zugebende Sprachbefehle wartet. Es gibt zwei Eingabebe­ triebsarten für die Eingabe von Sprachbefehlen. In einer Eingabebetriebsart werden Sprachbefehle der Bedienungs­ person gespeichert, in der anderen Eingabebetriebsart werden Sprachbefehle der Bedienungsperson wiedererkannt. In der Sprachspeicherbetriebsart wird ein Wort wie etwa "Wiedergabe" in den Sender 10A aufgenommen.
Nun wird der Betrieb des Senders 10A mit Bezug auf das Flußdiagramm von Fig. 10 beschrieben. Es wird angenommen, daß der Sprechschalter 12 nicht gedrückt ist und der Sen­ der sich in einem Bereitschaftszustand in der Betriebsart mit niedrigem Leistungsverbrauch befindet.
Zunächst setzt die Steuerschaltung 16 in einem Schritt S1 eine Eintragungspuffernummer auf den Wert 1.
Dann ermittelt die Steuerschaltung 16 in einem Schritt S2, ob der Sprechschalter 12 gedrückt ist oder nicht, in­ dem sie ermittelt, ob vom Sprechschalter 12 ein Betriebs­ steuersignal Sc erzeugt wird oder nicht. Wenn in diesem Moment ein Betriebssteuersignal Sc vorliegt, bedeutet dies, daß der Sprechschalter 12 gedrückt ist, so daß die Steuerschaltung 16 ein Steuersignal Sv an die Leistungs­ versorgungs-Steuerschaltung 14 sendet. Die Leistungsver­ sorgungs-Steuerschaltung 14 liefert in einer normalen Be­ triebsart elektrische Energie und schaltet den Sender 10A in einem Schritt 54 in die normale Betriebsart.
Wenn der Sprechschalter 12 nicht gedrückt ist, wird der Sender 10A in der Betriebsart mit niedrigem Leistungsver­ brauch gelassen, anschließend werden die Schritte S2 und S3 wiederholt, wobei sich der Sender 10A in einem Warte­ zustand für einen Sprachbefehl befindet.
Danach liest die Steuerschaltung 16 in einem Schritt S5 den Zustand des Betriebswahlschalters 13, um festzustell­ len, ob die Sprachspeicherbetriebsart für Sprachbefehle eingestellt ist oder nicht.
Wenn die Sprachspeicherbetriebsart angezeigt wird, geht die Steuerung weiter zu einem Schritt S6, in dem die Steuerschaltung 16 einen Befehl ausgibt, mit dem die Spracherkennungsschaltung 15 zur Ausführung einer Spracherkennungsverarbeitung veranlaßt wird. Gleichzeitig schickt die Steuerschaltung 16 im Schritt S6 an die Spracherkennungsschaltung 15 eine Eintragungspuffernum­ mer.
In einem Schritt S7 speichert die Spracherkennungsschal­ tung 15 Spracherkennungs-Standardmusterdaten in einem entsprechenden Eintragungspuffer des Speichers 23, d. h. in einem Eintragungspuffer mit der Eintragungspuffernum­ mer 1.
In einem Schritt S6 liest die Steuerschaltung 16 ein (nicht gezeigtes) Statusregister in der Spracherken­ nungsschaltung 15, um festzustellen, ob die Eintragung eines Sprachbefehls beendet ist oder nicht. Wenn sie noch nicht beendet ist, werden die Schritte S7 und S8 so lange wiederholt, bis sie beendet ist. Wenn die Eintragung beendet ist, wird die Eintragungspuffernummer in einem Schritt S9 um 1 erhöht. Die Erhöhung aktualisiert die Eintragungspuffernummer und bereitet den Eintragungspuf­ fer auf die Speicherung von Standardmusterdaten vor.
Dann bestimmt die Steuerschaltung 16 in einem Schritt S10, ob die momentane Eintragungspuffernummer einen höchstens speicherbaren Wert Nmax übersteigt oder nicht. Wenn dies nicht der Fall ist, kehrt die Steuerung zum Schritt S2 zurück. Wenn der maximale Wert überschritten wird, schickt die Steuerschaltung 16 einen Befehl zur Beendigung der Sprachspeicherbetriebsart an die Spracher­ kennungssschaltung 15 und beendet dadurch in einem Schritt S11 die Sprachspeicherbetriebsart. Dann geht die Steuerung zurück zum Schritt S2.
Wenn im Schritt S5 vom Betriebswahlschalter 13 nicht die Sprachspeicherbetriebsart angezeigt wird, d. h. wenn im Schritt S5 vom Betriebswahlschalter 13 die Spracherken­ nungsbetriebsart angezeigt wird, gibt die Steuerschaltung 16 in einem Schritt S12 an die Spracherkennungsschaltung 15 einen Spracherkennungsbefehl aus. Nun führt die Spracherkennungsschaltung 15 in einem Schritt S13 eine Spracherkennungsverarbeitung aus, wie sie mit Bezug auf Fig. 8 oben beschrieben worden ist; das bedeutet, daß zwischen den eingegebenen Sprachbefehlsdaten und den Standardmusterdaten ein Abstand D bestimmt wird, um zwi­ schen den genannten Daten eine Ähnlichkeit festzustellen.
Die Steuerschaltung 16 liest in einem Schritt S14 ein (nicht gezeigtes) Statusregister in der Spracherkennungs­ schaltung 15, um festzustellen, ob die Spracherkennung des eingegebenen Sprachbefehls beendet ist oder nicht. Wenn die Spracherkennung noch nicht beendet ist, werden die Schritte S13 und S14 so lange wiederholt, bis die sie beendet ist. Wenn die Spracherkennung beendet ist, be­ stimmt die Steuerschaltung 16 in einem Schritt S15, ob die eingegebenen Sprachbefehlsdaten und die Standardmu­ sterdaten miteinander übereinstimmen, d. h. ob der Abstand D innerhalb eines vorgegebenen Abstandsbereichs liegt oder nicht. Wenn die Daten des eingegebenen Sprachbefehls und die Standardmusterdaten im Schritt S15 übereinstim­ men, erzeugt die Steuerschaltung 16 in einem Schritt S16 auf der Grundlage der erkannten Sprachbefehlsdaten ein Fernbedienungs-Befehlssignal SR und schickt dieses an eine Sendeschaltung 17. Aufgrund des Fernbedienungs-Be­ fehlssignals SR sendet die Sendeschaltung 17 in einem Schritt S17 ein entsprechendes Fernbedienungssignal Sc. Wenn die Daten des eingegebenen Sprachbefehls im Schritt S15 mit den Standardmusterdaten nicht übereinstimmen, führt die Steuerschaltung 16 in einem Schritt S18 eine Fehlerverarbeitung wie etwa die Erzeugung eines Summtons aus, anschließend geht die Steuerung zurück zum Schritt S2.
Da vom Geräuschbeseitigungsmittel 104 auf der Grundlage des Ausgabesignals der Mikrophone M1 und M2 nur der Sprachbefehl erzeugt und an die Spracherkennungseinheit 2 gesendet wird, kann der empfangene Sprachbefehl unabhän­ gig vom den Sender 10A möglicherweise umgebenden Umge­ bungsgeräusch richtig erkannt werden, so daß verhindert wird, daß der Sender 10A einen fehlerhaften Betrieb aus­ löst.
Zweite Ausführungsform
Nun wird mit Bezug auf die Fig. 11 bis 15 ein sprach­ gesteuertes Fernbedienungssystem gemäß einer zweiten Aus­ führungsform der vorliegenden Erfindung beschrieben.
Das sprachgesteuerte Fernbedienungssystem gemäß der zwei­ ten Ausführungsform ist hauptsächlich dafür ausgelegt, die Spracherkennungsrate zu erhöhen, wenn in das Mikro­ phon des Senders Sprachbefehle eingegeben werden, wenn in der Umgebung des Senders Umgebungsgeräusche vorhanden sind. Wenn das Fernbedienungssystem mit einem Schallwie­ dergabegerät wie etwa einer Stereoanlage, einer Fernseh­ anlage oder ähnlichem kombiniert wird, wirkt der wieder­ gegebene Schall derartiger Geräte vom Standpunkt der Sprachbefehlserkennung aus als Umgebungsgeräusch. Wenn über das Mikrophon ein Sprachbefehl eingegeben wird, wird gemäß der zweiten Ausführungsform die Intensität des wie­ dergegebenen Schalls oder der Schalldruckpegel des Wie­ dergabegerätes automatisch abgesenkt. Eine solche Ab­ senkung der Intensität des wiedergegebenen Schalls oder des Schalldruckpegels wird im folgenden als Tondämpfungs­ operation bezeichnet. Während in der ersten Ausführungs­ form das Umgebungsgeräusch aufgenommen wird und zur Auf­ hebung des zusammen mit einem Sprachbefehl aufgenommenen Umgebungsgeräusches verwendet wird, wird in der zweiten Ausführungsform die Intensität des als Umgebungsgeräusch wirkenden wiedergegebenen Schalls absichtlich abgesenkt, um die Spracherkennungsrate zu erhöhen.
(Äußerer Aufbau)
Wie in Fig. 11 gezeigt, ist der äußere Aufbau des Senders 10B des sprachgesteuerten Fernbedienungssystems gemäß der zweiten Ausführungsform im wesentlichen der gleiche wie derjenige des in Fig. 4 gezeigten Senders 10A, mit der Ausnahme, daß der Sender 10B an der oberen Blende des Ge­ häuses nur ein einziges Mikrophon M aufweist. Die anderen Einzelheiten des Aufbaus, etwa die Form des Gehäuses 11, die Art und die Anordnung des Sprechschalters 12, des Be­ triebswahlschalters 13 und der Infrarotlicht-Emitterdiode D1, sind mit denjenigen des in Fig. 4 gezeigten Senders 10A identisch.
(Aufbau der elektronischen Schaltung)
Wie in Fig. 12 gezeigt, umfaßt das im allgemeinen mit 100 bezeichnete sprachgesteuerte Fernbedienungssystem einen Sender 10B, das einen über das Mikrophon M eingegebenen Sprachbefehl in ein Fernbedienungssignal Rc umwandelt und das Fernbedienungssignal Rc aussendet. Das gesendete Fernbedienungssignal Rc wird von einem Empfänger 102 empfangen und dient als Steuersignal für ein Informa­ tionswiedergabegerät 105.
Der Sender 10B besitzt einen Detektor 106, der bestimmt, ob ein Sprachbefehl eingegeben worden ist oder nicht, und eine Tondämpfungssteuereinheit 107, die den vom Informa­ tionswiedergabegerät 105 wiedergegebenen Schall entweder um einen vorgegebenen Schalldruckpegel absenkt oder den wiederzugebenden Schall sperrt (d. h. den Wiedergabe­ schallpegel auf 0 reduziert), falls in das Mikrophon ein Sprachbefehl eingegeben wird.
Wie in Fig. 13 genauer erläutert, umfaßt der Sender 10B eine Steuerschaltung 16, die eine Tondämpfungs- Steuerschaltung 19 enthält, welche wiederum den Detektor 106 und die Tondämpfungs-Steuereinheit 107 (Fig. 12) ent­ hält. Die Tondämpfungs-Steuerschaltung 19 kann durch eine unabhängige elektrische Schaltung hardwaremäßig implemen­ tiert werden. In der erläuterten Ausführungsform wird die Tondämpfungs-Steuerschaltung 19 jedoch gemäß einem Tondämpfungs-Steuerprogramm softwaremäßig implementiert, wobei das Tondämpfungs-Steuerprogramm entweder in einem ein Steuerprogramm für die Steuerschaltung 16 speichern­ den Speicher gespeichert ist oder im Steuerprogramm für die Steuerschaltung 16 enthalten ist. Genauer wird die Tondämpfungs-Steuerschaltung 107 durch einen Schritt S26 in Fig. 15 implementiert, während der Detektor 106 durch einen Schritt S22 in Fig. 15 implementiert wird.
Die weiteren Einzelheiten des Aufbaus des Senders 10B sind mit denjenigen des in den Fig. 6 bis 9 gezeigten Senders 10A identisch.
(Gesamtbetrieb)
Im folgenden wird der Betrieb des sprachgesteuerten Fern­ bedienungssystems 100 beschrieben. In einem Anfangs­ zustand ist der Sprechschalter 12 nicht gedrückt, so daß sich der Sender 10B in einem Bereitschaftszustand in der Betriebsart mit niedrigem Leistungsverbrauch befindet.
Zunächst setzt die Steuerschaltung 16 eine Eintra­ gungspuffernummer in einem Schritt S21 auf 1 (Fig. 11).
Dann ermittelt die Steuerschaltung 16 in einem Schritt 22, ob der Sprechschalter 12 gedrückt ist oder nicht, in­ dem sie feststellt, ob vom Sprechschalter 12 ein Be­ triebssteuersignal Sc erzeugt wird oder nicht. Wenn in diesem Moment ein Betriebssteuersignal Sc erzeugt wird, bedeutet dies, daß der Sprechschalter 12 gedrückt ist, so daß die Steuerschaltung 16 an die Leistungsversorgungs- Steuerschaltung 14 ein Steuersignal Sv sendet. Die Lei­ stungsversorgungs-Steuerschaltung 15 liefert in einer normalen Betriebsart elektrische Energie, wodurch der Sender 10B in einem Schritt S25 aktiviert wird; anschlie­ ßend geht die Steuerung weiter zu einem Schritt S26. Wenn der Sprechschalter 12 nicht gedrückt ist, hält die Steu­ erschaltung 16 den Sender 10B in einer Betriebsart mit niedrigem Leistungsverbrauch, so daß der Schritt S22 und der Schritt S24 wiederholt werden. Da sich in diesem Zeitpunkt der Sender 10B in einer Betriebsart mit niedri­ gem Leistungsverbrauch befindet, wird ein Fernbedienungssignal Rc, das den Tondämpfungsbetrieb beendet, nicht ausgegeben. Der Schritt S23 wird später erläutert.
Vor der Eingabe eines Sprachbefehls liefert die Ton­ dämpfungs-Steuerschaltung 19 der Steuerschaltung 16 an die Sendeschaltung 17 ein Fernbedienungs-Befehlssignal SR, damit diese in einem Schritt S25 zum Fernbedienungs­ signal Rc ein Signal addiert, das eine Tondämpfungsopera­ tion für das Informationswiedergabegerät bewirkt. Auf­ grund des Fernbedienungs-Befehlssignals SR schaltet die Sendeschaltung 17 die Infrarotlicht-Emitterdiode D1 ein, damit diese in einem Schritt S26 ein Fernbedienungssignal aussendet, um das Informationswiedergabegerät dazu zu veranlassen, eine Tondämpfungsoperation auszuführen. Dar­ aufhin führt das Informationswiedergabegerät eine Ton­ dämpfungsoperation aus, d. h., es senkt den Wiedergabe­ schallpegel um 20 dB ab, wodurch die Intensität des von den Lautsprechern des Informationswiedergabegerätes abge­ strahlten Wiedergabeschalls abgesenkt wird. Danach ermit­ telt die Steuerschaltung 16 in einem Schritt S27 den Zu­ stand des Betriebswahlschalters 13, um zu bestimmen, ob die Sprachspeicherbetriebsart eingestellt ist oder nicht.
Wenn die Sprachspeicherbetriebsart angezeigt wird, geht die Steuerung weiter zu einem Schritt S28, in dem die Steuerschaltung 16 einen Befehl ausgibt, mit dem die Spracherkennungsschaltung 15 dazu veranlaßt wird, eine Spracheintragungsverarbeitung auszuführen. Gleichzeitig sendet die Steuerschaltung 16 im Schritt S28 an die Spracherkennungsschaltung 15 eine Eintragungspuffernum­ mer.
Die Spracherkennungsschaltung 15 speichert anschließend in einem Schritt S29 in einem entsprechenden Eintra­ gungspuffer im Speicher 23, d. h. in einem Eintragungs­ puffer mit der Eintragungspuffernummer 1, Spracherken­ nungs-Standardmusterdaten.
In einem Schritt S30 liest die Steuerschaltung 16 ein (nicht gezeigtes) Statusregister in der Spracherkennungs­ schaltung 15, um festzustellen, ob die Eintragung eines Sprachbefehls beendet ist oder nicht. Wenn sie noch nicht beendet ist, werden die Schritte S29 und S30 so lange wie­ derholt, bis sie beendet ist. Wenn die Eintragung beendet ist, wird die Eintragungspuffernummer in einem Schritt S31 um 1 erhöht. Die Erhöhung aktualisiert die Eintra­ gungspuffernummer und bereitet den Eintragungspuffer auf die Speicherung von Standardmusterdaten vor.
Dann bestimmt die Steuerschaltung 16 in einem Schritt S32, ob die momentane Eintragungspuffernummer einen maxi­ mal eintragbaren Höchstwert Nmax übersteigt oder nicht. Wenn dies nicht der Fall ist, kehrt die Steuerung zum Schritt S22 zurück. Wenn der Höchstwert überschritten wird, schickt die Steuerschaltung 16 an die Spracherken­ nungsschaltung 15 einen Befehl zum Beenden der Sprach­ speicherbetriebsart, wodurch in einem Schritt S33 die Sprachspeicherbetriebsart beendet wird. Anschließend kehrt die Steuerung zum Schritt S22 zurück.
Wenn im Schritt S27 vom Betriebswahlschalter 13 keine Sprachspeicherbetriebsart angezeigt wird, d. h. wenn vom Betriebswahlschalter 13 im Schritt S27 die Spracherken­ nungsbetriebsart angezeigt wird, gibt die Steuerschaltung 16 in einem Schritt S34 an die Spracherkennungsschaltung 15 einen Spracherkennungsbefehl aus. Nun führt die Spracherkennungsschaltung 15 in einem Schritt S35 eine Spracherkennungsverarbeitung aus, wie sie oben mit Bezug auf Fig. 8 beschrieben worden ist; das bedeutet, daß sie den Abstand D zwischen Daten des eingegebenen Sprachbe­ fehls und Standardmusterdaten bestimmt, um eine eventu­ elle Ähnlichkeit zwischen ihnen zu ermitteln.
Die Steuerschaltung 16 liest in einem Schritt S36 ein (nicht gezeigtes) Statusregister in der Spracherkennungs­ schaltung 15, um zu bestimmen, ob die Spracherkennung des eingegebenen Sprachbefehls beendet ist oder nicht. Wenn die Spracherkennung noch nicht beendet ist, werden die Schritte S35 und S36 so lange wiederholt, bis die Erken­ nung beendet ist. Wenn die Spracherkennung beendet ist, bestimmt die Steuerschaltung 16 in einem Schritt S37, ob die Daten des eingegebenen Sprachbefehls mit den Stan­ dardmusterdaten übereinstimmen oder nicht, d. h. ob der Abstand D kleiner als ein vorgegebener Abstandswert ist oder nicht. Wenn die Daten des eingegebenen Sprachbefehls mit den Standardmusterdaten im Schritt S37 übereinstim­ men, erzeugt die Steuerschaltung 16 in einem Schritt S38 auf der Grundlage der erkannten Sprachbefehlsdaten ein Fernbedienungs-Befehlssignal SR und schickt dieses Fernbedienungs-Befehlssignal SR an die Sendeeinheit 4. Aufgrund des Fernbedienungs-Befehlssignals SR sendet die Sendeschaltung 17 in einem Schritt S39 ein entsprechendes Fernbedienungssignal Rc aus. Wenn die Daten des eingege­ benen Sprachbefehls mit den Standardmusterdaten im Schritt S37 nicht übereinstimmen, führt die Steuerschal­ tung 16 in einem Schritt S40 eine Fehlerverarbeitung wie etwa die Erzeugung eines Summtons aus, anschließend kehrt die Steuerung zum Schritt S22 zurück.
Dann bestimmt die Steuerschaltung 16 im Schritt S22, ob der Sprechschalter 12 gedrückt ist oder nicht, indem sie feststellt, ob ein Betriebssteuersignal Sc ausgegeben wird oder nicht. Wenn ein Betriebssteuersignal Sc ausge­ geben wird, geht die Steuerung weiter zum Schritt S25, da dann der Sprechschalter 12 gedrückt ist.
Wenn der Sprechschalter 12 nicht gedrückt ist, versorgt die Tondämpfungsschaltung 19 die Sendeschaltung 17 mit einem Fernbedienungs-Befehlssignal SR, damit diese zu ei­ nem Fernbedienungssignal Rc ein Signal addiert, das die Tondämpfungsoperation des Informationswiedergabegerätes beendet. Aufgrund dieses Fernbedienungs-Befehlssignals SR schaltet die Sendeschaltung 17 in einem Schritt S23 die Infrarotlicht-Emitterdiode D1 ein, damit diese ein Fern­ bedienungssignal an das Informationswiedergabegerät sen­ det, aufgrund dessen die Tondämpfungsoperation beendet wird. Nun führt das Informationswiedergabegerät einen normalen Betrieb aus, d.h. es erhöht die Intensität des Wiedergabeschalls um 20 dB, so daß der Schall von den Lautsprechern mit normalem Schallpegel wiedergegeben wird.
Anschließend gibt die Steuerschaltung 16 ein Steuersignal Sv an die Leistungsversorgungs-Steuerschaltung 14, die nun in einem Schritt S24 elektrische Energie für die Be­ triebsart mit niedrigem Leistungsverbrauch liefert. Dann kehrt die Steuerung zum Schritt S22 zurück.
Da der Beginn der Eingabe eines Sprachbefehls ermittelt wird, um das Informationswiedergabegerät zu einer Ton­ dämpfungsoperation zu veranlassen, wie oben beschrieben worden ist, kann verhindert werden, daß der vom In­ formationswiedergabegerät wiedergegebene Schall als Umge­ bungsgeräusch vom Mikrophon des Senders aufgenommen wird. Im Ergebnis wird die Spracherkennungsrate des sprachge­ steuerten Fernbedienungssystems erhöht.
Dritte Ausführungsform
Im folgenden wird ein sprachgesteuertes Fernbedie­ nungssystem gemäß einer dritten Ausführungsform der vor­ liegenden Erfindung beschrieben.
Das sprachgesteuerte Fernbedienungssystem gemäß der drit­ ten Ausführungsform ist hauptsächlich so ausgelegt, daß es die Spracherkennungsrate erhöht. Es besitzt eine Er­ kennungsbedingung-Setzeinheit, die mit einer Spracher­ kennungsschaltung zusammenarbeitet, wobei das System der­ art aufgebaut ist, daß die Erkennungsbedingung-Setzein­ heit die Erkennungsbedingungen automatisch abwandelt, wenn die Spracherkennungsschaltung ein Erkennungs-Zurück­ weisungssignal ausgibt.
(Äußerer Aufbau
Der äußere Aufbau des in den Fig. 16 und 17 allgemein mit dem Bezugszeichen 10C versehenen Senders des sprach­ gesteuerten Fernbedienungssystems gemäß der dritten Aus­ führungsform ist im wesentlichen der gleiche wie derje­ nige des in Fig. 11 gezeigten Senders 10B. Das bedeutet, daß Einzelheiten des Aufbaus wie etwa die Form des Gehäu­ ses 11, die Art und die Anordnung des Sprechschalters 12, des Betriebswahlschalters 13 und der Infrarotlicht-Emit­ terdiode D1 mit denjenigen des in Fig. 11 gezeigten Sen­ ders 10B identisch sind.
(Aufbau der elektronischen Schaltung)
Wie in Fig. 16 gezeigt, umfaßt der Sender 10C eine Er­ kennungsbedingung-Setzeinheit 109, die mit einer Spracherkennungseinheit 2 verbunden ist. Die spracherken­ nungseinheit 2 wird mit einem elektrischen Signal von ei­ nem Mikrophon M versorgt und liefert an eine Sendeeinheit 3 ein Erkennungsausgangssignal.
Wie in Fig. 17 genauer dargestellt, umfaßt der Sender 10C eine Steuerschaltung 16, die die Erkennungsbedingung- Setzeinheit 109 enthält. Die Erkennungsbedingung-Setzein­ heit 109 kann durch eine unabhängige elektrische Schal­ tung hardwaremäßig implementiert werden. In der erläuter­ ten Ausführungsform ist die Erkennungsbedingung-Setzein­ heit 109 jedoch softwaremäßig gemäß einem Erkennungsbe­ dingung-Setzprogramm, das entweder in einem ein Steuer­ programm für die Steuerschaltung 16 speichernden Speicher gespeichert ist oder im Steuerprogramm für die Steuer­ schaltung 16 enthalten ist, implementiert. Insbesondere ist die Erkennungsbedingung-Setzeinheit 109 durch einen Schritt S57 in Fig. 18 implementiert.
Weitere Einzelheiten des Aufbaus des Senders 10C sind mit denjenigen des in den Fig. 6 bis 9 gezeigten Senders 10A identisch.
(Gesamtbetrieb)
Nun wird der Betrieb des Senders 10C mit Bezug auf das Flußdiagramm von Fig. 18 beschrieben. Es wird angenommen, daß der Sprechschalter 12 nicht gedrückt ist und daß sich der Sender 10C in einem Bereitschaftszustand befindet.
Zunächst setzt die Steuerschaltung 16 in einem Schritt S41 eine Eintragungspuffernummer auf den Wert 1.
Dann ermittelt die Steuerschaltung 16 in einem Schritt S42, ob der Sprechschalter 12 gedrückt ist oder nicht, indem sie feststellt, ob vom Sprechschalter 12 ein Be­ triebssteuersignal Sc erzeugt wird oder nicht. Wenn in diesem Moment ein Betriebssteuersignal Sc erzeugt wird, bedeutet dies, daß der Sprechschalter 12 gedrückt ist, so daß die Steuerung zu einem Schritt S43 weitergeht. Wenn der Sprechschalter 12 nicht gedrückt ist, wird der Schritt S42 wiederholt.
Die Steuerschaltung 16 liest in einem Schritt S43 den Zu­ stand des Betriebswahlschalters 13, um festzustellen, ob eine Sprachspeicherbetriebsart angezeigt wird oder nicht.
Wenn die Sprachspeicherbetriebsart angezeigt wird, geht die Steuerung weiter zu einem Schritt S44, in dem die Steuerschaltung 16 die Erkennungsbedingungen initiali­ siert. In einem Schritt S45 gibt die Steuerschaltung 16 einen Befehl aus, mit dem die Spracherkennungsschaltung 15 zum Ausführen einer Spracheintragungsverarbeitung ver­ anlaßt wird. Gleichzeitig schickt die Steuerschaltung 16 im Schritt S45 an die Spracherkennungsschaltung 15 eine Eintragungspuffernummer.
Dann speichert die Spracherkennungsschaltung 15 in einem Schritt S46 in einem entsprechenden Eintragungspuffer im Speicher 23, d. h. in einem die Eintragungspuffernummer 1 besitzenden Eintragungspuffer Standardmusterdaten.
In einem Schritt S47 liest die Steuerschaltung 16 ein (nicht gezeigtes) Statusregister in der Spracherkennungs­ schaltung 15, um festzustellen, ob die Eintragung eines Sprachbefehls beendet ist oder nicht. Wenn die Eintragung noch nicht beendet ist, werden die Schritte S46 und S47 so lange wiederholt, bis die Eintragung beendet ist. Wenn sie beendet ist, wird die Eintragungspuffernummer in ei­ nem Schritt S48 um 1 erhöht. Die Erhöhung aktualisiert die Eintragungspuffernummer und bereitet den Eintragungs­ puffer auf die Speicherung von Standardmusterdaten vor.
Dann bestimmt die Steuerschaltung 16 in einem Schritt S49, ob die momentane Eintragungspuffernummer einen maxi­ mal eintragbaren Höchstwert Nmax übersteigt oder nicht. Wenn dies nicht der Fall ist, kehrt die Steuerung zum Schritt S42 zurück. Wenn der Höchstwert überschritten wird, schickt die Steuerschaltung 16 an die Spracherken­ nungsschaltung 15 einen Befehl zum Beenden der Sprach­ speicherbetriebsart, wodurch in einem Schritt S50 die Sprachspeicherbetriebsart beendet wird. Anschließend kehrt die Steuerung zum Schritt S42 zurück.
Wenn im Schritt S43 vom Betriebswahlschalter 13 keine Sprachspeicherbetriebsart angezeigt wird, d. h. wenn im Schritt S43 vom Betriebswahlschalter 13 die Spracherken­ nungsbetriebsart angezeigt wird, gibt die Steuerschal­ tung 16 in einem Schritt S51 an die Spracherkennungs­ schaltung 15 einen Spracherkennungsbefehl aus. Nun führt die Spracherkennungsschaltung 15 in einem Schritt S52 eine Spracherkennungsverarbeitung aus, wie sie oben mit Bezug auf Fig. 8 beschrieben worden ist.
Die Steuerschaltung 16 liest in einem Schritt S53 ein (nicht gezeigtes) Statusregister in der Spracherkennungs­ schaltung 15, um zu bestimmen, ob die Spracherkennung des eingegebenen Sprachbefehls beendet ist oder nicht. Wenn die Spracherkennung noch nicht beendet ist, werden die Schritte S52 und S53 so lange wiederholt, bis die Erken­ nung beendet ist. Wenn die Spracherkennung beendet ist, bestimmt die Steuerschaltung 16 in einem Schritt S54, ob die Daten des eingegebenen Sprachbefehls mit den Stan­ dardmusterdaten übereinstimmen oder nicht, d. h. ob der Abstand D kleiner als ein vorgegebener Abstandswert ist oder nicht. Wenn die Daten des eingegebenen Sprachbefehls mit den Standardmusterdaten im Schritt S54 übereinstim­ men, erzeugt die Steuerschaltung 16 in einem Schritt S55 auf der Grundlage der erkannten Sprachbefehlsdaten ein Fernbedienungsbefehlssignal SR und schickt dieses Fernbe­ dienungs-Befehlssignal SR an die Sendeeinheit 4. Aufgrund des Fernbedienungsbefehlssignals SR sendet die sende­ schaltung 17 in einem Schritt S56 ein entsprechendes Fernbedienungssignal Rc. Wenn im Schritt S54 die Daten des eingegebenen Sprachbefehls mit den Standardmusterda­ ten nicht übereinstimmen, d. h., wenn ein Zurückweisungs­ signal ausgegeben wird, schickt die Erkennungsbedingung- Setzeinheit 109 einen Abwandlungsbefehl zur Abwandlung der Erkennungsbedingungen an die Spracherkennungsschal­ tung 15, die in einem Schritt S57 die Erkennungsbedingun­ gen in solche Erkennungsbedingungen abwandelt, daß die eingegebenen Sprachbefehle leichter erkannt werden kön­ nen. Wenn für die Erkennungsbedingungen beispielsweise der Abstand D verwendet wird und der Abstand D vor seiner Abwandlung im Bereich 0 D < 5 liegt, so wird sein Be­ reich wie folgt abgewandelt:
0 D < 10.
Mit den so abgewandelten Erkennungsbedingungen wird die Wahrscheinlichkeit der Ausgabe eines Zurückweisungs­ signals abgesenkt, so daß die Spracherkennungsrate erhöht wird. Wenn die Spracherkennungsbedingungen abgewandelt werden, verwendet die Spracherkennungsschaltung 15 für die nächste Erkennungsverarbeitung die abgewandelten Er­ kennungsbedingungen. Wenn erneut Standardmusterdaten ein­ getragen werden, werden die initialisierten Erkennungsbe­ dingungen verwendet, da die Erkennungsbedingungen im Schritt S44 initialisiert werden.
Nach dem Schritt S57 bestimmt die Steuerschaltung 16 in einem Schritt S58, ob der Sprechschalter gedrückt ist oder nicht. Wenn der Sprechschalter 12 gedrückt ist, kehrt die Steuerung zum Schritt S52 zurück, um eine Er­ kennungsverarbeitung zu beginnen. Wenn der Sprechschalter 12 nicht gedrückt ist, kehrt die Steuerung zum Schritt S42 zurück.
Wenn, wie oben beschrieben, aufgrund eines Sprachbefehls ein Zurückweisungssignal erzeugt wird, liefert die Erken­ nungsbedingung-Setzeinheit 109 an die Spracherken­ nungsschaltung 15 automatisch einen Abwandlungsbefehl zum Abwandeln der Erkennungsbedingungen. Nachdem die Spracherkennungsschaltung 15 die Erkennungsbedingungen abgewandelt hat, führt die Steuerschaltung 16 erneut eine Erkennungsverarbeitung aus. Wenn daher nach der Eintra­ gung von Standardmusterdaten ein bestimmtes Zeitintervall verstrichen ist und die von der Bedienungsperson eingege­ benen Sprachbefehle leicht verändert sind, kann die Spracherkennungsschaltung 15 diese Sprachbefehle richtig erkennen. Folglich muß die Bedienungsperson die Erken­ nungsbedingungen nicht erneut festlegen, so daß die Spracherkennungsrate erhöht wird.
Vierte Ausführungsform
Im folgenden wird mit Bezug auf die Fig. 19 bis 24 ein sprachgesteuertes Fernbedienungssystem gemäß einer vier­ ten Ausführungsform der vorliegenden Erfindung be­ schrieben.
Das sprachgesteuerte Fernbedienungssystem gemäß der vier­ ten Ausführungsform ist dafür ausgelegt, Sprachbe­ fehlswörter, die im Sender gespeichert sind, wiederzuge­ ben, falls die Bedienungsperson die gespeicherten Sprach­ befehlswörter vergessen hat. Das sprachgesteuerte Fernbe­ dienungssystem gemäß der vierten Ausführungsform besitzt entweder einen Sender 10D (Fig. 20) oder einen Sender 10E (Fig. 21).
(Äußerer Aufbau)
Wie in Fig. 19 gezeigt, umfaßt jeder der Sender 10D und 10E ein tragbares Gehäuse 11, das an seiner oberen Blende ein Mikrophon M zum Umwandeln eines Sprachbefehls in ein elektrisches Signal und eine Flüssigkristallanzeige LCD für die Anzeige von für die Fernbedienung notwendigen In­ formationen aufweist. Ferner ist an einem Ende des Gehäu­ ses 11 eine Infrarotlicht-Emitterdiode D1 zum Senden ei­ nes Fernbedienungssignals angebracht. Auf einer Seite des Gehäuses 11 sind ein Spracheingabeschalter 12 (der im folgenden mit "Sprechschalter" bezeichnet wird), der im gedrückten Zustand geschlossen ist, und ein Be­ triebswahlschalter 13, mit dem zu einem Zeitpunkt entwe­ der die Sprachspeicherbetriebsart oder die Spracherken­ nungsbetriebsart gewählt wird, angeordnet. Am anderen Ende des Gehäuses 11 ist eine aufmachbare und schließbare Ab­ deckung 200 schwenkbar angebracht. Ferner umfaßt das Ge­ häuse 11 in einem von der Abdeckung 200 abdeckbaren Be­ reich einen Lautsprecher 201 zur Wiedergabe von Sprachbe­ fehlen, einen Rückrufschalter 202 für die Veranlassung der Sprachbefehlswiedergabe und einen Zehn-Tasten-Schal­ ter 203 für die Angabe der wiederzugebenden Sprachbe­ fehle. Die elektronische Schaltung des sprachgesteuerten Fernbedienungssystems ist im Gehäuse 11 untergebracht.
(Aufbau der elektronischen Schaltung)
Wie in Fig. 20 gezeigt, umfaßt der Sender 10D zusätzlich zu einer Spracherkennungseinheit 2 und einer Sendeeinheit 3 eine Sprachspeichereinheit 230 zum Speichern von Daten von Sprachbefehlen und eine Sprachwiedergabeeinheit 231 zum Lesen von Daten von Sprachbefehlen aus der Sprach­ speichereinheit 230 aufgrund eines externen Wiedergabebe­ fehlssignals S1 und zum Umwandeln der Daten des Sprachbe­ fehls in eine Sprachausgabe.
Im Sender 10D speichert die Sprachspeichereinheit 230 Da­ ten von Sprachbefehlen. Wenn ein externes Sprachwieder­ gabebefehlssignal S1 eingegeben wird, werden die gespei­ cherten Sprachbefehlsdaten von der Sprachwiedergabeein­ heit 231 aus der Sprachspeichereinheit 230 ausgelesen und in eine Sprachausgabe umgewandelt. Daher kann der Sender 10E ein einem gewünschten Steuerbefehl entsprechendes Be­ fehlswort als Sprachausgabe wiedergeben.
Wie in Fig. 21 gezeigt, umfaßt der Sender 10E, der gegen­ über dem Sender 10D eine Abwandlung darstellt, zusätzlich zur Spracherkennungseinheit 2 und zur Sendeeinheit 3 eine Sprachspeichereinheit 230 zum Speichern von Daten von Sprachbefehlen, eine Sprachwiedergabeeinheit 231 zum Le­ sen von Sprachbefehlsdaten aus der Sprachspeichereinheit 230 aufgrund eines externen Sprachwiedergabe­ befehlssignals S1 und zum Umwandeln der Sprachbefehlsda­ ten in eine Sprachausgabe und eine Registereinheit 232 zur Erzeugung und zum Speichern von Vergleichs-Standard­ musterdaten auf der Grundlage von Sprachmustern eingege­ bener Sprachbefehle. Die Sprachspeichereinheit 230 arbei­ tet mit der Registereinheit 232 zusammen, um in dem Zeit­ punkt, in dem von der Registereinheit 232 Standardmuster­ daten erzeugt werden, Daten eines eingegebenen Sprachbe­ fehls zu speichern.
Im Sender 10E speichert die Sprachspeichereinheit 230 in dem Zeitpunkt, in dem durch die Registereinheit 232 Stan­ dardmusterdaten erzeugt werden, Daten eines eingegebenen Sprachbefehls. Dadurch können gleichzeitig zur Erzeugung und Speicherung von standardmusterdaten Sprachbe­ fehlsdaten gespeichert werden. Folglich ist es nicht er­ forderlich, für die Wiedergabe von Befehlswörtern Sprach­ befehlsdaten einzeln zu speichern. Da die Sprachbefehle, die bei der Speicherung der Standardmusterdaten gespei­ chert werden, vollständig wiedergegeben werden können, kann das sprachgesteuerte Fernbedienungssystem anhand ge­ wünschter Sprachbefehle ein zu steuerndes Gerät richtig steuern.
Jeder der in den Fig. 20 und 21 gezeigten Sender 10D bzw. 10E besitzt einen Aufbau, wie er in Fig. 22 gezeigt ist. Die Sprachspeichereinheit 230, die Sprachwiedergabe­ einheit 231 und die Registereinheit 232 werden durch eine in Fig. 22 gezeigte Sprachbefehlaufnahme- und -wiederga­ beschaltung implementiert.
Die Sprachbefehlaufnahme- und -wiedergabeschaltung 204 ist von einer Kanal-Sprachkodierungsbauart.
Wie in Fig. 23 gezeigt, umfaßt die Sprachbefehlaufnahme- und -wiedergabeschaltung 204 eine Steuerschaltung 205 zur Steuerung des Gesamtbetriebs der Sprachbefehlaufnahme- und -wiedergabeschaltung 204, eine Aufnahmeeinheit 206 zur Aufnahme von Sprachbefehlen und eine Wieder­ gabeeinheit 207 zur Wiedergabe von Sprachbefehlen.
Die Steuerung 205 umfaßt eine CPU 208 zur Steuerung der Sprachbefehlaufnahme- und -wiedergabeschaltung 204, ein ROM 209, in dem ein Steuerprogramm gespeichert ist, und ein RAM 210, in dem vorübergehend Daten von Sprachbe­ fehlen gespeichert werden.
Die Aufnahmeeinheit 206 umfaßt einen Verstärker 211 zur Vestärkung eines vom Mikrophon M aufgenommenen Sprachbe­ fehls auf einen geeigneten Pegel, eine Filterreihe 212 zur Aufteilung eines vom Verstärker 211 ausgegebenen Aus­ gangssignals in Signale in Frequenzbändern, zur Gleich­ richtung der Signale und zur Ausgabe der gleichgerichte­ ten Signale, einen Stimmhaft/Stimmlos-Schalldetektor 213 zur Bestimmung, ob der eingegebene Sprachbefehl stimmhaft oder stimmlos ist, einen Tonhöhendetektor 214 zum Abfra­ gen der Grundfrequenz eines eingegebenen Sprachbefehls, falls der eingegebene Sprachbefehl periodisch ist, einen Analog/Digital-Wandler 215 (A/D-Wandler) zum Umwandeln der Ausgangssignale der Frequenzbänder von der Filter­ reihe 212, eines Ausgangssignals vom Stimmhaft/Stimmlos- Schalldetektor 213 und eines Ausgangssignals vom Tonhö­ hendetektor 214 in Digitalsignale und eine Schnittstelle 216 zum Senden von Signalen an die Steuerschaltung 205.
Die Filterreihe 212 umfaßt eine erste Bandpaßfilteran­ ordnung 217, die das Signal eines eingegebenen Sprachbe­ fehls in Signale in einer Mehrzahl von Frequenzbändern unterteilt, eine Gleichrichteranordnung 218, die die von der ersten Bandpaßfilteranordnung 217 ausgegebenen Si­ gnale in den Frequenzbändern gleichrichtet, und eine Tiefpaßfilteranordnung 219, die aus den von der Gleichrichteranordnung 218 ausgegebenen Ausgangssignalen in den Frequenzbändern die Hochfrequenzkomponenten besei­ tigt. Die erste Bandpaßfilteranordnung 217 umfaßt eine Mehrzahl von (nicht gezeigten) Bandpaßfiltern mit jeweils unterschiedlichen Mittenfrequenzen. Die Gleichrichteran­ ordnung 218 umfaßt eine Mehrzahl von (nicht gezeigten) Gleichrichtern, die mit entsprechenden Bandpaßfiltern der Bandpaßfilteranordnung 217 in Reihe geschaltet sind und die Signale der jeweiligen Frequenzbänder gleichrichten. Die Tiefpaßfilteranordnung 219 umfaßt eine Mehrzahl von (nicht gezeigten) Tiefpaßfiltern, die mit den entspre­ chenden Gleichrichtern der Gleichrichteranordnung 218 in Reihe geschaltet sind und die Hochfrequenzkomponenten aus den entsprechenden gleichgerichteten Ausgangssignalen von der Gleichrichteranordnung 218 beseitigen.
Die A/D-Wandleranordnung 215 umfaßt eine Mehrzahl von (nicht gezeigten) A/D-Wandlern, die mit den entsprechen­ den Tiefpaßfiltern der Tiefpaßfilteranordnung 219, mit dem Stimmhaft/Stimmlos-Schalldetektor 213 und mit dem Tonhöhendetektor 214 in Reihe geschaltet sind. Die A/D- Wandler wandeln die Ausgangssignale der Tiefpaßfilter, des Stimmhaft/Stimmlos-Schalldetektors 213 und des Tonhö­ hendetektors 214 in Digitalsignale um.
Die Wiedergabeeinheit 207 umfaßt eine Schnittstelle 220 für dem Empfang von Daten von der Steuereinheit 204, eine Digital/Analog-Wandleranordnung 221 (D/A-Wandleran­ ordnung) zum Umwandeln von Digitalsignalen von der Schnittstelle 220 in Analogsignale, einen Impulsgenerator 222 zur Erzeugung eines periodischen Impulssignals, einen Geräuschgenerator 223 zur Erzeugung eines Geräusches, eine Schallquellenwählvorrichtung 224 zum Wählen entweder des Impulsgenerators 222 oder des Geräuschgenerators 223 in Abhängigkeit davon, ob ein ursprünglicher Sprachbefehl stimmhaft oder stimmlos ist, und zum Verbinden des ausge­ wählten Generators mit einer Amplitudensteuerung, eine Amplitudensteuerung 225 zur Steuerung der Amplitude der Ausgangssignale von der D/A-Wandleranordnung 221 auf der Grundlage des Ausgangssignals vom Impulsgenerator 222 oder vom Geräuschgenerator 223, eine zweite Bandpaßfil­ teranordnung 226 für die Ausgabe von Ausgangssignalen der D/A-Wandleranordnung 221 in den entsprechenden Frequenz­ bändern, einen Lautsprecher 201 zum Umwandeln eines elek­ trischen Signals in ein Schallsignal und einen Verstärker 227 zum Verstärken eines Ausgangssignals von der zweiten Bandpaßfilteranordnung 226 auf einen geeigneten Pegel und zum Treiben des Lautsprechers 201 mit dem verstärkten Si­ gnal.
Die D/A-Wandleranordnung 221 umfaßt eine Mehrzahl von (nicht gezeigten) D/A-Wandlern, die von der Schnittstelle 220 gelieferte Digitaldaten in Analogsignale umwandelt.
Die zweite Bandpaßfilteranordnung 226 umfaßt eine Mehr­ zahl von (nicht gezeigten) Bandpaßfiltern, die den glei­ chen Aufbau wie die Bandpaßfilter der ersten Bandpaß­ filteranordnung 217 besitzen.
Nun wird der Betrieb der Sprachbefehlaufnahme­ /Sprachbefehlwiedergabeschaltung 204 beschrieben.
Ein Sprachbefehl wird folgendermaßen aufgenommen: Wenn vom Mikrophon M ein Sprachbefehl empfangen wird, wird dessen elektrisches Ausgangssignal durch den Verstärker 211 auf einen geeigneten Signalpegel verstärkt. Das ver­ stärkte Signal wird anschließend an die Bandpaßfilter der ersten Bandpaßfilteranordnung 217 geliefert, anschließend werden die durch die Bandpaßfilter mit dem entsprechenden Frequenzband hindurchgelassenen Signale an die Gleich­ richteranordnung 218 geliefert. Die an die Gleich­ richteranordnung 218 gelieferten Signale werden dann durch die entsprechenden Gleichrichter, die mit den Band­ paßfiltern in Reihe geschaltet sind, gleichgerichtet. Die Ausgangssignale der Gleichrichter enthalten Hochfrequenz­ komponenten, die anschließend durch die Tiefpaßfilter der Tiefpaßfilteranordnung 219, die mit den jeweiligen Gleich­ richtern in Reihe geschaltet sind, beseitigt werden. Die Ausgangssignale der Tiefpaßfilter werden anschließend an die A/D-Wandler der A/D-Wandleranordnung 215 geliefert, die die Signale beispielsweise in 4-Bit-Zeitaufteilungs- Digitaldaten umwandeln. Gleichzeitig werden die Ausgangs­ signale des Stimmhaft/Stimmlos-Schalldetektors 213 und des Tonhöhendetektors 214 von der A/D-Wandleranordnung 215 in digitale Stimmhaft/Stimmlos-Daten bzw. in digitale Tonhöhendaten umgewandelt. Die durch die A/D-Wandleran­ ordnung 215 erhaltenden Digitaldaten werden über die Schnittstelle 216 unter der Steuerung der CPU 208 an das RAM 210 geliefert und dort gespeichert. Ebenso werden die Zeitaufteilungs-Digitaldaten des eingegebenen Sprachbe­ fehls, die Stimmhaft/Stimmlos-Daten und die Tonhöhendaten als Digitaldaten im RAM 210 gespeichert.
Ein Sprachbefehl wird folgendermaßen wiedergegeben: Wenn vom Rückrufschalter 202 ein Wiedergabebefehlssignal SP an die CPU 208 der Steuerschaltung 205 geliefert wird und ein wiederzugebender Sprachbefehl durch den Zehn-Tasten- Schalter 203 angegeben wird, werden die diesem Sprachbe­ fehl entsprechenden Zeitaufteilungs-Digitaldaten, die Stimmhaft/Stimmlos-Schalldaten und die Tonhöhendaten aus dem RAM 210 ausgelesen und über die Schnittstelle 220 an die D/A-Wandleranordnung 221 geliefert. Die an die D/A- Wandleranordnung 221 gelieferten Zeitaufteilungsdaten werden in Analogdaten umgewandelt, welche anschließend an die Amplitudensteuerung 225 geliefert werden. Gleichzei­ tig werden auch die Stimmhaft/Stimmlos-Schalldaten in Analogdaten umgewandelt und als ein Steuersignal an die Schallquellenwählvorrichtung 224 geliefert. Wenn der Sprachbefehl stimmhaft ist, verbindet die Schallquellen­ wählvorrichtung 224 den Impulsgenerator 222 mit der Im­ pulssteuerung 225, während die Schallquellenwählvorrich­ tung 224 die Amplitudensteuerung 225 mit dem Geräuschge­ nerator 223 verbindet, wenn der Sprachbefehl stimmlos ist. Der Impulsgenerator 222 erzeugt auf der Grundlage der an ihn als Analogdaten vom D/A-Wandler 221 geliefer­ ten Tonhöhendaten Impulse.
Das Schallquellensignal, d. h. entweder das periodische Impulssignal oder das Geräusch, das auf der Grundlage der Stimmhaft/Stimmlos-Schalldaten von der Schall­ quellenwählvorrichtung 224 ausgewählt wird, wird an die Amplitudensteuerung 225 geliefert. Das Schallquellensi­ gnal wird in den jeweiligen Frequenzbändern durch die Am­ plitudensteuerung 225 aufgrund der Zeitaufteilungsdaten des Sprachbefehls amplitudengesteuert und dann an die zweite Bandpaßfilteranordnung 226 geliefert.
Die Ausgangssignale der Bandpaßfilter der zweiten Band­ paßfilteranordnung 226 werden an den Verstärker 227 ge­ liefert. Durch das Ausgangssignal des Verstärkers 227 wird der Lautsprecher 201 getrieben, um einen Sprachbe­ fehl wiederzugeben.
Obwohl die Sprachbefehlaufnahme- und -wiedergabeschaltung unter der Bedingung beschrieben worden ist, daß sie vom Kanalsprachkodierungstyp ist, können auch andere Sprach­ synthesesysteme, etwa ein PAR-(Teil-Autokorrelations-) oder ein LSP-(Lineares Vorhersagekodierungs-) System, in der Sprachbefehlaufnahme- und Sprachbefehlwiedergabe­ schaltung 204 verwendet werden.
Weitere Einzelheiten des Aufbaus, beispielsweise die in Fig. 22 gezeigte Spracherkennungsschaltung 15, sind mit denjenigen der in den Fig. 6 bis 9, 13 und 14 gezeigten Ausführungsformen identisch, weshalb sie nicht weiter be­ schrieben werden. Wie in Fig. 22 gezeigt, werden die Si­ gnale vom Zehn-Tasten-Schalter 203 und vom Rückruf­ schalter 202 an die Steuerschaltung 16 geliefert, in der sie Befehle für die obige Steueroperation darstellen.
(Gesamtbetrieb)
Der Sender 10D bzw. 10E arbeitet in Abhängigkeit davon, ob der Sprechschalter 12 gedrückt oder losgelassen ist (d. h. ein- oder ausgeschaltet ist). Wenn der Sprech­ schalter 12 gedrückt ist, kann der Sender 10D bzw. 10E Fernbedienungssignale aussenden, während er in einem Be­ triebsbereitschaftszustand gehalten wird, wenn der Sprechschalter 12 losgelassen ist, so daß er im letzteren Fall auf einzugebende Sprachbefehle wartet. Es gibt zwei Eingabebetriebsarten für die Eingabe von Sprachbefehlen. In einer Eingabebetriebsart werden Sprachbefehle der Be­ dienungsperson gespeichert, während in der anderen Einga­ bebetriebsart Sprachbefehle der Bedienungsperson erkannt werden. In der Sprachspeicherbetriebsart wird ein Be­ fehlswort wie etwa "Wiedergabe" in den Sender 10D bzw. 10E aufgenommen.
Wenn der Rückrufschalter 202 gedrückt wird, wird der Sen­ der 10D bzw. 10E in einen Zustand versetzt, in dem Sprachbefehle wiedergegeben werden können. Der Sender 10D bzw. 10E kann über den Lautsprecher 201 einen Sprachbe­ fehl wiedergeben, der einem vom Zehn-Tasten-Schalter 203 gelieferten Eingabesignal entspricht.
Nun wird die Funktionsweise des Senders 10D bzw. 10E mit Bezug auf das in Fig. 24 gezeigte Flußdiagramm be­ schrieben. Es wird angenommen, daß der Sprechschalter 12 nicht gedrückt ist und daß sich der Sender 10D bzw. 10E in einem Bereitschaftszustand befindet.
Zunächst wird in einem Schritt S61 eine Eintragungs­ puffernummer auf den Wert 1 gesetzt, anschließend ermit­ telt die Steuerschaltung 16 in einem Schritt S62, ob der Sprechschalter 12 gedrückt ist oder nicht, indem sie feststellt, ob vom Sprechschalter 12 ein Betriebssteuer­ signal Sc erzeugt wird. Wenn in diesem Moment ein Be­ triebssteuersignal Sc erzeugt wird, bedeutet dies, daß der Sprechschalter 12 gedrückt ist, so daß die Steuer­ schaltung 16 den Sender 10D bzw. 10E im Schritt S62 akti­ viert.
Wenn der Sprechschalter 12 nicht gedrückt ist, bestimmt die Steuerschaltung 16 in einem Schritt S63, ob der Rück­ rufschalter 202 gedrückt ist oder nicht, indem sie fest­ stellt, ob ein Wiedergabeanzeigesignal SP ausgegeben wird. Wenn ein Wiedergabeanzeigesignal SP ausgegeben wird, bedeutet dies, daß der Rückrufschalter 202 gedrückt ist, so daß die Steuerschaltung 16 in einem Schritt S64 wartet, bis ein einen wiederzugebenden Sprachbefehl an­ zeigendes Signal über den Zehn-Tasten-Schalter 203 einge­ geben wird. Wenn durch den Zehn-Tasten-Schalter 203 ein wiederzugebender Sprachbefehl angegeben wird, schickt die Steuerschaltung 16 in einem Schritt S65 an die Sprachbe­ fehlaufnahme- und -wiedergabeschaltung 204 einen dem an­ gegebenen Sprachbefehl entsprechenden Kode. Dann erzeugt die Sprachbefehlaufnahme- und -wiedergabeschaltung 204 in einem Schritt S66 auf der Grundlage des Kodes entspre­ chend der oben beschriebenen Verarbeitung einen Sprachbe­ fehl. Danach kehrt die Steuerung zum Schritt S62 zurück. Wenn im Schritt S64 nach Ablauf eines vorgegebenen Zei­ tintervalls kein wiederzugebender Sprachbefehl angegeben wird, kehrt die Steuerung ebenfalls zum Schritt S62 zu­ rück.
Danach liest die Steuerschaltung 16 in einem Schritt S67 den Zustand des Betriebswahlschalters 13, um festzustel­ len, ob er die Sprachspeicherbetriebsart anzeigt.
Wenn die Sprachspeicherbetriebsart angezeigt wird, geht die Steuerung weiter zu einem Schritt S68, indem die Steuerschaltung 16 einen Befehl ausgibt, der die Spracherkennungsschaltung 15 zur Ausführung einer Spracheintragungsverarbeitung veranlaßt. Gleichzeitig veranlaßt die Steuerschaltung 16 die Sprachbefehlauf­ nahme- und -wiedergabeschaltung 204 dazu, einen Sprachbe­ fehl aufzunehmen, und schickt im selben Schritt S68 an die Spracherkennungsschaltung 15 und an die Sprachbe­ fehlaufnahme- und -wiedergabeschaltung eine Eintragungs­ puffernummer.
In einem Schritt S69 speichert anschließend die Spracher­ kennungsschaltung 15 Spracherkennungs-Standardmusterdaten in einem entsprechenden Eintragungspuffer des Speichers 23, d. h. in einem Eintragungspuffer mit der Eintragungs­ puffernummer 1. Außerdem nimmt im Schritt S69 die Sprach­ befehlaufnahme- und -wiedergabeschaltung 204 Daten des Sprach 06839 00070 552 001000280000000200012000285910672800040 0002004029697 00004 06720befehls auf.
In einem Schritt S60 liest die Steuerschaltung 16 ein (nicht gezeigtes) Statusregister in der Spracherkennungs­ schaltung 15 und ein (nicht gezeigtes) Statusregister in der Sprachbefehlsaufnahme- und -wiedergabeschaltung 204, um festzustellen, ob die Eintragung und die Aufnahme ei­ nes Sprachbefehls beendet ist oder nicht. Wenn die Ein­ tragung und die Aufnahme noch nicht beendet sind, werden die Schritte S69 und S70 so lange wiederholt, bis die Ein­ tragung und die Aufnahme beendet sind. Wenn die Eintra­ gung und die Aufnahme beendet sind, wird die Eintragungs­ puffernummer in einem Schritt S71 um 1 erhöht.
Dann bestimmt die Steuerschaltung 16 in einem Schritt S72, ob die momentane Eintragungspuffernummer eine höchstens speicherbare Nummer Nmax übersteigt oder nicht. Wenn dies nicht der Fall ist, kehrt die Steuerung zum Schritt S62 zurück. Wenn die höchste Nummer Nmax über­ stiegen wird, schickt die Steuerschaltung 16 einen Befehl zum Beenden der Sprachspeicherbetriebsart an die Spracherkennungsschaltung 15, so daß die Sprachspeicher­ betriebsart in einem Schritt S73 beendet wird. Anschlie­ ßend geht die Steuerung zum Schritt S62 zurück.
Wenn vom Betriebswahlschalter 13 im Schritt S67 keine Sprachspeicherbetriebsart angezeigt wird, d. h. wenn im Schritt S67 vom Betriebswahlschalter 13 die Spracherken­ nungsbetriebsart angezeigt wird, gibt die Steuerschaltung 16 im Schritt S74 an die Spracherkennungsschaltung 15 einen Spracherkennungsbefehl aus. Daraufhin führt die Spracherkennungsschaltung 15 im Schritt S75 eine Spracherkennungsverarbeitung aus, wie sie oben mit Bezug auf Fig. 8 beschrieben worden ist.
Die Steuerschaltung 16 liest in einem Schritt S76 ein (nicht gezeigtes) Statusregister in der Spracherkennungs­ schaltung 15, um zu bestimmen, ob die Spracherkennung des eingegebenen Sprachbefehls beendet ist oder nicht. Wenn die Spracherkennung noch nicht beendet ist, werden die Schritte S75 und S76 so lange wiederholt, bis die Erken­ nung beendet ist. Wenn die Spracherkennung beendet ist, bestimmt die Steuerschaltung 16 in einem Schritt S77, ob die Daten des eingegebenen Sprachbefehls mit den stan­ dardmusterdaten übereinstimmen oder nicht, d. h. ob der Abstand D kleiner als ein vorgegebener Abstandswert ist oder nicht. Wenn die Daten des eingegebenen Sprachbefehls mit den Standardmusterdaten im Schritt S77 übereinstim­ men, erzeugt die Steuerschaltung 16 in einem Schritt S78 auf der Grundlage der erkannten Sprachbefehlsdaten ein Fernbedienungs-Befehlssignal SR und schickt dieses Fernbedienungs-Befehlssignal SR an die Sendeeinheit 4. Aufgrund des Fernbedienungs-Befehlssignals SR sendet die Sendeschaltung 17 in einem Schritt S79 ein entsprechendes Fernbedienungssignal Rc aus. Wenn die Daten des eingege­ benen Sprachbefehls mit den Standardmusterdaten im Schritt S77 nicht übereinstimmen, führt die Steuersschal­ tung 16 in einem Schritt S80 eine Fehlerverarbeitung wie etwa die Erzeugung eines Summtons aus, anschließend kehrt die Steuerung zum Schritt S62 zurück.
Wenn, wie oben beschrieben worden ist, der Rückruf­ schalter 202 gedrückt ist und durch den Zehn-Tasten- Schalter 203 ein Sprachbefehl angegeben wird, den die Be­ dienungsperson wiederzugeben wünscht, wird der Sprachbe­ fehl durch den Lautsprecher 201 wiedergegeben. Daher kann dieser Sprachbefehl selbst dann, wenn die Bedienungsper­ son das Wort des gespeicherten Sprachbefehls vergessen hat, leicht wiedergegeben und erneut leicht gespeichert werden.
In der obigen Ausführungsform wird bestimmt, ob der Rück­ rufschalter 202 gedrückt ist oder nicht, nachdem der Sprechschalter 12 gedrückt worden ist. Die Feststellung, ob der Rückrufschalter 202 gedrückt ist oder nicht, kann jedoch auch unabhängig vom Sprechschalter 12 festgestellt werden, so daß ein Sprachbefehl zu jeder gewünschten Zeit wiedergegeben werden kann.
Während der Zehn-Tasten-Schlüssel in der obigen Aus­ führungsform dazu verwendet wird, einen wiederzugebenden Sprachbefehl anzugeben, können statt dessen einzelne, den jeweiligen Sprachbefehlen entsprechende Tasten verwendet werden, um wiederzugebende Sprachbefehle anzugeben. Wenn beispielsweise ein Sprachbefehl für eine Aufnahmeopera­ tion wiedergegeben werden soll, wird eine Taste für die Wieder­ gabe eines einem Aufnahmebetrieb entsprechenden Sprachbe­ fehls gedrückt. Diese Anordnung vereinfacht die Verarbei­ tung der Wiedergabe eines Sprachbefehls.
In dem in Fig. 20 gezeigten Schaltungsaufbau werden Daten eines Sprachbefehls in der Sprachspeichereinheit gespei­ chert und aus dieser Sprachspeichereinheit aufgrund eines externen Sprachwiedergabebefehlssignals von der Sprech­ wiedergabeeinheit 231 ausgelesen. Selbst wenn daher die Bedienungsperson das Wort für einen Sprachbefehl ver­ gessen hat, kann dieses vom Fernbedienungssystem leicht abgefragt werden und muß nicht erneut gespeichert werden.
In dem in Fig. 21 gezeigten Schaltungsaufbau werden Sprachbefehlsdaten gleichzeitig mit der Erzeugung und der Speicherung von Standardmusterdaten gespeichert. Es ist daher nicht notwendig, Sprachbefehlsdaten für die Wieder­ gabe von Befehlswörtern einzeln zu speichern. Da Sprach­ befehle so, wie sie gespeichert worden sind, wiedergege­ ben werden können, kann das Fernbedienungssystem ein zu steuerndes Gerät mit den Sprachbefehlen über eine Entfer­ nung hinweg richtig steuern.
Die Erfindung kann in anderen besonderen Formen aus­ geführt werden, ohne daß von ihrem Geist oder von ihren wesentlichen Merkmalen abgewichen wird. Die vorliegenden Ausführungsformen sind daher in jeder Hinsicht als erläu­ ternd und nicht als beschränkend aufzufassen. Der Umfang der Erfindung wird in erster Linie durch die beigefügten Ansprüche und erst in zweiter Linie durch die oben gege­ bene Beschreibung festgelegt. Sämtliche Änderungen, die durch den Bedeutungsgehalt der Patentansprüche abgedeckt sind und in deren Äquivalenzbereich liegen, sollen daher von ihnen umfaßt werden.

Claims (12)

1. Sprachgesteuertes Fernbedienungssystem, mit
einem Sender (10A), der einen Sprachbefehl in ein Fernbedienungssignal (Rc) umwandelt und dieses Fernbedie­ nungssignal (Rc) aussendet, und
einem Empfänger (102), der das Fernbedienungssi­ gnal (Rc) empfängt, dieses in einen Steuerbefehl umwan­ delt und diesen an ein zu steuerndes Gerät (103) liefert,
dadurch gekennzeichnet, daß der Sender (10A)
ein erstes Mikrophon (M1), des den Sprachbefehl und Umgebungsgeräusche aufnimmt und den Sprachbefehl und die Umgebungsgeräusche in ein erstes elektrisches Signal umwandelt,
ein zweites Mikrophon (M2), das die Umgebungsge­ räusche aufnimmt und in ein zweites elektrisches Signal umwandelt, und
ein Umgebungsgeräuschbeseitigungsmittel (104), das eine den Umgebungsgeräuschen entsprechende Signalkompo­ nente auf der Grundlage des ersten und des zweiten elek­ trischen Signals aus dem elektrischen Signal beseitigt, umfaßt.
2. Sprachgesteuertes Fernbedienungssystem gemäß An­ spruch 1, dadurch gekennzeichnet, daß der Sender (10A) eine vorderseitige Blende und eine rückseitige Blende aufweist und das erste Mikrophon (M1) an der vorderseiti­ gen Blende und das zweite Mikrophon (M2) an der rücksei­ tigen Blende angebracht ist.
3. Sprachgesteuertes Fernbedienungssystem gemäß An­ spruch 1, dadurch gekennzeichnet, daß das Umgebungsge­ räuschbeseitigungsmittel (104) einen Differenzverstärker (34) aufweist, der die Differenz zwischen dem ersten und dem zweiten elektrischen Signal ermittelt.
4. Sprachgesteuertes Fernbedienungssystem, das in Verbindung mit einem mittels Schallabstrahlungsmittel mit einstellbaren Schalldruckpegel Schall wiedergebenden Informationswiedergabegerät (105) verwendet wird, mit
einem Sender (10A), der einen Sprachbefehl in ein Fernbedienungssignal (Rc) umwandelt und dieses Fernbedie­ nungssignal (Rc) aussendet, und
einem Empfänger (102), der dem Informationswie­ dergabegerät (105) zugeordnet ist und das Fernbedienungs­ signal (Rc) empfängt, dieses in einen Steuerbefehl deko­ diert und diesen an das Informationswiedergabegerät (105) liefert,
dadurch gekennzeichnet, daß der Sender (10B) Detektormittel (106), die fest­ stellen, ob ein Sprachbefehl eingegeben wird und ein De­ tektorsignal (Ss) erzeugen, und
Tondämpfungsmittel (107), die den Schalldruckpe­ gel des vom Informationswiedergabegerät (105) wiedergege­ benen Schalls in Abhängigkeit vom Detektorsignal (Ss) der Detektormittel (106) absenken, bevor mit der Eingabe des Sprachbefehls begonnen wird, umfaßt.
5. Sprachgesteuertes Fernbedienungssystem gemäß An­ spruch 4, dadurch gekennzeichnet, daß der Sender (10B) einen Sprechschalter (12) aufweist, mit dem ein Signal erzeugt wird, das den Sender (10B) dazu veranlaßt, das Fernbedienungssignal (Rc) auszusenden, wenn der Sprachbe­ fehl eingegeben wird.
6. Sprachgesteuertes Fernbedienungssystem gemäß An­ spruch 5, dadurch gekennzeichnet, daß die Detektormittel (106) Mittel aufweisen, die erfassen, ob ein Sprachbefehl in den Sender (10B) eingegeben wird, indem sie das Signal vom Sprechschalter (12) erfassen.
7. Sprachgesteuertes Fernbedienungssystem, mit
einem Sender (10C) mit einem Mikrophon (M), das einen Sprachbefehl in ein elektrisches Signal umwandelt,
Spracherkennungsmitteln (15), die den Sprachbe­ fehl auf der Grundlage des elektrischen Signals vom Mi­ krophon (M) in Musterdaten umwandeln, die Musterdaten des Sprachbefehls mit vorgegebenen Standardmusterdaten ver­ gleichen, ein Ausgangssignal festlegen, das das auf einer Spracherkennungsbedingung basierende Vergleichsergebnis darstellt und ein dem Sprachbefehl entsprechendes Fernbe­ dienungssignal (Rc) aussenden, und
einem Empfänger (102), der das Fernbedienungssi­ gnal (Rc) empfängt, dieses in einen Steuerbefehl umwan­ delt und diesen an ein zu steuerndes Gerät (103) liefert,
dadurch gekennzeichnet,
daß der Sender (10C) ein Erkennungsbedingung-Setzmit­ tel (109) aufweist, das an das Spracherkennungsmittel (15) einen Befehl ausgibt, der die Spracherkennungsbedin­ gung automatisch abwandelt, wenn das Spracherkennungsmit­ tel (15) den Sprachbefehl nicht erkennt.
8. Sprachgesteuertes Fernbedienungssystem zum Aus­ senden eines einem Sprachbefehl entsprechenden Fernbedie­ nungssignals (Rc), gekennzeichnet durch ,
eine Sprachspeichereinheit (230), die Daten des Sprachbefehls speichert, und
eine Sprachwiedergabeeinheit (231), die Daten des Sprachbefehls aus der Sprachspeichereinheit (230) auf­ grund eines externen Sprachwiedergabebefehlssignals (S1) ausliest und die Sprachbefehlsdaten in eine Sprachausgabe umwandelt.
9. Sprachgesteuertes Fernbedienungssystem gemäß An­ spruch 8, gekennzeichnet durch eine Registereinheit (232), die auf der Grundlage der Sprachbefehlsdaten dem Vergleich dienende Standardmusterdaten erzeugt und spei­ chert, wobei die Sprachspeichereinheit Mittel (230) auf­ weist, die mit der Registereinheit (232) zusammenarbeiten und Sprachbefehlsdaten speichern, wenn von der Regi­ stereinheit (232) Standardmusterdaten erzeugt werden.
10. Sprachgesteuertes Fernbedienungssystem gemäß An­ spruch 8, dadurch gekennzeichnet, daß die Sprachspeicher­ einheit (230) einen Verstärker (211), der ein Signal ei­ nes von einem Mikrophon (M) aufgenommenen Eingabesprach­ befehls auf einen vorgegebenen Pegel verstärkt, eine Fil­ terreihe (212; 217, 218, 219), die ein Ausgangssignal vom Verstärker (211) in Signale in entsprechenden Frequenz­ bändern unterteilt und die Signale in den Frequenzbändern gleichrichtet, einen Stimmhaft/Stimmlos-Schalldetektor (213), der bestimmt, ob der eingegebene Sprachbefehl stimmhaft oder stimmlos ist, einen Tonhöhendetektor (214), der die Grundfrequenz des eingegebenen Sprachbe­ fehls erfaßt, falls der eingegebene Sprachbefehl peri­ odisch ist, und einen Analog/Digital-Wandler (215), der die von der Filterreihe (212) ausgegebenen, gleichgerich­ teten Signale in den Frequenzbändern, ein Ausgangssignal vom Stimmhaft/Stimmlos-Schalldetektor (213) und ein Aus­ gangssignal vom Tonhöhendetektor (214) in entsprechende Digitalsignale umwandelt, umfaßt.
11. Sprachgesteuertes Fernbedienungssystem gemäß An­ spruch 8, dadurch gekennzeichnet, daß die Sprachwiederge­ beeinheit (231) einen Digital/Analog-Wandler (221), der die Daten der Sprachspeichereinheit (230) in Analogdaten umwandelt, einen Impulsgenerator (222), der ein periodi­ sches Impulssignal erzeugt, einen Geräuschgenerator (223), der ein Geräusch erzeugt, eine Schallquellenwähl­ vorrichtung (224), die in Abhängigkeit davon, ob der ein­ gegebene Sprachbefehl stimmhaft oder stimmlos ist, entwe­ der die Ausgabe des Impulsgenerators (222) oder die Aus­ gabe des Geräuschgenerators (223) wählt, eine Amplituden­ steuerung (225), die auf der Grundlage des vom Digi­ tal/Analog-Wandler (221) ausgegebenen Analogsignals die Amplitude entweder des periodischen Impulssignals oder des Geräusches steuert, ein Bandpaßfilter (226), das ein Ausgangssignal der Amplitudensteuerung (225) durch ent­ sprechende Frequenzbänder hindurchläßt, einen Verstärker (227), der das Ausgangssignal des Bandpaßfilters (226) auf einen vorgegebenen Pegel verstärkt, und einen Laut­ sprecher (201), der ein Ausgangssignal des Verstärkers (227) in ein Schallsignal umwandelt, umfaßt.
12. Sprachgesteuertes Fernbedienungssystem gemäß An­ spruch 9, gekennzeichnet durch einen Sender (10E), der das Fernbedienungssignal (Rc) aussendet, wobei die Sprachspeichereinheit (230), die Sprachwiedergabeeinheit (231) und die Registereinheit (232) in dem Sender (10E) enthalten sind.
DE4029697A 1989-12-29 1990-09-19 Sprachgesteuertes Fernbedienungssystem Expired - Lifetime DE4029697C2 (de)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP1341625A JPH03203796A (ja) 1989-12-29 1989-12-29 音声リモートコントロール装置
JP1341627A JPH03203797A (ja) 1989-12-29 1989-12-29 音声リモートコントロール装置
JP1341626A JPH03203795A (ja) 1989-12-29 1989-12-29 音声リモートコントロール装置
JP1341624A JPH03202900A (ja) 1989-12-29 1989-12-29 音声リモートコントロール装置

Publications (2)

Publication Number Publication Date
DE4029697A1 true DE4029697A1 (de) 1991-07-04
DE4029697C2 DE4029697C2 (de) 1998-05-20

Family

ID=27480604

Family Applications (1)

Application Number Title Priority Date Filing Date
DE4029697A Expired - Lifetime DE4029697C2 (de) 1989-12-29 1990-09-19 Sprachgesteuertes Fernbedienungssystem

Country Status (2)

Country Link
US (1) US5267323A (de)
DE (1) DE4029697C2 (de)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4307688A1 (de) * 1993-03-11 1994-09-15 Daimler Benz Ag Verfahren zur Geräuschreduktion für gestörte Sprachkanäle
US5400409A (en) * 1992-12-23 1995-03-21 Daimler-Benz Ag Noise-reduction method for noise-affected voice channels
DE19712632A1 (de) * 1997-03-26 1998-10-01 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Sprachfernsteuerung von Geräten
DE19748267A1 (de) * 1997-09-16 1999-06-17 Michael Kaiser Sprachgesteuertes Fernbedienungsgerät
EP1079371A1 (de) * 1999-08-26 2001-02-28 Matsushita Electric Industrial Co., Ltd. Universelle Fernsteuerung für Fernseh- und Multimediaprogrammsuchen und -programmanforderungen mit natürlicher Sprache
DE19963142A1 (de) * 1999-12-24 2001-06-28 Christoph Bueltemann Verfahren und Vorrichtung zur sprachgesteuerten Bedienung eines Kiosksystems
DE10002321A1 (de) * 2000-01-20 2001-08-02 Infineon Technologies Ag Sprachgesteuerte Vorrichtung und System mit einer derartigen sprachgesteuerten Vorrichtung
US6748088B1 (en) 1998-03-23 2004-06-08 Volkswagen Ag Method and device for operating a microphone system, especially in a motor vehicle
US11328736B2 (en) * 2017-06-22 2022-05-10 Weifang Goertek Microelectronics Co., Ltd. Method and apparatus of denoising

Families Citing this family (127)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2687712B2 (ja) * 1990-07-26 1997-12-08 三菱電機株式会社 一体型ビデオカメラ
DE4407032A1 (de) * 1994-03-03 1995-09-07 Sel Alcatel Ag Vorrichtung zur Sprachsignalverarbeitung
CH689410A5 (de) * 1994-04-21 1999-03-31 Info Byte Ag Verfahren und Vorrichtung zur sprachgesteuerten Fernbedienung elektrischer Verbraucher.
US5828768A (en) * 1994-05-11 1998-10-27 Noise Cancellation Technologies, Inc. Multimedia personal computer with active noise reduction and piezo speakers
US6471420B1 (en) * 1994-05-13 2002-10-29 Matsushita Electric Industrial Co., Ltd. Voice selection apparatus voice response apparatus, and game apparatus using word tables from which selected words are output as voice selections
WO1996011529A1 (en) * 1994-10-06 1996-04-18 Rotunda Thomas J Jr Voice activated transmitter switch
US5774859A (en) * 1995-01-03 1998-06-30 Scientific-Atlanta, Inc. Information system having a speech interface
EP0748476B1 (de) * 1995-01-04 2000-03-29 Koninklijke Philips Electronics N.V. Sprachbetätigte steuerungssystem für gebrauch mit einem konsumerprodukt
US5734727A (en) * 1995-06-07 1998-03-31 Asc Incorporated Sunroof assembly noise attenuation system
AU6646096A (en) 1995-08-03 1997-03-05 Interval Research Corporation Computerized interactor systems and methods for providing same
US5883680A (en) * 1995-10-02 1999-03-16 Innoventions, Inc. Remote control of a television receiver with locator feature or the like
US5818328A (en) * 1995-10-03 1998-10-06 Audio Enhancement Method and system for providing improved wireless audio transmission
US5970457A (en) * 1995-10-25 1999-10-19 Johns Hopkins University Voice command and control medical care system
DE19608869C2 (de) * 1996-03-07 1998-03-26 Daimler Benz Ag Bediensystem, insbesondere für Komponenten in einem Kraftfahrzeug
US5832440A (en) 1996-06-10 1998-11-03 Dace Technology Trolling motor with remote-control system having both voice--command and manual modes
US5777571A (en) * 1996-10-02 1998-07-07 Holtek Microelectronics, Inc. Remote control device for voice recognition and user identification restrictions
US6814293B2 (en) * 1997-02-10 2004-11-09 Symbol Technologies, Inc. Arrangement for and method of establishing a logical relationship among peripherals in a wireless local area network
US8209184B1 (en) * 1997-04-14 2012-06-26 At&T Intellectual Property Ii, L.P. System and method of providing generated speech via a network
AU8581498A (en) * 1997-07-24 1999-02-16 Knowles Electronics, Inc. Universal voice operated command and control engine
US6754546B1 (en) 1997-10-09 2004-06-22 Interval Research Corporation Electronic audio connection system and methods for providing same
US6282206B1 (en) 1997-10-09 2001-08-28 Interval Research Corporation Variable bandwidth communication systems and methods
AU1077399A (en) 1997-10-09 1999-05-03 Interval Research Corporation Variable bandwidth communication systems and methods
US6956497B1 (en) 1997-10-09 2005-10-18 Vulcan Patents Llc Method and apparatus for sending presence messages
CA2306095A1 (en) * 1997-11-20 1999-06-03 Nielsen Media Research, Inc. Voice recognition unit for audience measurement system
DE19811879C1 (de) 1998-03-18 1999-05-12 Siemens Ag Einrichtung und Verfahren zum Erkennen von Sprache
EP0971330A1 (de) * 1998-07-07 2000-01-12 Otis Elevator Company Verbale Fernsteuerungseinrichtung
US6411927B1 (en) 1998-09-04 2002-06-25 Matsushita Electric Corporation Of America Robust preprocessing signal equalization system and method for normalizing to a target environment
KR100753780B1 (ko) * 1999-01-06 2007-08-31 코닌클리케 필립스 일렉트로닉스 엔.브이. 음성 입력 디바이스
US6606280B1 (en) * 1999-02-22 2003-08-12 Hewlett-Packard Development Company Voice-operated remote control
US6407779B1 (en) 1999-03-29 2002-06-18 Zilog, Inc. Method and apparatus for an intuitive universal remote control system
US6624405B1 (en) 1999-04-19 2003-09-23 Capella Microsystems, Inc. BIST for testing a current-voltage conversion amplifier
US6536536B1 (en) 1999-04-29 2003-03-25 Stephen F. Gass Power tools
JP3715469B2 (ja) 1999-06-30 2005-11-09 パイオニア株式会社 音声操作装置
KR100345537B1 (ko) * 1999-07-27 2002-07-26 삼성전자 주식회사 휴대폰의 송수화음 및 키톤 레벨조절방법
JP4897169B2 (ja) * 1999-09-23 2012-03-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 音声認識装置及び消費者電子システム
US6549143B1 (en) * 1999-12-22 2003-04-15 Thomson Licensing, S.A. Universal remote control method and apparatus
US6397186B1 (en) * 1999-12-22 2002-05-28 Ambush Interactive, Inc. Hands-free, voice-operated remote control transmitter
US7319962B2 (en) * 1999-12-24 2008-01-15 Medtronic, Inc. Automatic voice and data recognition for implanted medical device instrument systems
US8271287B1 (en) 2000-01-14 2012-09-18 Alcatel Lucent Voice command remote control system
US6956496B1 (en) 2000-01-18 2005-10-18 Zilog, Inc. Method and apparatus for updating universal remote databases through TV VBI processing
US6980120B2 (en) * 2000-03-10 2005-12-27 Yu Philip K Universal remote control with digital recorder
US7096185B2 (en) 2000-03-31 2006-08-22 United Video Properties, Inc. User speech interfaces for interactive media guidance applications
FR2810145A1 (fr) * 2000-06-07 2001-12-14 Sagem Dispositif mobile et emetteur de telecommande de coffret fixe recepteur de telecommande
DE10058786A1 (de) * 2000-11-27 2002-06-13 Philips Corp Intellectual Pty Verfahren zum Steuerung eines eine akustische Ausgabeeinrichtung aufweisenden Geräts
KR100368289B1 (ko) * 2001-02-20 2003-01-24 (주)성우테크노 음성인식장치를 위한 음성명령식별기
RU2206174C2 (ru) * 2001-03-05 2003-06-10 Журин Дмитрий Вячеславович Способ регулирования громкости звуковоспроизведения и устройства для его реализации
US6747566B2 (en) * 2001-03-12 2004-06-08 Shaw-Yuan Hou Voice-activated remote control unit for multiple electrical apparatuses
US6766290B2 (en) * 2001-03-30 2004-07-20 Intel Corporation Voice responsive audio system
KR100552468B1 (ko) * 2001-07-19 2006-02-15 삼성전자주식회사 음성인식에 따른 오동작을 방지 및 음성인식율을 향상 할수 있는 전자기기 및 방법
ATE279005T1 (de) * 2001-08-21 2004-10-15 Culturecom Technology Macau Lt Verfahren und vorrichtung zur verarbeitung eines klangsignals
US7158499B2 (en) * 2001-09-19 2007-01-02 Mitsubishi Electric Research Laboratories, Inc. Voice-operated two-way asynchronous radio
US20030061033A1 (en) * 2001-09-26 2003-03-27 Dishert Lee R. Remote control system for translating an utterance to a control parameter for use by an electronic device
US20030069733A1 (en) * 2001-10-02 2003-04-10 Ryan Chang Voice control method utilizing a single-key pushbutton to control voice commands and a device thereof
US7324947B2 (en) 2001-10-03 2008-01-29 Promptu Systems Corporation Global speech user interface
US20030095675A1 (en) * 2001-10-19 2003-05-22 Marlow C. Allen Light communication channel-based voice-activated control system and method for implementing thereof
US20030090161A1 (en) * 2001-10-19 2003-05-15 Marlow C. Allen Light communication channel-based electronics power distribution system
US6889191B2 (en) * 2001-12-03 2005-05-03 Scientific-Atlanta, Inc. Systems and methods for TV navigation with compressed voice-activated commands
US7996232B2 (en) * 2001-12-03 2011-08-09 Rodriguez Arturo A Recognition of voice-activated commands
FR2833744A1 (fr) * 2001-12-17 2003-06-20 Thomson Licensing Sa Procede de reconnaissance vocale et, terminal multimedia mettant en oeuvre le procede
US7260538B2 (en) * 2002-01-08 2007-08-21 Promptu Systems Corporation Method and apparatus for voice control of a television control device
KR100438838B1 (ko) * 2002-01-29 2004-07-05 삼성전자주식회사 대화 포커스 추적 기능을 가진 음성명령 해석장치 및 방법
KR20030095897A (ko) * 2002-06-15 2003-12-24 엘지전자 주식회사 UPnP 기반 네트워크의 동기화 방법
US20040006477A1 (en) * 2002-07-05 2004-01-08 Craner Michael L. Voice-controllable communication gateway for controlling multiple electronic and information appliances
US7259906B1 (en) 2002-09-03 2007-08-21 Cheetah Omni, Llc System and method for voice control of medical devices
JP2004233793A (ja) * 2003-01-31 2004-08-19 Toshiba Corp 電子機器および同機器で用いられる遠隔制御方法
US20040152414A1 (en) * 2003-02-04 2004-08-05 Wang David S. Remote control device capable of receiving video signal through a television tuner and displaying the video signal
JP3756882B2 (ja) 2003-02-20 2006-03-15 株式会社東芝 情報処理装置及び情報処理方法
WO2005034395A2 (en) * 2003-09-17 2005-04-14 Nielsen Media Research, Inc. Methods and apparatus to operate an audience metering device with voice commands
WO2005055579A1 (en) * 2003-12-02 2005-06-16 Lynne Moody System for producing artificial telepathy
US20050153596A1 (en) * 2004-01-13 2005-07-14 Vanwambeke Weston Power tool battery connector
US20050202377A1 (en) * 2004-03-10 2005-09-15 Wonkoo Kim Remote controlled language learning system
US6970098B1 (en) 2004-08-16 2005-11-29 Microsoft Corporation Smart biometric remote control with telephony integration method
US20060046845A1 (en) * 2004-08-26 2006-03-02 Alexandre Armand Device for the acoustic control of a game system and application
US7716056B2 (en) * 2004-09-27 2010-05-11 Robert Bosch Corporation Method and system for interactive conversational dialogue for cognitively overloaded device users
TWI295052B (en) * 2004-12-15 2008-03-21 Delta Electronics Inc Method and apparatus for speech control
JP4872241B2 (ja) * 2005-05-31 2012-02-08 船井電機株式会社 テレビ受像機
US20060284735A1 (en) * 2005-06-15 2006-12-21 Michael Ip Data presentation systems and methods
JP4765427B2 (ja) * 2005-06-20 2011-09-07 船井電機株式会社 音声認識機能付きav機器
US7706553B2 (en) * 2005-07-13 2010-04-27 Innotech Systems, Inc. Auto-mute command stream by voice-activated remote control
US7519253B2 (en) 2005-11-18 2009-04-14 Omni Sciences, Inc. Broadband or mid-infrared fiber light sources
US9015740B2 (en) 2005-12-12 2015-04-21 The Nielsen Company (Us), Llc Systems and methods to wirelessly meter audio/visual devices
CN101371472B (zh) * 2005-12-12 2017-04-19 尼尔逊媒介研究股份有限公司 对声音/视觉装置进行无线计量的系统和方法
US20070258614A1 (en) * 2006-05-03 2007-11-08 Altec Lansing, A Division Of Plantronics, Inc. Headphone and portable speaker system
US8090575B2 (en) * 2006-08-04 2012-01-03 Jps Communications, Inc. Voice modulation recognition in a radio-to-SIP adapter
US7769593B2 (en) * 2006-09-28 2010-08-03 Sri International Method and apparatus for active noise cancellation
US8094838B2 (en) * 2007-01-15 2012-01-10 Eastman Kodak Company Voice command of audio emitting device
US20090047022A1 (en) * 2007-08-14 2009-02-19 Kent David Newman Remote Control Device
GB2451907B (en) * 2007-08-17 2010-11-03 Fluency Voice Technology Ltd Device for modifying and improving the behaviour of speech recognition systems
JP5097523B2 (ja) * 2007-12-07 2012-12-12 船井電機株式会社 音声入力装置
CN101192411B (zh) * 2007-12-27 2010-06-02 北京中星微电子有限公司 大距离麦克风阵列噪声消除的方法和噪声消除系统
US9124769B2 (en) 2008-10-31 2015-09-01 The Nielsen Company (Us), Llc Methods and apparatus to verify presentation of media content
US11012732B2 (en) * 2009-06-25 2021-05-18 DISH Technologies L.L.C. Voice enabled media presentation systems and methods
WO2011008164A1 (en) * 2009-07-17 2011-01-20 Milux Holding S.A. A system for voice control of a medical implant
CA2786262A1 (en) 2010-01-07 2011-07-14 Cheetah Omni, Llc Fiber lasers and mid-infrared light sources in methods and systems for selective biological tissue processing and spectroscopy
US8433579B1 (en) 2010-01-25 2013-04-30 Roberto Duran Voice-activated motorized remote control device
US8522283B2 (en) * 2010-05-20 2013-08-27 Google Inc. Television remote control data transfer
US9633656B2 (en) * 2010-07-27 2017-04-25 Sony Corporation Device registration process from second display
KR101450491B1 (ko) * 2010-08-27 2014-10-13 인텔 코오퍼레이션 원격 제어형 장치들의 트랜스코더 가능 클라우드
US8677385B2 (en) 2010-09-21 2014-03-18 The Nielsen Company (Us), Llc Methods, apparatus, and systems to collect audience measurement data
JP5039214B2 (ja) * 2011-02-17 2012-10-03 株式会社東芝 音声認識操作装置及び音声認識操作方法
JP6031761B2 (ja) * 2011-12-28 2016-11-24 富士ゼロックス株式会社 音声解析装置および音声解析システム
US9947333B1 (en) * 2012-02-10 2018-04-17 Amazon Technologies, Inc. Voice interaction architecture with intelligent background noise cancellation
CN102969003A (zh) * 2012-11-15 2013-03-13 东莞宇龙通信科技有限公司 摄像声音提取方法及装置
US10565862B2 (en) 2012-11-27 2020-02-18 Comcast Cable Communications, Llc Methods and systems for ambient system control
KR101428245B1 (ko) * 2012-12-05 2014-08-07 현대자동차주식회사 음성 인식 장치 및 방법
US9993159B2 (en) 2012-12-31 2018-06-12 Omni Medsci, Inc. Near-infrared super-continuum lasers for early detection of breast and other cancers
US10660526B2 (en) 2012-12-31 2020-05-26 Omni Medsci, Inc. Near-infrared time-of-flight imaging using laser diodes with Bragg reflectors
US9500634B2 (en) 2012-12-31 2016-11-22 Omni Medsci, Inc. Short-wave infrared super-continuum lasers for natural gas leak detection, exploration, and other active remote sensing applications
EP3184038B1 (de) 2012-12-31 2019-02-20 Omni MedSci, Inc. Aufbissschiene mit kurzwellige infrarot-superkontinuumlaser zur frühzeitigen erkennung von karies
CA2895969A1 (en) 2012-12-31 2014-07-03 Omni Medsci, Inc. Near-infrared lasers for non-invasive monitoring of glucose, ketones, hba1c, and other blood constituents
WO2014143276A2 (en) 2012-12-31 2014-09-18 Omni Medsci, Inc. Short-wave infrared super-continuum lasers for natural gas leak detection, exploration, and other active remote sensing applications
CN105009205B (zh) * 2013-03-08 2019-11-05 索尼公司 用于启用网络的设备上的语音识别输入的方法和系统
US9854081B2 (en) 2013-03-15 2017-12-26 Apple Inc. Volume control for mobile device using a wireless device
JP6111795B2 (ja) * 2013-03-28 2017-04-12 富士通株式会社 信号処理装置、及び信号処理方法
CN104750257A (zh) * 2013-12-30 2015-07-01 鸿富锦精密工业(武汉)有限公司 键盘组合及语音识别方法
KR102265931B1 (ko) 2014-08-12 2021-06-16 삼성전자주식회사 음성 인식을 이용하는 통화 수행 방법 및 사용자 단말
CN105575398A (zh) * 2014-10-11 2016-05-11 中兴通讯股份有限公司 声音降噪方法及终端
US9786262B2 (en) 2015-06-24 2017-10-10 Edward Villaume Programmable noise reducing, deadening, and cancelation devices, systems and methods
DE102015212028A1 (de) * 2015-06-29 2016-12-29 Robert Bosch Gmbh Bedienvorrichtung für eine Handwerkzeugmaschine
KR102471499B1 (ko) * 2016-07-05 2022-11-28 삼성전자주식회사 영상처리장치, 영상처리장치의 구동방법 및 컴퓨터 판독가능 기록매체
KR20180023617A (ko) 2016-08-26 2018-03-07 삼성전자주식회사 외부 기기를 제어하는 휴대 기기 및 이의 오디오 신호 처리 방법
US10375473B2 (en) * 2016-09-20 2019-08-06 Vocollect, Inc. Distributed environmental microphones to minimize noise during speech recognition
JP6919710B2 (ja) 2017-09-14 2021-08-18 株式会社ソシオネクスト 電子機器制御システム、音声出力装置及びそれらの方法
CN110315481B (zh) * 2018-03-30 2023-07-21 株式会社牧田 集尘机
FR3085216B1 (fr) * 2018-08-24 2021-04-16 Thomas Guillaumin Assistant virtuel
CN110610602A (zh) * 2019-10-17 2019-12-24 恩平市力卡电子有限公司 一种自动启闭会议话筒单元的无线会议系统及其控制方法
US20220329938A1 (en) * 2021-04-08 2022-10-13 Vizio, Inc. Systems and methods for selectively powering tv remote microphones

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2755633A1 (de) * 1977-12-14 1979-06-21 Loewe Opta Gmbh Fernsteuerung zum steuern, ein- und umschalten von variablen und festen geraetefunktionen und funktionsgroessen in nachrichtentechn. geraeten
US4239936A (en) * 1977-12-28 1980-12-16 Nippon Electric Co., Ltd. Speech recognition system

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1604167A (en) * 1974-09-25 1981-12-02 Ard Tech Ass Eng Microphone units
DE2640324A1 (de) * 1976-09-08 1978-03-09 Kock Einrichtung zur gewinnung eines elektrischen nutzsignales
JPS5870287A (ja) * 1981-10-22 1983-04-26 日産自動車株式会社 音声認識装置
JPS5964994A (ja) * 1982-10-05 1984-04-13 Matsushita Electric Ind Co Ltd マイクロホン装置
US4725956A (en) * 1985-10-15 1988-02-16 Lockheed Corporation Voice command air vehicle control system
CA1293693C (en) * 1985-10-30 1991-12-31 Tetsu Taguchi Noise canceling apparatus
GB8630118D0 (en) * 1986-12-17 1987-01-28 British Telecomm Speaker identification
US4827520A (en) * 1987-01-16 1989-05-02 Prince Corporation Voice actuated control system for use in a vehicle
US4815134A (en) * 1987-09-08 1989-03-21 Texas Instruments Incorporated Very low rate speech encoder and decoder
JP2551050B2 (ja) * 1987-11-13 1996-11-06 ソニー株式会社 有音無音判定回路

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2755633A1 (de) * 1977-12-14 1979-06-21 Loewe Opta Gmbh Fernsteuerung zum steuern, ein- und umschalten von variablen und festen geraetefunktionen und funktionsgroessen in nachrichtentechn. geraeten
US4239936A (en) * 1977-12-28 1980-12-16 Nippon Electric Co., Ltd. Speech recognition system

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5400409A (en) * 1992-12-23 1995-03-21 Daimler-Benz Ag Noise-reduction method for noise-affected voice channels
DE4307688A1 (de) * 1993-03-11 1994-09-15 Daimler Benz Ag Verfahren zur Geräuschreduktion für gestörte Sprachkanäle
DE19712632A1 (de) * 1997-03-26 1998-10-01 Thomson Brandt Gmbh Verfahren und Vorrichtung zur Sprachfernsteuerung von Geräten
DE19748267A1 (de) * 1997-09-16 1999-06-17 Michael Kaiser Sprachgesteuertes Fernbedienungsgerät
US6748088B1 (en) 1998-03-23 2004-06-08 Volkswagen Ag Method and device for operating a microphone system, especially in a motor vehicle
EP1079371A1 (de) * 1999-08-26 2001-02-28 Matsushita Electric Industrial Co., Ltd. Universelle Fernsteuerung für Fernseh- und Multimediaprogrammsuchen und -programmanforderungen mit natürlicher Sprache
US6553345B1 (en) 1999-08-26 2003-04-22 Matsushita Electric Industrial Co., Ltd. Universal remote control allowing natural language modality for television and multimedia searches and requests
DE19963142A1 (de) * 1999-12-24 2001-06-28 Christoph Bueltemann Verfahren und Vorrichtung zur sprachgesteuerten Bedienung eines Kiosksystems
DE10002321A1 (de) * 2000-01-20 2001-08-02 Infineon Technologies Ag Sprachgesteuerte Vorrichtung und System mit einer derartigen sprachgesteuerten Vorrichtung
DE10002321C2 (de) * 2000-01-20 2002-11-14 Micronas Munich Gmbh Sprachgesteuerte Vorrichtung und System mit einer derartigen sprachgesteuerten Vorrichtung
US11328736B2 (en) * 2017-06-22 2022-05-10 Weifang Goertek Microelectronics Co., Ltd. Method and apparatus of denoising

Also Published As

Publication number Publication date
US5267323A (en) 1993-11-30
DE4029697C2 (de) 1998-05-20

Similar Documents

Publication Publication Date Title
DE4029697A1 (de) Sprachgesteuertes fernbedienungssystem
DE60217444T2 (de) Sprachgesteuertes elektronisches Gerät
DE4029698A1 (de) Sprachgesteuertes fernbedienungssystem
DE19629184C2 (de) Sprachgesteuerte Aufzeichnungsvorrichtung
DE69829802T2 (de) Spracherkennungsapparat zum Übertragen von Sprachdaten auf einem Datenträger in Textdaten
DE4029717A1 (de) Sprachgesteuertes fernbedienungssystem
EP1118979B1 (de) Sprachgesteuerte Vorrichtung
DE10122828A1 (de) Verfahren zum Training oder zur Adaption eines Spracherkenners
DE102012103553A1 (de) Audiosystem und verfahren zur verwendung von adaptiver intelligenz, um den informationsgehalt von audiosignalen in verbraucheraudio zu unterscheiden und eine signalverarbeitungsfunktion zu steuern
DE10054583C2 (de) Verfahren und Vorrichtung zum Aufzeichnen, Suchen und Wiedergeben von Notizen
DE69918635T2 (de) Vorrichtung und Verfahren zur Sprachverarbeitung
DE69532026T2 (de) Schaltung zum automatischen Variieren des Pegels eines Empfangssprachsignals in einem Fernprechgerät
EP0989775B1 (de) Hörgerät mit Einrichtung zur Signalqualitätsüberwachung
EP0906620A1 (de) Einrichtung und verfahren zum aufzeichnen eines informationssignales in einem aufzeichnungsträger
DE69922769T2 (de) Vorrichtung und Verfahren zur Sprachverarbeitung
EP0467157B1 (de) Sprachgesteuertes Gerät der Unterhaltungselektronik, insbesondere Videorecorder
DE60022269T2 (de) Sprachbasiertes Manipulationsverfahren und -gerät
DE10004284A1 (de) Tragbares Datenaufnahme- und/oder Datenwiedergabegerät
US5083493A (en) Electronic musical instrument having key transpose function and a method therefor
DE4029716C2 (de) Sprachgesteuertes Fernbedienungssystem
DE112020005717T5 (de) Erkennung von live-sprache
DE4029702A1 (de) Sprachgesteuertes fernbedienungssystem und verfahren zur dekodierung von befehlen in diesem system
DE2831078A1 (de) Bandaufzeichnungs- und wiedergabegeraet
EP1064639B1 (de) Gerät zur wiedergabe von informationen bzw. zur ausführung von funktionen
DE10060295A1 (de) Verfahren zum Abspeichern von akustischen Informationen und Verfahren zum Auswählen von einer nach diesem Verfahren abgespeicherten Information

Legal Events

Date Code Title Description
8120 Willingness to grant licences paragraph 23
8110 Request for examination paragraph 44
D2 Grant after examination
8363 Opposition against the patent
8330 Complete disclaimer