DE69822128T2 - Anordnung zur verarbeitung von audiosignalen aus mehreren quellen - Google Patents

Anordnung zur verarbeitung von audiosignalen aus mehreren quellen Download PDF

Info

Publication number
DE69822128T2
DE69822128T2 DE69822128T DE69822128T DE69822128T2 DE 69822128 T2 DE69822128 T2 DE 69822128T2 DE 69822128 T DE69822128 T DE 69822128T DE 69822128 T DE69822128 T DE 69822128T DE 69822128 T2 DE69822128 T2 DE 69822128T2
Authority
DE
Germany
Prior art keywords
audio signals
processing
combined
arrangement
processed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
DE69822128T
Other languages
English (en)
Other versions
DE69822128D1 (de
Inventor
Jan Harm BELT
Pieter Cornelis JANSE
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Application granted granted Critical
Publication of DE69822128D1 publication Critical patent/DE69822128D1/de
Publication of DE69822128T2 publication Critical patent/DE69822128T2/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10KSOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
    • G10K15/00Acoustics not otherwise provided for
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0211Frequency selective networks using specific transformation algorithms, e.g. WALSH functions, Fermat transforms, Mersenne transforms, polynomial transforms, Hilbert transforms
    • H03H17/0213Frequency domain filters using Fourier transforms
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0223Computation saving measures; Accelerating measures
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H17/00Networks using digital techniques
    • H03H17/02Frequency selective networks
    • H03H17/0294Variable filters; Programmable filters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H21/00Adaptive networks
    • H03H21/0012Digital adaptive filters
    • H03H21/0018Matched filters
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H21/00Adaptive networks
    • H03H21/0012Digital adaptive filters
    • H03H21/0025Particular filtering methods
    • H03H21/0027Particular filtering methods filtering in the frequency domain
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03HIMPEDANCE NETWORKS, e.g. RESONANT CIRCUITS; RESONATORS
    • H03H21/00Adaptive networks
    • H03H21/0012Digital adaptive filters
    • H03H21/0067Means or methods for compensation of undesirable effects
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/02Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/301Automatic calibration of stereophonic sound system, e.g. with test microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02082Noise filtering the noise being echo, reverberation of the speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02166Microphone arrays; Beamforming

Description

  • Die vorliegende Erfindung bezieht sich auf eine Anordnung zum Verarbeiten von Audiosignalen mit einer Anzahl Audioquellen, die Eingangs-Audiosignale erzeugen, mit Verarbeitungsmitteln zum Herleiten verarbeiteter Audiosignale aus den Eingangs-Audiosignalen, wobei die Anordnung zum Verarbeiten von Audiosignalen Kombiniermittel aufweist zum Herleiten eines kombinierten Audiosignals aus den verarbeiteten Audiosignalen.
  • Die vorliegende Erfindung bezieht sich ebenfalls auf eine Audio-Signalverarbeitungsanordnung und auf ein Audio-Verarbeitungsverfahren.
  • Eine Audio-Verarbeitung nach der vorliegenden Erfindung ist aus dem Artikel: "A Signal Subspace Tracking Algorithm for Microphone Array Processing of Speech" von S. Affes und Y.Grenier in "IEEE Transactions on Speech and Audio Processing" Haft 5, Nr. 5, September 1997 bekannt.
  • Bei den heutigen und den künftigen Kommunikationssystemen, wie Mobiltelephonie, Video-Konferenz und Internet (TCP/IP) basierte Kommunikation wird Handfreibetrieb immer wichtiger. Auch in Benutzerschnittstellen, die Spracherkennung benutzen spielt Handfreibetrieb eine wichtige Rolle.
  • Ein akustisches Phänomen, das die Sprachverständlichkeit beeinträchtigt ist Nachhall durch die Mehrwegeausbreitung von dem Sprecher zu dem Mikrophon. Diese Mehrwegeausbreitung wird verursacht durch Reflexion der Sprachsignale an der Umgebung des Lautsprechers, wie einer Wand, Möbeln usw. Um diese Mehrwegeausbreitung zu meistern wird oft ein sog. Verzögerungs-Summen-Bündelformer verwendet. Bei einem Verzögerungs-Summen-Bündelformer werden Signale von einer Anzahl Mikrophone einem Verzögerungswert ausgesetzt, damit die Verzögerungsdifferenzen zwischen dem Sprecher und den betreffenden Mikrophonen ausgeglichen werden. Die verzögerten Signale werden dadurch kombiniert, dass sie addiert werden. Wenn die Verzögerungskompensation einwandfrei wirkt, werden die direkten Feldkomponenten der verzögerungskompensierten Audiosignale kohärent addiert, während die nachhallenden Sprachkomponenten inkohärent addiert werden. Dies wird zu einer Zunahme der Sprachverständlichkeit führen.
  • Ein Problem bei dem Verzögerungs-Summen-Bündelformer ist, dass es sehr schwer ist, die Verzögerungswerte genau und schnell genug zu ermitteln um einem sich bewegenden Sprecher zu folgen oder an eine andere Person, die zu sprechen anfängt, anzupassen. Dies ist insbesondere der Fall in Räumen mit starkem Nachhall. Dadurch können die Verzögerungsschätzungen falsch sein und die Mikrophonsignale werden nicht länger kohärent addiert. Folglich wird keine Verbesserung der Sprachverständlichkeit erhalten. Es kann sogar passieren, dass die Sprachverständlichkeit degradiert.
  • In dem obengenannten Artikel wird ein Verfahren beschrieben zur Verbesserung der Leistung der Verständlichkeit des Sprachsignals. In dem genannten Artikel wird Gebrauch gemacht von einer Energieübertragungsfunktion von dem Sprecher auf die Mikrophone unter der Voraussetzung, dass diese Energieübertragungsfunktion sich nicht wesentlich ändert, wenn der Sprecher sich bewegt. Die obengenannte Energieübertragungsfunktion soll durch Messungen bestimmt werden. Die Anforderung, dass für jede Stelle Messungen durchgeführt werden müssen, macht die Anwendung von Produkten unter Anwendung dieses Verfahrens ziemlich aufwendig.
  • Die Aufgabe der vorliegenden Erfindung, wie in den beiliegenden Patentansprüchen beansprucht, ist, eine Audio-Verarbeitungsanordnung zu schaffen, wobei vor Anwendung der Audio-Verarbeitungsanordnung keine Messungen brauchen durchgeführt zu werden.
  • Um diese Aufgabe zu erfüllen, weist die Audio-Verarbeitungsanordnung nach der vorliegenden Erfindung das Kennzeichen auf, dass die Anordnung zum Verarbeiten von Audiosignalen Steuermittel umfasst zum Steuern der Verarbeitungsmittel zum Maximieren einer Leistungsgröße des kombinierten Audiosignals, und dass die Steuermittel vorgesehen sind zum Begrenzen einer Summe der Leistungsverstärkungen der Verarbeitungsmittel der verarbeiteten Audiosigale auf einen vorbestimmten Wert.
  • Durch Maximierung einer Leistungsgröße des kombinierten Audiosignals unter der Beschränkung, dass eine kombinierte Leistungsverstärkungsgröße (beispielsweise die Summe der Leistung der einzelnen Signale) auf einen vorbestimmten Wert begrenzt wird, brauchen keine gemessenen Daten verwendet zu werden. Versuche haben gezeigt, dass die Verständlichkeit des Sprachsignals gegenüber der bekannten Anordnung nicht verschlechtert wird.
  • Versuche haben ebenfalls gezeigt, dass bei der bekannten Anordnung sog. Vorechos auftreten, wenn Filter mit einer langen Impulsreaktion verwendet werden. Vorechos treten auf, wenn vor der Wiedergabe der direkten Feldkomponente des Sprachsignals eine skalierte Version davon wiedergegeben wird. Das Auftreten von Vorechos wird von einem Zuhörer als ziemlich störend erfahren. Versuche haben auch gezeigt, dass bei der Verarbeitungsanordnung nach der vorliegenden Erfindung das Auftreten von Vorechos wesentlich geringer ist als bei der Verarbeitungsanordnung nach dem Stand der Technik.
  • Eine Ausführungsform der vorliegenden Erfindung weist das Kennzeichen auf, dass die Verarbeitungsmittel Skalierungsmittel umfassen zum Skalieren der Eingangs-Audiosignale mit einem Skalierungsfaktor zum Erhalten des verarbeiteten Audiosignals, wobei die genannten Steuermittel weitere Skalierungsmittel umfassen zum Herleiten einer Anzahl skalierter kombinierter Audiosignale mit einem Skalierungsfaktor entsprechend dem Skalierungsfaktor der Skalierungsmittel und dass die Steuermittel vorgesehen sind zum Maximieren einer Leistungsgröße des kombinierten Audiosignals und zum Begrenzen einer kombinierten Leistungsverstärkungsgröße der verarbeiteten Audiosignale durch Minimierung einer Differenz zwischen den Eingangs-Audiosignalen und den skalierten kombinierten Audiosignalen entsprechend den genannten Audiosignalen.
  • Versuche haben gezeigt, dass unter Anwendung eines einfachen Skalierungsfaktors als Verarbeitungsmittel eine sehr wesentliche Verbesserung der Verständlichkeit erhalten werden kann. Eine geeignete Beschränkung ist nun, dass die Summe der Quadrate der Skalierungsfaktoren für die jeweiligen Eingangsquellen einer vorbestimmten Konstanten entspricht.
  • Eine weitere Ausführungsform der vorliegenden Erfindung weist das Kennzeichen auf, dass die Verarbeitungsmittel eine Anzahl einstellbarer Filter umfassen zum Herleiten des verarbeiteten Audiosignals, dass die Steuermittel eine Anzahl weiterer einstellbarer Filter mit einer Übertragungsfunktion umfassen, die das Konjugierte der Übertragungsfunktion der einstellbarer Filter ist, wobei die genannten weiteren einstellbaren Filter vorgesehen sind zum Herleiten gefilterter kombinierter Audiosignale aus dem kombinierten Audiosignal, und dass die Steuermittel vorgesehen sind zum Maximieren der Leistungsgröße des kombinierten Audiosignals und zum Beschränken einer kombinierten Verstärkungsgröße der verarbeiteten Audiosignale auf einen vorbestimmten Wert durch Steuerung der Übertragungsfunktionen der einstellbaren Filter und der weiteren einstellbaren Filter zum Minimieren einer Differenz zwischen den Eingangs-Audiosignalen und dem gefilterten kombinierten Audiosignal entsprechend den genannten Eingangs-Audiosignalen.
  • Durch Verwendung einstellbarer Filter als Verarbeitungsmittel kann die Qualität des Sprachsignals weiter verbessert werden. Durch Minimierung einer Differenzgröße zwischen dem Eingangs-Audiosignal und dem entsprechenden gefilterten kombinierten Audiosignal wird erreicht, dass eine Leistungsgröße des kombinierten Audiosignals unter der Beschränkung, dass je Frequenzkomponente die Summe der Leistungsverstärkungen der einstellbaren Filter einer vorbestimmten Konstanten entspricht, maximiert wird. Die Übereinstimmung zwischen den zwei oben genannten Kriterien wird unter Verwendung eines vereinfachten Beispiels in der detaillierten Beschreibung der Zeichnung dargestellt.
  • Die Verwendung einstellbarer Filter macht, dass keine einstellbaren Verzögerungselemente, wie diese in einem Summen-Verzögerungsbündelformer verwendet werden, erforderlich sind.
  • Eine weitere Ausführungsform der vorliegenden Erfindung weist das Kennzeichen auf, dass die Audioquellen eine Anzahl Mikrophone umfassen und dass die Mikrophone sich in einer derartigen Lage befinden, dass ihre Richtungsmuster im Wesentlichen getrennt sind.
  • Dadurch, dass eine Anzahl Mikrophone mit verschiedenen Richtungsmustern mit Hilfe der Kombinieranordnung nach der vorliegenden Erfindung kombiniert werden, wird erreicht, dass das Signal von dem Mikrophon, welches das stärkste Sprachsignal empfängt, automatisch hervorgehoben wird. Ein derartiges System kann auf vorteilhafte Weise in einem Konferenzsystem verwendet werden, in dem der von einer sprechenden Person erzeugte Schall hervorgehoben werden soll, ohne dass es dabei notwendig ist, dass es einen Schalter gibt, der imstande ist das Mikrophon mit dem stärksten Signal zu selektieren.
  • Eine weitere Ausführungsform der vorliegenden Erfindung weist das Kennzeichen auf, dass die Audioquellen eine Anzahl Mikrophone umfassen, die in einer linearen Anordnung aufgestellt sind.
  • Versuche haben gezeigt, dass, wenn eine lineare Anordnung von Mikrophonen als Audioquelle in Kombination mit einstellbaren Filtern in den Verarbeitungsmitteln verwendet wird, die Sprachsignale und deren erste Reflexionen kohärent addiert werden, was zu einer Verbesserung der Sprachverständlichkeit führt. Diese Es hat sich herausgestellt, dass diese Konfiguration robuster ist und eine viel schnellere Konvergenz zeigte als die Konfiguration mit einem Summen-Verzögerungsbündelformer. Es hat sich gezeigt, dass in der linearen Anordnung die Mikrophone auf einer Linie angeordnet werden, und zwar im Wesentlichen orthogonal zu der Richtung der Hauptkeule des Richtungsmusters, dass es aber auch möglich ist, dass die Mikrophone auf einer Linie angeordnet werden, die mit der Richtung der Hauptkeule des Richtungsmusters zusammenfällt.
  • Ausführungsbeispiele der Erfindung sind in der Zeichnung dargestellt und werden im vorliegenden Fall näher beschrieben. Es zeigen:
  • 1 eine Audio-Verarbeitungsanordnung nach der vorliegenden Erfindung, wobei real bewertete Gewichtungsfaktoren in den Verarbeitungsmitteln verwendet werden,
  • 2 eine Audioverarbeitungsanordnung nach der vorliegenden Erfindung, wobei Frequenzbereich-adaptive und Frequenzbereich-programmierbare Filter verwendet werden,
  • 3 eine detaillierte Darstellung einer Ausführungsform der Normalisationsmittel 73, die in der Anordnung nach 2 verwendet werden,
  • 4 eine Implementierung der Frequenzbereich-adaptiven Filter 62, 66 und 68, die in 2 verwendet werden,
  • 5 eine Implementierung der Frequenzbereich-programmierbaren Filter 44, 46 und 50, die in 2 verwendet werden,
  • 6 eine Implementierung der Audio-Verarbeitungsanordnung nach der vorliegenden Erfindung, wobei Zeitbereich-adaptive Filter und Zeitbereich-programmierbare Filter verwendet werden.
  • In der Audio-Verarbeitungsanordnung 2 nach 1 wird ein Ausgang einer ersten Audio-Quelle, in diesem Fall eines Mikrophons 4, mit einem ersten Eingang der Audio-Verarbeitungsanordnung 2 verbunden und ein Ausgang einer zweiten Audio-Quelle, in diesem Fall eines Mikrophons 6, wird mit einem zweiten Eingang der Audio-Verarbeitungsanordnung 2 verbunden. Wenn vorausgesetzt wird, dass die Mikrophone 4 und 6 über Dämpfungsfaktoren a und b ein Signal VIN empfangen, ist das Ausgangssignal des Mikrophons 4 gleich a·VIN und das Ausgangssignal des Mikrophons 6 ist gleiche b·VIN. Die Verarbeitungsmittel enthalten in diesem Fall erste Skalierungsmittel 10 und zweite Skalie rungsmittel 12, die ihre Eingangssignale mit einem Skalierungsfaktor x bzw. y skalieren. Am Ausgang der Verarbeitungsmittel 11 sind die verarbeiteten Signale VP und VQ verfügbar. Für diese verarbeiteten Signale kann Folgendes geschrieben werden: Vp = a · x · VIN (1)und VQ = b · y · VIN (2)
  • An dem Ausgang der Kombiniermittel 18 ist die Summe VSUM der verarbeiteten Signale VP und VQ verfügbar. Dieses Signal VSUM ist gleich: VSUM = (a · x + b · Y)VIN (3)
  • Die weiteren Skalierungsmittel 14 und 16 leiten skalierte kombinierte Signale von dem kombinierten Signal her, und zwar unter Anwendung von Skalierungsfaktoren x und y. Das erste skalierte kombinierte Signal ist gleich VSC1 = (a · x + b · Y)· x · VIV (4)und das zweite skalierte kombinierte Signale ist gleich: VSC2 = (a · x + b · Y) · Y · VIN (5)
  • Eine erste Differenzgröße zwischen dem ersten Eingangs-Audiosignal und dem ersten skalierten kombinierten Audiosignal wird durch einen Subtrahierer 24 bestimmt. Für das Ausgangssignal des Subtrahierers 24 lässt sich Folgendes schreiben: VDIFFI = {a – (a · x + b · y) · x · VIN (6)
  • Eine zweite Differenzgröße zwischen dem zweiten Eingangs-Audiosignal und dem zweiten skalierten kombinierten Audiosignal wird durch einen Subtrahierer 26 bestimmt. Für das Ausgangssignal des Subtrahierers 26 lässt sich Folgendes schreiben: VDIFF2 = {b – (a · x + b · y) · y · VIN (7)
  • Die Anordnung nach 1 umfasst ein Steuerelement 20 zum Einstellen des Skalierungsfaktors x, damit das Ausgangssignal VDIFF1 des Subtrahierers 24 gleich 0 gemacht wird. Die Anordnung umfasst weiterhin ein Steuerelement 22 um das Ausgangssignal VDIFF2 des Subtrahierers 26 gleich 0 zu machen. Um die Werte für x und y zu finden, um die beiden Differenzsignale gleich 0 zu machen, soll der nachfolgende Satz von Gleichungen gelöst werden. (a · x + b · y) · x = a (8) (a · x + b · y) · Y = b (9)
  • Eliminierung des Terms (a · x + b · y) aus (8) und (9) dadurch, dass (8) durch (9) geteilt wird, führt zu:
  • Figure 00070001
  • Substitution von (10) in (9) ergibt den nachfolgenden Ausdruck in y:
  • Figure 00070002
  • Substitution von (11) in (10) ergibt für x:
  • Figure 00070003
  • Aus (11) und (12) dürfte einleuchten, dass der Wert von x zunimmt, wenn a zunimmt (oder b abnimmt) und dass der Wert von y zunimmt, wenn b zunimmt (oder a abnimmt). Auf eine derartige Weise wird das stärkste Eingangssignal hervorgehoben. Dies ist üblich zur Verbesserung eines Sprachsignals eines Sprechers gegenüber Hintergrundgeräuschen und Nachhallkomponenten des Sprachsignals ohne dass es erforderlich ist, dass man die Frequenzabhängigkeit der Strecke a und b von der Sprecher zu den Mikrophonen kennt, wie dies bei der bekannten Anordnung erforderlich war. Eine Schätzung der Werte a und b kann aus einem mittleren Pegel der Eingangssignale des Mikrophons hergeleitet werden.
  • Nachstehend wird dargelegt, dass eine Maximierung der Leistung des kombinierten Audiosignals unter der Beschränkung, dass die Summe der Leistungsverstärkungen der Verarbeitungsmittel begrenzt ist, zu denselben Werten für x und y führt, wie die Maßnahme, dass die Ausgangssignale der Subtrahierer 24 und 26 gleich 0 gemacht werden.
  • Für die Leistungsgröße PSUM des kombinierten Audiosignals VSUM lässt sich Folgendes schreiben: PSUM = VSUM 2 = (a · x + b · y)2 · VIN 2 (13)
  • Für die Grenzbedingung, dass die Summe der Leistungsverstärkungen der Skalierungsmittel auf einen konstanten Wert begrenzt ist, lässt sich sagen: Gp = X2 + Y2 = 1 (14)
  • Folglich soll der Term (a · x + b · y)2 unter der Grenzbedingung x2 + y2 – 1 = 0 maximiert werden. Dies kann dadurch erfolgen, dass das bekannte Lagrange-Multiplizierverfahren angewandt wird. Nach dem genannten Verfahren soll der nachfolgende Ausdruck maximiert werden: (a · x + b · y)2 + λ · (x2 + y2 – 1) (15)
  • Differenzierung (15) in Bezug auf x und y und Einstellung der Hergeleiteten auf Null ergibt: 2 · (a · x + b · y)· a + 2 · λ · x = 0 (16) 2 · (a· x + b · y)· b + 2· λ · y = 0 (17)
  • Durch Multiplikation (16) mit y und durch Multiplikation (17) mit x und durch Subtraktion der Ergebnisse entsteht:
  • Figure 00080001
  • Substitution (18) in (14) ergibt für x und y:
  • Figure 00080002
  • Diese Ergebnisse entsprechen (11) und (12). Folglich dürfte es einleuchten, dass Steuerung von x und y um die Differenzsignale gleich 0 zu machen, gleichwertig ist mit einer Maximierung der Leistung des kombinierten Signals unter der Grenzbedingung, dass die Summe der Leistungsverstärkungen der verschiedenen Zweige der Verarbeitungsmittel auf einen maximalen Wert begrenzt ist.
  • Obenstehendes kann auf einfache Weise für N Eingangssignale verallgemeinert werden, die je einen Übertragungsfaktor ai haben, wobei 1 ≤1 ≤N ist. Wenn vorausgesetzt wird, dass die Verarbeitungsmittel N Zweige haben, die je einem Signal i entsprechen und einen Übertragungsfaktor x; haben, kann für diese Werte von x; Folgendes geschrieben werden:
    Figure 00080003
  • Die Anordnung nach 1 kann mit Verzögerungselementen kombiniert werden um Differenzen in den Streckenverzögerungen von der Quelle des Audiosignals und den jeweiligen Mikrophonen zu kompensieren. Die Anordnung nach der vorliegenden Erfindung liefert eine verbesserte Leistung, auch während der Übergangsperioden, in denen der Verzögerungswert der Verzögerungselemente zum Kompensieren der Streckenverzögerungen noch nicht auf ihren optimalen Wert eingestellt sind.
  • In der Audio-Verarbeitungsanordnung nach 2 werden Eingangssignale von Audioquellen, die hier Mikrophone 30, 32 und 34 sind, in digitale Signale umgewan delt, die durch betreffende Reihe-Parallel-Wandler 36, 38 bzw. 40 in Blöcke von L Abtastwerten umgewandelt werden. Die Ausgänge der Reihe-Parallel-Wandler 36, 38 und 40 sind mit entsprechenden Eingängen der Verarbeitungsmittel 41 und mit dem Eingang betreffender Blockverzögerungselemente 54, 56 und 58 verbunden.
  • In den Verarbeitungsmitteln 41 wird das Ausgangssignal des Reihe-Parallel-Wandlers 36 einer Blockverkettungseinheit 42 zugeführt. Die Blockverkettungseinheit 42 konstruiert Blöcke von N+L Abtastwerten aus dem vorhandenen Block von L Abtastwerten und N Abtastwerten aus vorhergehenden Blöcken von Abtastwerten, die an dem Ausgang des Reihe-Parallel-Wandlers 36 verfügbar sind. Der Ausgang der Blockverkettungseinheit 42 ist mit einem Eingang eines Frequenzbereich-programmierbaren Filters 44 verbunden. Der Ausgang des Frequenzbereich-programmierbaren Filters 44, der ein verarbeitetes Audiosignal trägt, ist mit einem ersten Eingang des Kombiniermittels, das hier ein Addierer 76 ist, verbunden. Das Frequenzbereich-programmierbare Filter 44 präsentiert Blöcke mit N+L Abtastwerten an dem Ausgang.
  • Auf dieselbe Art und Weise wird das Ausgangssignal des Reihe-Parallel-Wandlers 38 durch eine Blockverkettungseinheit 48 und ein Frequenzbereich-programmierbares Filter 46 verarbeitet und das Ausgangssignal des Reihe-Parallel-Wandlers 40 wird durch eine Blockverkettungseinheit 52 und ein Frequenzbereich-programmierbares Filter 50 verarbeitet. Ausgänge der Frequenzbereich-programmierbaren Filter 46 und 50, die verarbeitete Audiosignale tragen, sind mit entsprechenden Eingängen des Addierers 76 verbunden.
  • Der Ausgang des Addierers 76 ist mit einem Eingang einer IFFT-Einheit 77 verbunden, die ein "Inverse Fast Fourier Transformed" Signal von dem Ausgangssignal des Addierers 76 bestimmt. Der Ausgang der IFFT-Einheit 77 ist mit einem Eingang einer Einheit 78 verbunden, die N Abtastwerte der N+L Abtastwerte an dem Ausgang der IFFT-Einheit 77 verwirft.
  • Das Ausgangssignal der Einheit 77 wird durch den Parallel-Reihe-Wandler 78 in einen seriellen Strom von Abtastwerten umgewandelt. An dem Ausgang des Wandlers 78 ist das Ausgangssignal der Audio-Verarbeitungsanordnung verfügbar. Das Ausgangssignal der Einheit 79 wird ebenfalls einer Blockverkettungseinheit 74 zugeführt, die Blöcke mit N+L Abtastwerten von dem vorhandenen Block mit L Abtastwerten an dem Ausgang des Addierers 76 und von einem Block mit N vorhergehenden Abtastwerten an dem Ausgang der Einheit 79 herleitet. Der Ausgang der Blockverkettungseinheit 74 ist mit einem Eingang eines schnellen Fourier-Transformators 72 verbunden, der aus den N+L Abtastwerten an dem Eingang eine N+L Punkte FFT berechnet. Das Ausgangssignal des schnellen Fourier Transformators 72 stellt das Frequenzspektrum des kombinierten Signals dar. Dieses Frequenzspektrum wird Eingängen von Frequenzbereich-adaptiven Filtern 62, 66 und 68, sowie einem Eingang einer Normalisierers 73 zugeführt. Ein Ausgang des Normalisierers 73 ist mit Eingängen der Frequenzbereich-adaptiven Filter 62, 66 und 68 verbunden.
  • Der Ausgang des Blockverzögerungselementes 54 ist mit einem ersten Eingang eines Subtrahierers 60 verbunden. Der Ausgang des Blockverzögerungselementes 56 ist mit einem ersten Eingang eines Subtrahierers 64 verbunden und der Ausgang des Blockverzögerungselementes 58 ist mit einem ersten Eingang eines Subtrahierers 70 verbunden. Die Blockverzögerungselemente 54, 56 und 58 sind vorhanden zum Kompensieren der Verzögerung, der die Audiosignale in den Frequenzbereich-programmierbaren Filtern 44, 46 und 50 und in den Frequenzbereich-adaptiven Filtern 62, 66 und 68 ausgesetzt sind.
  • Ein Ausgang des Frequenzbereich-adaptiven Filters 62 ist mit einem zweiten Eingang des Subtrahierers 60 verbunden und der Ausgang des Subtrahierers 60 ist mit einem Steuereingang des Frequenzbereich-adaptiven Filters verbunden. Ein Ausgang des Frequenzbereich-adaptiven Filters 66 ist mit einem zweiten Eingang des Subtrahierers 64 verbunden und der Ausgang des Subtrahierers 64 ist mit einem Steuereingang des Frequenzbereich-adaptiven Filters verbunden. Ein Ausgang des Frequenzbereich-adaptiven Filters 68 ist mit einem zweiten Eingang des Subtrahierers 70 verbunden und der Ausgang des Subtrahierers 70 ist mit einem Steuereingang des Frequenzbereich-adaptiven Filters verbunden.
  • Die Frequenzbereich-adaptiven Filter 61, 66 und 68 sind vorgesehen um deren Übertragungsfunktion einzustellen, damit die Leistung des Eingangssignals an den Steuereingängen minimiert wird. Die Frequenzbereich-adaptiven Filter 62, 66 und 68 liefern deren N+L Filterkoeffizienten zu den Frequenzbereich-programmierbaren Filtern 44, 46 und 48. Diese Frequenzbereich-adaptiven Filter bestimmen den konjugierten Wert der N+L Filterkoeffizienten bevor sie verwendet werden um die Signale zu filtern, die von den Blockverkettungseinheiten 42, 48 und 52 empfangen worden sind.
  • In den Frequenzbereich-adaptiven Filtern 62, 66 und 68 nach 3 kombiniert ein Füllelement 80 die an dem Steuereingang des betreffenden Frequenzbereichadaptiven Filters verfügbaren L Abtastwerte mit N Abtastwerten, die einen Wert 0 haben zu einem Block mit Daten mit N+L Abtastwerten. Dieser Block mit N+L Abtastwerten wird einer N+L Punkten schnellen Fourier Transformation ausgesetzt, durchgeführt durch ein FFT-Element 82. Die Erweiterung von Blöcken von L Abtastwerten zu Blöcken mit N+L Abtastwerten bevor die Durchführung der FFT erfolgt ist um Verzerrung des Signals durch die Symmetrie des FFT Signals um die halbe Abtastfrequenz herum zu vermeiden. Diese Maßnahme ist dem Fachmann auf dem Gebiete der Frequenzbereich-(adaptiven) Filter durchaus bekannt.
  • An einem Ausgang des FFT-Elementes 82 ist das Frequenzspektrum des Signals an dem Steuereingang des Frequenzbereich-adaptiven Filters (= der Ausgang des Subtrahierers 60, 64 bzw. 70) verfügbar. Das Ausgangssignal des FFT-Elementes 82 wird mit dem Ausgangssignal des Normalisierers 73 multipliziert. Die N+L Komponenten des Ausgangssignals des Normalisierers 73 stellt Anpassungsgeschwindigkeitswerte dar, welche die Geschwindigkeit der Anpassung der Koeffizienten des Frequenzbereich-adaptiven Filters bestimmen.
  • Das Ausgangssignal des Multiplizierers 84 wird zu dem Ausgangssignal des Blockverzögerungselementes 112 addiert. Das Ausgangssignal des Blockverzögerungselementes 112 stellt die vorhergehenden Werte der Filterkoeffizienten des Frequenzbereichadaptiven Filters dar. Das Ausgangssignal des Addierers 86 wird einer IFFT ausgesetzt, durchgeführt durch ein IFFT-Element 94. Aus den 2·L Ausgangsabtastwerten des IFFT-Elementes 94 wird der Wert des schlussendlichen L Blocks auf Null gesetzt, und zwar durch das Element 96. Daraufhin werden die 2·L Abtastwerte (von denen L Abtastwerte Null sind) einem FFT-Vorgang ausgesetzt, durchgeführt durch ein FFT-Element 110. Die Kombination des IFFT-Elementes 94, des Elementes 96 und des FFT-Elementes 110 ist vorhanden um eine Signalverzerrung durch den zyklischen Charakter der FFT-Transformation zu vermeiden, durchgeführt durch den FFT-Prozessor 82.
  • An dem Ausgang des FFT-Elementes 110 sind N+L Koeffizienten zur Verwendung bei dem Filtervorgang verfügbar. Diese Koeffizienten werden ebenfalls dem entsprechenden programmierbaren Filter zugeführt. Die Filterkoeffizienten werden auch über ein Blockverzögerungselement 112 dem Ausgang des Addierers 86 zugeführt. Die Kombi nation des Addierers 86, des IFFT-Elementes 94, des Elementes 96, des FFT-Elementes 110 und des Blockverzögerungselementes 112 bestimmt den Filterkoeffizienten entsprechend dem nachfolgenden Ausdruck: vi,k = Vi,k–1 + λi,k·Ei,k (21)
  • In (21) stellt vi,k die N+L Filterkoeffizienten zu dem Zeitpunkt k dar, vi,k–1 stellt die N+L Filterkoeffizienten zu dem Zeitpunkt k–1 dar, λi,k stellt die Anpassungskoeffizienten dar, die von dem Normalisierer 73 dem zweiten Eingang des Multiplizierers 84 geliefert werden und Ek,i stellt das Frequenzspektrum des Fehlersignals an dem Ausgang des Subtrahierers 60, 64 oder 70 in 2 dar.
  • In dem Normalisierer 73 nach 4 bestimmt das Eingangssignal, das von der FFT-Einheit 72 in 2 geliefert wird, an einem konjugierten Element 106 den konjugierten Wert des genannten Eingangssignals. Dieser konjugierte Wert wird mit dem genannten Eingangssignal durch einen Multiplizierer 104 multipliziert. An dem Ausgang des Multiplizierers 104 ist das Leistungsspektrum des Eingangssignals verfügbar. Der Ausgang des Multiplizierers 104 ist mit einem Eingang eines Multiplizierers 102 verbunden.
  • Ein durch den Multiplizierer 102, einen Addierer 100, einen Multiplizierer 98 und ein Blockverzögerungselement 92 gebildetes Tiefpassfilter bestimmt einen Zeitmittelwert des Leistungsspektrums des Eingangssignals des Frequenzbereich-adaptiven Filters, wie dieser an dem Ausgang des Multiplizierers 104 verfügbar ist. Ein geeigneter Wert für b ist:
  • Figure 00120001
  • In (22) ist fAbtastwert die Abtastfrequenz, mit der die Audiosignale abgetastet und verarbeitet werden. Es hat sich herausgestellt, dass ein Wert von 32 für L ein nützlicher Wert ist. Der Ausgang des Addierers 100, der das zeitgemittelte Leistungsspektrum trägt, ist mit einem ersten Eingang eines Verteilers 88 verbunden. Das Ausgangssignal des Konjugationselementes 106 ist mit einem Skalierungsfaktor 2a mit Hilfe eines Skalierungselementes 90 skaliert. Ein geeigneter Wert für a ist 0,01. Das Ausgangssignal des Skalierungselementes 90 ist mit einem zweiten Eingang des Teilers 88 verbunden.
  • Der Teiler 88 bestimmt die Werte von λi,k durch Berechnung des Verhältnisses der konjugierten FFT-Transformation (skaliert mit dem Skalierungsfaktor 2a) des Eingangssignals des digitalen Filters und des zeitgemittelten Leistungsspektrums des Eingangssignals des Normalisierers 73. Der Wert von λi,k nimmt proportional zu dem Verhält nis zwischen der k. Komponente des Spektrums des Eingangssignals und der k. Komponente des zeitgemittelten Leistungsspektrums. Dies führt zu einem angepassten Sprechen, das für alle Frequenzkomponenten dasselbe ist, ungeachtet der Stärke.
  • In dem Frequenzbereich-programmierbaren Filter 44, 46 und 50 nach 5 wird das Eingangssignal dem Eingang eines FFT-Elementes 120 zugeführt, das eine N+L Punkte FFT aus dem genannten Eingangssignal berechnet. Ein Konjugationselement 122 bestimmt den konjugierten Wert der von den Frequenzbereich-adaptiven Filtern 62, 66, 68 empfangenen Parameter. Ein Multiplizierer 124 berechnet ein gefiltertes Signal durch Multiplikation der FFT des Eingangssignals mit den von den Frequenzbereich-adaptiven Filtern empfangenen konjugierten Filterkoeffizienten.
  • Ein IFFT-Element 126 berechnet ein Zeitbereich-Ausgangssignal aus dem gefilterten Ausgangssignal, das an dem Ausgang des Multiplizierers 124 verfügbar ist. Ein Verwerfungselement verwirft die L letzten Abtastwerte von dem Ausgangssignal des IFFT-Elementes 126 und bietet an dem Ausgang das Ausgangssignal des Frequenzbereichprogrammierbaren Filters.
  • Es hat sich herausgestellt, dass eine geeignete Wahl für N ist, dass dieser Wert gleich L gemacht wird, aber es ist ebenfalls möglich, dass N kleiner oder größer als L gewählt wird. Es ist erwünscht, N+L einer Zweierpotenz entsprechend zu machen, damit eine einfache Implementierung der FFT- und IFFT-Vorgänge möglich ist.
  • In der Zeitbereich-Implementierung der Audio-Verarbeitungsanordnung nach 6 sind die Ausgänge von Mikrophonen 30, 32 und 34 mit Eingängen von Verarbeitungsmitteln 131 und mit Verzögerungselementen 186, 188 und 190 verbunden. Die Verarbeitungsmittel 131 umfassen Zeitbereich-programmierbare Filter 133, 135 und 137.
  • Das Zeitbereich-programmierbare Filter 133 umfasst eine Anzahl kaskadengeschalteter Verzögerungselemente 130, 132 und 134 und einen Addierer 146, der die Ausgangssignale der mit einem Gewichtungsfaktor W1,1....W1,N gewichtete Verzögerungselemente addiert. Die Gewichtung wird von den Gewichtungselementen 136, 138, 140, 142 und 144 durchgeführt. Das Zeitbereich-programmierbare Filter 135 umfasst eine Anzahl kaskadengeschalteter Verzögerungselemente 148, 150 und 152, und einen Addierer 164, der die Ausgangssignale der mit einem Gewichtungsfaktor W2.1 ...W2,N gewichteten Verzögerungselemente addiert. Die Gewichtung wird von den Gewichtungselementen 154, 156, 158, 160 und 162 durchgeführt. Das Zeitbereich-programmierbare Filter 137 umfasst eine Anzahl kaskadengeschalteter Elemente 166, 168 und 170, und einen Addierer 182, der die Ausgangssignale der mit einem Gewichtungsfaktor WM,1...WM,N gewichteten Verzögerungselemente addiert.
  • Die Ausgänge der Zeitbereich-programmierbaren Filter 133, 135 und 137, welche die verarbeiteten Audiosignale tragen, sind mit den Kombiniermitteln, in diesem Fall einem Addierer 184, verbunden. Am Ausgang des Addierers 184 ist das verbesserte Audiosignal verfügbar. Der Ausgang des Addierers 184 ist mit Eingängen von Zeitbereichadpativen Filtern 191, 193 und 195 verbunden.
  • Das Zeitbereich-adaptive Filter 191 umfasst eine Anzahl Verzögerungselemente 194, 196 und 198. Die Ausgangssignale der Verzögerungselemente 194, 196 und 198 werden mit Gewichtungsfaktoren W1,1... W1,N von den Gewichtungselementen 200, 202, 204, 206 und 208 gewichtet. Die Ausgangssignale der Gewichtungselemente 200... 208 werden von einem Addierer 192 addiert, der das Ausgangssignal des adaptiven Filters 191 liefert.
  • Das Zeitbereich-adaptive Filter 193 umfasst eine Anzahl Verzögerungselemente 226, 228 und 230. Die Ausgangssignale der Verzögerungselemente 226, 228 und 230 werden mit den Gewichtungsfaktoren W2,1 ... W2,N von den Gewichtungselementen 216, 218, 220, 222 und 224 gewichtet. Die Ausgangssignale der Gewichtungselemente 216...224 werden von einem Addierer 210 addiert, der das Ausgangssignal des adaptiven Filters 193 liefert.
  • Das Zeitbereich-adaptive Filter 195 umfasst eine Anzahl Verzögerungselemente 236, 240 und 246. Die Ausgangssignale der Verzögerungselemente 236, 240 und 246 werden mit den Gewichtungsfaktoren WM,1 ... WM,N von den Gewichtungselementen 234, 238, 242, 244 und 248 gewichtet. Die Ausgangssignale der Gewichtungselemente 234...248 werden von einem Addierer 232 addiert, der das Ausgangssignal des Zeitbereichadaptiven Filters 195 liefert.
  • Die Ausgänge der Verzögerungselemente 186, 188 und 190 sind mit ersten Eingängen von Subtrahierern 212, 214 und 250 verbunden. Die Verzögerungselemente 186, 188 und 190 sind vorgesehen um die Gewichtsfunktion der programmierbaren Filter relativ antikausal zu machen (früher in der Zeit), und zwar gegenüber der Gewichtsfunktion der Zeitbereich-programmierbaren Filter. Zweite Eingänge der Subtrahierer 212, 214 und 250 sind mit Ausgängen der Zeitbereich-adaptiven Filter 191, 193 und 195 gekoppelt. Die Aus gänge der Subtrahierer 212, 214 und 250 sind mit Steuermitteln 231, 233 bzw. 235 verbunden. Die Steuermittel sind vorgesehen zum Einstellen der Übertragungsfunktion des entsprechenden Adaptivfilters 191, 193 und 195 zum Minimieren der Leistung des Ausgangssignals des entsprechenden Subtrahierers.
  • Die Steuermittel 231, 233 und 235 sind vorgesehen zum Einstellen der Koeffizienten der adaptiven Filter 191, 193 und 195 entsprechend dem nachfolgenden Ausdruck: Wj,k(n+1) = Wj,k(n) + μ·y[n–k]·ej[n] (23)
  • In (23) ist Wj,k der Gewichtungsfaktor des k. Gewichtungselementes in dem j. adaptiven Filte, μ ist eine Anpassungskonstante und ej[n] ist die Differenz zwischen dem Ausgangssignal des j. Blockverzögerungselementes, welches das Eingangssignal und das Ausgangssignal des j. adaptiven Filters verzögert. Yj[n–k] ist das um k Abtastperioden verzögerte Ausgangssignal der Audioverarbeitungsanordnung. Diese Signale y[n–k] sind an dem Ausgang der Verzögerungselemente der adaptiven Filter verfügbar. Weil die adaptiven Filter alle dieselben Eingangssignale haben, können die Verzögerungselemente gemeinsam sein. was zu einer Reduktion der erforderlichen Verzögerungselemente führt.
  • Nachdem die Koeffizienten Wj,k(n) ermittelt worden sind, werden diese Koeffizienten umgekehrt den Zeitbereich-programmierbaren Filtern 133, 135 und 137 zugeführt. Dies bedeutet, dass die Koeffizienten, die den ersten Abgriffen in den adaptiven Filtern entsprechen, Koeffizienten der letzten Abgriffe in dem entsprechenden programmierbaren Filter zugeführt werden.
  • Text in der Zeichnung
  • 2A
    • Verbesserter Ausgang
    • Speichern erster L-Werte
    • Verkettung zweier Blöcke Alt Neu
    • Verzögerung von Blöcken
  • 2B
    Normalisierer
  • 3
    • Speichern Forcieren zu Null
    • Verzögerung am Block
    • Speichern der ersten N Werte
    • Forcieren der letzten Werte
    • Speichern der letzten Werte
    • Einfügen von N Nullen
  • 4
    • Verketten
    • Teilung
    • Verzögerung um einen Block
  • 5
    Verketten
  • 6B
    Verzögern N–1

Claims (10)

  1. Anordnung (2) zum Verarbeiten von Audiosignalen mit einer Anzahl Audioquellen (4, 6), die Eingangs-Audiosignale erzeugen, mit Verarbeitungsmitteln (11) zum Herleiten verarbeiteter Audiosignale aus den Eingangs-Audiosignalen, wobei die Anordnung zum Verarbeiten von Audiosignalen Kombiniermittel (18) aufweist zum Herleiten eines kombinierten Audiosignals aus den verarbeiteten Audiosignalen, dadurch gekenn zeichnet, dass die Anordnung zum Verarbeiten von Audiosignalen Steuermittel (13) umfasst zum Steuern der Verarbeitungsmittel (11) zum Maximieren einer Leistungsgröße des kombinierten Audiosignals, und dass die Steuermittel (13) vorgesehen sind zum Begrenzen einer Summe der Leistungsverstärkungen der Verarbeitungsmittel der verarbeiteten Audiosignale auf einen vorbestimmten Wert.
  2. Anordnung zum Verarbeiten von Audiosignalen nach Anspruch 1, dadurch gekennzeichnet, dass die Verarbeitungsmittel Skalierungsmittel umfassen zum Skalieren der Eingangs-Audiosignale mit einem Skalierungsfaktor zum Erhalten des verarbeiteten Audiosignals, wobei die genannten Steuermittel weitere Skalierungsmittel umfassen zum Herleiten einer Anzahl skalierter kombinierter Audiosignale mit einem Skalierungsfaktor entsprechend dem Skalierungsfaktor der Skalierungsmittel und dass die Steuermittel vorgesehen sind zum Maximieren einer Leistungsgröße des kombinierten Audiosignals und zum Begrenzen einer kombinierten Leistungsverstärkungsgröße der verarbeiteten Audiosignale durch Minimierung einer Differenz zwischen den Eingangs-Audiosignalen und den skalierten kombinierten Audiosignalen entsprechend den genannten Audiosignalen.
  3. Anordnung zum Verarbeiten von Audiosignalen nach Anspruch 1, dadurch gekennzeichnet, dass die Verarbeitungsmittel eine Anzahl einstellbarer Filter umfassen zum Herleiten des verarbeiteten Audiosignals, dass die Steuermittel eine Anzahl weiterer einstellbarer Filter mit einer Übertragungsfunktion umfassen, die das Konjugierte der Übertragungsfunktion der einstellbarer Filter ist, wobei die genannten weiteren einstellbaren Filter vorgesehen sind zum Herleiten gefilterter kombinierter Audiosignale aus dem kombinierten Audiosignal, und dass die Steuermittel vorgesehen sind zum Maximieren der Leistungsgröße des kombinierten Audiosignals und zum Beschränken einer kombinierten Verstärkungsgröße der verarbeiteten Audiosignale auf einen vorbestimmten Wert durch Steuerung der Übertragungsfunktionen der einstellbaren Filter und der weiteren einstellbaren Filter zum Minimieren einer Differenz zwischen den Eingangs-Audiosignalen und dem gefilterten kombinierten Audiosignal entsprechend den genannten Eingangs-Audiosignalen.
  4. Anordnung zum Verarbeiten von Audiosignalen nach Anspruch 2, dadurch gekennzeichnet, dass die Anordnung zum Verarbeiten von Audiosignalen Verzögerungselemente umfasst zum Ausgleichen einer Verzögerungsdifferenz eines gemeinsamen Audiosignals in den Eingangs-Audiosignalen.
  5. Anordnung zum Verarbeiten von Audiosignalen nach einem oder mehreren der vorstehenden Ansprüche, dadurch gekennzeichnet, dass die Audioquellen eine Anzahl Mikrophone umfassen und dass die Mikrophone sich in einer derartigen Lage befinden, dass ihre Richtungsmuster im Wesentlichen getrennt sind.
  6. Anordnung zum Verarbeiten von Audiosignalen nach Anspruch 5, dadurch gekennzeichnet, dass die Mikrophone um eine zentrale Position aufgestellt sind, und zwar in Winkeln gleich 360° geteilt durch die Anzahl Mikrophone.
  7. Anordnung zum verarbeiten von Audiosignalen nach einem der Ansprüche 1, 2, 3 oder 4, dadurch gekennzeichnet, dass die Audioquellen eine Anzahl Mikrophone umfassen, die in einer linearen Anordnung aufgestellt sind.
  8. Anordnung zum Verarbeiten von Audiosignalen mit einer Anzahl Eingänge zum Empfangen von Eingangs-Audiosignalen, mit Verarbeitungsmitteln zum Herleiten verarbeiteter Audiosignale aus den Eingangs-Audiosignalen, wobei die Anordnung zum Verarbeiten von Audiosignalen Kombiniermittel umfasst zum Herleiten eines kombinierten Audiosignals aus den verarbeiteten Audiosignalen, dadurch gekennzeichnet, dass die Anordnung zum Verarbeiten von Audiosignalen Steuermittel umfasst zum Steuern der Verarbeitungsmittel zum Maximieren einer Leistungsgröße des kombinierten Audiosignals, und dass die Steuermittel vorgesehen sind zum Begrenzen der Summe der Leistungsverstärkungen der Verarbeitungsmittel der verarbeiteten Audiosignale auf einen vorbestimmten Wert.
  9. Anordnung zum Verarbeiten von Audiosignalen nach Anspruch 8, dadurch gekennzeichnet, dass die Verarbeitungsmittel Skalierungsmittel umfassen zum Skalieren der Eingangs-Audiosignale mit einem Skalierungsfaktor zum Erhalten der verarbeiteten Audiosignale, wobei die genannten Steuermittel weitere Skalierungsmittel umfassen zum Herleiten einer Anzahl skalierter kombinierter Audiosignale mit einem Skalierungsfaktor entsprechend dem Skalierungsfaktor der Skalierungsmittel, und dass die Steuermittel vorgesehen sind zum Maximieren einer Leistungsgröße des kombinierten Audiosignals und zum Begrenzen einer kombinierten Leistungsverstärkungsgröße der verarbeiteten Audiosignale durch Minimierung einer Differenz zwischen den Eingangs-Audiosignalen und den skalierten kombinierten Audiosignalen entsprechend den genannten Audiosignalen.
  10. Verfahren zum Verarbeiten von Audiosignalen, wobei dieses Verfahren die nachfolgenden Verfahrensschritte umfasst: das Empfangen einer Anzahl Eingangs-Audiosignale aus einer Anzahl Audioquellen, das Herleiten verarbeiteter Audiosignale aus den Eingangs-Audiosignalen, das Herleiten eines kombinierten Audiosignals aus den verarbeiteten Audiosignalen, dadurch gekennzeichnet, dass das Verfahren zum Verarbeiten von Audiosignalen weiterhin umfasst: das Steuern der Verarbeitung der Audiosignale zum Maximieren eine Leistungsgröße des kombinierten Audiosignals, und dass das Verfahren das Steuern der Verarbeitung zur Begrenzung einer Summe der Leistungsverstärkungen der Verarbeitungsmittel der verarbeiteten Audiosignale auf einen vorbestimmten Wert.
DE69822128T 1997-11-22 1998-11-20 Anordnung zur verarbeitung von audiosignalen aus mehreren quellen Expired - Lifetime DE69822128T2 (de)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP97203658 1997-11-22
EP97203658 1997-11-22
PCT/IB1998/001851 WO1999027522A2 (en) 1997-11-22 1998-11-20 Audio processing arrangement with multiple sources

Publications (2)

Publication Number Publication Date
DE69822128D1 DE69822128D1 (de) 2004-04-08
DE69822128T2 true DE69822128T2 (de) 2005-01-20

Family

ID=8228958

Family Applications (1)

Application Number Title Priority Date Filing Date
DE69822128T Expired - Lifetime DE69822128T2 (de) 1997-11-22 1998-11-20 Anordnung zur verarbeitung von audiosignalen aus mehreren quellen

Country Status (7)

Country Link
US (2) US7146012B1 (de)
EP (1) EP0954850B1 (de)
JP (1) JP4372232B2 (de)
KR (1) KR100584491B1 (de)
CN (1) CN1115663C (de)
DE (1) DE69822128T2 (de)
WO (1) WO1999027522A2 (de)

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100715139B1 (ko) 2000-06-30 2007-05-10 코닌클리케 필립스 일렉트로닉스 엔.브이. 마이크로폰의 캘리브레이션을 위한 장치 및 방법
US7054451B2 (en) * 2001-07-20 2006-05-30 Koninklijke Philips Electronics N.V. Sound reinforcement system having an echo suppressor and loudspeaker beamformer
US9406293B2 (en) * 2001-08-01 2016-08-02 Kopin Corporation Apparatuses and methods to detect and obtain desired audio
CN101040512B (zh) 2004-10-13 2010-05-26 皇家飞利浦电子股份有限公司 回波抵消设备与方法
US7680652B2 (en) 2004-10-26 2010-03-16 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US7949520B2 (en) 2004-10-26 2011-05-24 QNX Software Sytems Co. Adaptive filter pitch extraction
US8170879B2 (en) 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
US7716046B2 (en) 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
US7610196B2 (en) 2004-10-26 2009-10-27 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US8543390B2 (en) * 2004-10-26 2013-09-24 Qnx Software Systems Limited Multi-channel periodic signal enhancement system
US8306821B2 (en) 2004-10-26 2012-11-06 Qnx Software Systems Limited Sub-band periodic signal enhancement system
CN101218848B (zh) 2005-07-06 2011-11-16 皇家飞利浦电子股份有限公司 用于声束形成的设备和方法
CN101001293B (zh) * 2006-01-13 2010-04-21 讯强通讯科技股份有限公司 无线耳机通讯中回音的消除方法
CN100436482C (zh) * 2006-04-14 2008-11-26 东莞太力生物工程有限公司 长效人促红细胞生成素融合蛋白及其制备和纯化方法
JP4455614B2 (ja) * 2007-06-13 2010-04-21 株式会社東芝 音響信号処理方法及び装置
US8498423B2 (en) 2007-06-21 2013-07-30 Koninklijke Philips N.V. Device for and a method of processing audio signals
US8850154B2 (en) 2007-09-11 2014-09-30 2236008 Ontario Inc. Processing system having memory partitioning
US8904400B2 (en) 2007-09-11 2014-12-02 2236008 Ontario Inc. Processing system having a partitioning component for resource partitioning
WO2009034524A1 (en) * 2007-09-13 2009-03-19 Koninklijke Philips Electronics N.V. Apparatus and method for audio beam forming
US8694310B2 (en) 2007-09-17 2014-04-08 Qnx Software Systems Limited Remote control server protocol system
US8209514B2 (en) 2008-02-04 2012-06-26 Qnx Software Systems Limited Media processing system having resource partitioning
ATE528752T1 (de) 2008-06-25 2011-10-15 Koninkl Philips Electronics Nv Audioverarbeitung
KR101648203B1 (ko) 2008-12-23 2016-08-12 코닌클리케 필립스 엔.브이. 스피치 캡처링 및 스피치 렌더링
JP5175262B2 (ja) * 2009-12-02 2013-04-03 日本電信電話株式会社 音声取得装置
US9479866B2 (en) * 2011-11-14 2016-10-25 Analog Devices, Inc. Microphone array with daisy-chain summation
CN102813746B (zh) * 2012-08-01 2014-07-09 河南科技大学 一种用于治疗手指麻木的中药组合物
CN104751853B (zh) * 2013-12-31 2019-01-04 辰芯科技有限公司 双麦克风噪声抑制方法及系统
US10026415B2 (en) 2014-03-17 2018-07-17 Koninklijke Philips N.V. Noise suppression
BR112019013555A2 (pt) 2017-01-03 2020-01-07 Koninklijke Philips N.V. Aparelho para captura de áudio, método de captura de áudio e produto de programa de computador
BR112019013548A2 (pt) 2017-01-03 2020-01-07 Koninklijke Philips N.V. Aparelho de captura de áudio, método de operação para capturar áudio, e produto de programa de computador
CN110140171B (zh) 2017-01-03 2023-08-22 皇家飞利浦有限公司 使用波束形成的音频捕获
RU2759715C2 (ru) 2017-01-03 2021-11-17 Конинклейке Филипс Н.В. Звукозапись с использованием формирования диаграммы направленности
DE102017116273A1 (de) * 2017-03-30 2018-10-04 Riedel Communications International GmbH Netzwerkgerät für ein Intercom-Netzwerk
US10869126B2 (en) * 2017-05-29 2020-12-15 Harman Becker Automotive Systems Gmbh Sound capturing
CN108630216B (zh) * 2018-02-15 2021-08-27 湖北工业大学 一种基于双麦克风模型的mpnlms声反馈抑制方法
CN109194307B (zh) * 2018-08-01 2022-05-27 南京中感微电子有限公司 数据处理方法及系统
EP4191584A1 (de) 2021-12-02 2023-06-07 Koninklijke Philips N.V. Audiovorrichtung und verfahren zum betrieb davon

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4536887A (en) * 1982-10-18 1985-08-20 Nippon Telegraph & Telephone Public Corporation Microphone-array apparatus and method for extracting desired signal
US4696043A (en) * 1984-08-24 1987-09-22 Victor Company Of Japan, Ltd. Microphone apparatus having a variable directivity pattern
JPH0728470B2 (ja) * 1989-02-03 1995-03-29 松下電器産業株式会社 アレイマイクロホン
DE69011709T2 (de) * 1989-03-10 1994-12-15 Nippon Telegraph & Telephone Einrichtung zur Feststellung eines akustischen Signals.
US5353376A (en) * 1992-03-20 1994-10-04 Texas Instruments Incorporated System and method for improved speech acquisition for hands-free voice telecommunication in a noisy environment
JP2508574B2 (ja) * 1992-11-10 1996-06-19 日本電気株式会社 多チャンネルエコ―除去装置
FR2700055B1 (fr) * 1992-12-30 1995-01-27 Sextant Avionique Procédé de débruitage vectoriel de la parole et dispositif de mise en Óoeuvre.
US5657393A (en) * 1993-07-30 1997-08-12 Crow; Robert P. Beamed linear array microphone system
DE4330243A1 (de) * 1993-09-07 1995-03-09 Philips Patentverwaltung Sprachverarbeitungseinrichtung
WO1995016259A1 (en) * 1993-12-06 1995-06-15 Philips Electronics N.V. A noise reduction system and device, and a mobile radio station
US5574824A (en) * 1994-04-11 1996-11-12 The United States Of America As Represented By The Secretary Of The Air Force Analysis/synthesis-based microphone array speech enhancer with variable signal distortion
US5872852A (en) * 1995-09-21 1999-02-16 Dougherty; A. Michael Noise estimating system for use with audio reproduction equipment
JPH09212196A (ja) * 1996-01-31 1997-08-15 Nippon Telegr & Teleph Corp <Ntt> 雑音抑圧装置
US5774562A (en) * 1996-03-25 1998-06-30 Nippon Telegraph And Telephone Corp. Method and apparatus for dereverberation
US5793875A (en) * 1996-04-22 1998-08-11 Cardinal Sound Labs, Inc. Directional hearing system
JP3541339B2 (ja) * 1997-06-26 2004-07-07 富士通株式会社 マイクロホンアレイ装置
US6137887A (en) * 1997-09-16 2000-10-24 Shure Incorporated Directional microphone system
JP3344647B2 (ja) * 1998-02-18 2002-11-11 富士通株式会社 マイクロホンアレイ装置
CN100569007C (zh) * 1998-11-11 2009-12-09 皇家菲利浦电子有限公司 改进后的信号定位装置

Also Published As

Publication number Publication date
EP0954850A2 (de) 1999-11-10
US7454023B1 (en) 2008-11-18
US7146012B1 (en) 2006-12-05
CN1251192A (zh) 2000-04-19
JP2001510001A (ja) 2001-07-24
KR20000070387A (ko) 2000-11-25
WO1999027522A2 (en) 1999-06-03
KR100584491B1 (ko) 2006-06-02
JP4372232B2 (ja) 2009-11-25
EP0954850B1 (de) 2004-03-03
DE69822128D1 (de) 2004-04-08
CN1115663C (zh) 2003-07-23
WO1999027522A3 (en) 1999-08-12

Similar Documents

Publication Publication Date Title
DE69822128T2 (de) Anordnung zur verarbeitung von audiosignalen aus mehreren quellen
DE60108752T2 (de) Verfahren zur rauschunterdrückung in einem adaptiven strahlformer
EP1251493B1 (de) Verfahren zur Geräuschreduktion mit selbststeuernder Störfrequenz
DE112009001003B4 (de) Geräuschunterdrückungssystem mit zwei Mikrophonen
DE69631086T2 (de) Teilbandechokompensationsverfahren unter Verwendung eines Projektionsalgorithmus
DE69531136T2 (de) Verfahren und Einrichtung zur mehrkanaligen Kompensation eines akustischen Echos
DE69631955T2 (de) Verfahren und schaltung zur adaptiven rauschunterdrückung und sendeempfänger
DE69632851T2 (de) Akustischer Teilband-Echokompensator
DE3405010A1 (de) Vorrichtung zur erzeugung eines verzoegerungsschaetzwertes fuer eine echoausloescheinrichtung
DE69530961T2 (de) Signalverstärkersystem mit verbesserter echounterdrückung
DE60038432T2 (de) Akustische echo- und rauschkompensation
DE3235914C2 (de)
DE2207141C3 (de) Schaltungsanordnung zur Unterdrückung unerwünschter Sprachsignale mittels eines vorhersagenden Filters
DE69734932T2 (de) Schätzung der verzögerung auf einem echopfad
DE60029436T2 (de) Akustischer Echokompensator
EP0930726B1 (de) Verfahren zur Echounterdrückung mit adaptiven FIR-Filtern
DE102008039329A1 (de) Vorrichtung und Verfahren zur Berechnung von Steuerinformationen für ein Echounterdrückungsfilter und Vorrichtung und Verfahren zur Berechnung eines Verzögerungswerts
DE2653965A1 (de) Echounterdrueckungsanordnung fuer eine digitaldatenuebertragungsanlage
EP0614304A1 (de) Verfahren zum Verbessern der akustischen Rückhördämpfung von elektroakustischen Anlagen
CH629350A5 (de) Signalverarbeitungsanlage zur ableitung eines stoerverringerten ausgangssignals aus zwei zugefuehrten signalen, insbesondere zur verringerung des raumnachhalles.
EP1598935A2 (de) Verfahren bzw. adaptives Filter zum Verarbeiten einer Folge aus Eingabe-Daten eines Funksystems
DE69926451T2 (de) Verfahren und Vorrichtung zur Unterdrückung von Mehrkanalechos
DE60004863T2 (de) EINE METHODE ZUR REGELUNG DER RICHTWIRKUNG DER SCHALLEMPFANGSCHARAkTERISTIK EINES HÖRGERÄTES UND EIN HÖRGERÄT ZUR AUSFÜHRUNG DER METHODE
DE19806015C2 (de) Verfahren zur Verbesserung der akustischen Rückhördämpfung in Freisprecheinrichtungen
DE60108237T2 (de) Empfangssystem für eine mehrfachempfänger -antenne

Legal Events

Date Code Title Description
8364 No opposition during term of opposition