DE19747885A1 - Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion - Google Patents

Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion

Info

Publication number
DE19747885A1
DE19747885A1 DE19747885A DE19747885A DE19747885A1 DE 19747885 A1 DE19747885 A1 DE 19747885A1 DE 19747885 A DE19747885 A DE 19747885A DE 19747885 A DE19747885 A DE 19747885A DE 19747885 A1 DE19747885 A1 DE 19747885A1
Authority
DE
Germany
Prior art keywords
nir
signals
noise
signal
noise input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE19747885A
Other languages
English (en)
Other versions
DE19747885B4 (de
Inventor
Klaus Dr Linhard
Tim Haulick
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Harman Becker Automotive Systems GmbH
Original Assignee
DaimlerChrysler AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DaimlerChrysler AG filed Critical DaimlerChrysler AG
Priority to DE19747885A priority Critical patent/DE19747885B4/de
Priority to US09/530,527 priority patent/US6643619B1/en
Priority to PCT/EP1998/006707 priority patent/WO1999023642A1/de
Publication of DE19747885A1 publication Critical patent/DE19747885A1/de
Application granted granted Critical
Publication of DE19747885B4 publication Critical patent/DE19747885B4/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation

Description

Die Erfindung betrifft ein Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion gemäß Oberbegriff des Patentanspruchs 1. Derartige Verfahren sind bereits aus [1] bekannt.
Die Verbesserung von Sprachsignalen ist ein zentraler Bestandteil der aktuellen Forschung auf dem Gebiet der Kommunikationstechnik, beispielsweise auch in Anwendungsgebieten wie dem Freisprechen in Fahrzeugen oder bei der automatischen Spracherkennung. Wesentlich für die Verbesserung von Sprachsignalen ist vor allem die Reduktion von Störgeräuschen.
Ein häufig zur Geräuschreduktion Anwendung findendes Verfahren ist die sogenannte spektrale Subtraktion. Deren Grundlagen werden beispielsweise in [1] beschrieben.
Die spektrale Subtraktion ist ein adaptives Filter, das in Sprachpausen einen Mittelwert des Geräuschspektrums ermittelt (lernt) und dieses Spektrum fortlaufend vom gestör­ ten Sprachsignal subtrahiert. Die genaue Ausführungsform der Subtraktion des Stör­ spektrums kann je nach Anforderung variiert werden. Einzelne Beispiele werden nach­ folgend vorgestellt.
Das Filter-Verfahren der spektralen Subtraktion wird in aller Regel im Frequenzbereich durchgeführt. Die Signale werden segmentweise mit einer FFT (Fast Fourier Transfor­ mation) in den Frequenzbereich transformiert. Die entsprechenden Segmente des Signals im Zeitbereich sind halb überlappt und werden zuvor mit einem Hanning-Fenster multipliziert. Die Synthese erfolgt nach der Filterung (Multiplikation) und anschließenden inversen Transformation mit der sogenannten "overlap-add Methode".
In [2] werden drei Standard-Filterkennlinien als beispielhafte Ausführungsformen für die spektrale Subtraktion vorgestellt:
Power Subtraction: H(k,i) = max (b, √1-a.NIR) (1)
Wiener-Filter: H(k,i) = max (b, (1-a.NIR)) (2)
Magnitude Subtraction: H(k,i) = max (b, (1-a.√NIR)) (3)
k und i bezeichnen die diskrete Zeit und die diskrete Frequenz. NIR ist das "Noise-Input- Ratio":
NIR = E[N(i)2]/(S(k,i) + N(k,i))2 (4)
S und N bezeichnen jeweils das Sprachsignal, bzw. die Störung. a ist ein Überschätz­ faktor, mit dem das Geräusch überschätzt werden kann, und b ist der sogenannte 'spectral floor', der das Minimum der Filterfunktion darstellt. Es wird hier vorausgesetzt, daß die Sprachpausen genügend genau erkannt werden können. Damit ist der Schätz­ wert E[N(i)2] und daraus NIR berechenbar. Einfache Standardverfahren verwenden einen Wert 1 < = a < 4 und 0.1 < b < 0.3, um das verbleibende Restgeräusch, sogenannte 'musical tones', zu vermindern. Nachteilig hierbei ist jedoch stets ein unerwünschter, aber zwangsläufiger Kompromiß zwischen Restgeräusch-Unterdrückung und Sprachver­ zerrung.
Eine im Vergleich zu dem in [2] vorgestellten Verfahren deutlich verbesserte Unter­ drückung der 'musical tones' wird in [3] vorgeschlagen. Dort werden Informationen über einen (früheren) a priori und über einen (späteren) a posteriori Signal-zu-Rauschabstand ausgenutzt, um die Filterkennlinien, hier Besselfunktionen, zu modifizieren. Der a priori und der a posteriori Signal-zu-Rauschabstand, Rprio und Rpost, berechnen sich hier mit:
X(k,i) = S(k,i)) + N(k,i) (5)
Rpost(k,i) = |X(k,i)|2/E[N(i)2]-1 (6)
Rprio(k,i) = (1-d) P[Rpost(k,i)] + d|H(k-1,i) X(k-1,i)|2/E[N(i)2] (7)
d ist eine Glättungskonstante, 0.99 < d < 1. P[] ist eine Projektion mit der negative Anteile zu Null gesetzt werden. Durch die Wahl von d nahe dem Wert Eins wird das Einschwingen auf ein beginnendes, energiestarkes Sprachsignal verlangsamt. Die Pro­ jektion P bewirkt eine Glättung des Restgeräuschs in Sprachpausen. Dies ist jedoch zur Vermeidung von 'musical tones' nicht erforderlich und kann unnatürlich wirken. Darüber hinaus ist der Implementierungsaufwand für diese Methode beträchtlich und bei Sprachsignalen kann eine hörbare Halligkeit auftreten. Die Halligkeit ergibt sich dadurch, daß H(k-1,i) und X(k-1,i) aus dem vorherigen Segment k-1 über Rprio in die aktuelle Filterkennlinie zum Zeitpunkt k eingehen.
Die Aufgabe der vorliegenden Erfindung besteht daher darin, ein Verfahren anzugeben, mit dem einerseits Störungen in akustischen Signalen, insbesondere in Sprachsignalen, mittels der adaptiven Filter-Methode der spektralen Subtraktion deutlich reduziert werden können, ohne daß eine wesentliche Verfälschung des Signals, wie beispiels­ weise Hall, erfolgt und mit dem andererseits der rechentechnische Aufwand, relativ zu bereits bekannten und hinsichtlich der Qualität der erzielten Signalverbesserung ver­ gleichbaren Methoden, wesentlich gesenkt werden kann.
Die Erfindung ist in Bezug auf das zu schaffende Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion durch die Merkmale des Patentanspruchs 1 wiedergegeben. Die weiteren Ansprüche enthalten vorteilhafte Ausgestaltungen und Weiterbildungen des erfindungsgemäßen Verfahrens zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion.
Die Aufgabe wird bezüglich des Verfahrens zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion erfindungs­ gemäß dadurch gelöst,
daß die Berechnung eines jeweils aktuellen Kennwertes H(k,i) der verwendeten Filter­ funktion unter Berücksichtigung von Informationen über einen a priori Signal-zu-Rausch- Abstand derart erfolgt, daß als alleinige Information über den a priori Signal-zu-Rausch- Abstand Kennwerte H(k-j,i), j = 1, . . ., N der Filterfunktion aus zurückliegenden Zeit­ segmenten k-j verwendet werden, mindestens jedoch ein Kennwert H(kj0,i), j0 ∈ 1, . . ., N der Filterfunktion aus einem zurückliegenden Zeitsegment k-j0 verwendet wird,
und dadurch, daß die Kennlinie der Filterfunktion zweigeteilt ist und eine Abbruchkante aufweist, derart,
  • - daß die Filterung für stark gestörte Signale X(k,i) mit einem hohen Noise-Input-Ratio NIR(k,i) zu einer signalunabhängigen starken Dämpfung führt, und
  • - daß die Filterung für wenig gestörte Signale X(k,i) mit einem niedrigen Noise-Input-Ratio NIR(k,i) zu einer signalabhängigen geringen Dämpfung führt.
Die Vorteile einer solchen Ausgestaltung bestehen darin,
daß erstens die akustische Qualität des entstörten Signals weitergehend verbessert wird als in dem unter [3] vorgestellten Verfahren und zwar dadurch,
daß für die Berücksichtigung zeitlich zurückliegender Information allein einer oder mehrere Kennwerte H(k-j,i) rückgeführt werden im Gegensatz zu der in [3] vorge­ schlagenen Rückführung von Kennwert H(k-1,i) und gestörtem Signal X(k-1,i) und durch die erfindungsgemäße Berücksichtigung von H(k-j,i) und X(k,i) zu unter­ schiedlichen Zeitpunkten k-j und k eine Entkopplung oder Dekorrelation von H und X stattfindet, wodurch Hall und Echos minimiert werden und
daß die Signale in Zeitsegmenten mit einem hohen Noise-Input-Ratio NIR(k,i), beispielsweise Hintergrundgeräusche in Sprachpausen, nur signalunabhängig ge­ dämpft aber natürlich wiedergeben werden, während sie in [3] geglättet und un­ natürlich verfälscht werden und
daß das Einschwingen der Kennlinie auf ein einsetzendes Signal deutlich schneller erfolgt als in [3], wo durch die Einführung der Glättungskonstante d und deren Wertfestsetzung nahe 1 das Einschwingen stark verlangsamt wird, und
daß zweitens der rechentechnische Aufwand wesentlich geringer ist als bei dem in [3] vorgestellten Verfahren, dadurch
daß im Vergleich zu [3] die Berechnung des a posteriori Signal-zu-Rausch­ abstandes entfällt und
daß die Berücksichtigung des a priori Signal-zu-Rauschabstandes wesentlich ver­ einfacht wird durch den Wegfall der Glättung und der Projektion und
daß in Zeitsegmenten, in denen die Signale ein hohes Noise-Input-Ratio NIR(k,i) aufweisen, gar keine Berechnung eines signalabhängigen Filterkennlinienwertes stattfindet, sondern einfach eine Festsetzung auf einen signalunabhängigen Wert.
In einer vorteilhaften Ausgestaltung der Erfindung betreffend das Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion wird als alleinige Information über den a priori Signal-zu-Rausch- Abstand der Kennwert H(k-1,i) der Filterfunktion aus dem direkt zurückliegenden Zeit­ segment k-1 verwendet.
Die Vorteile dieser Ausgestaltung bestehen darin, daß mit ihr bereits eine qualitativ hochwertige Reduktion von Störungen erzielt werden kann und der rechentechnische Aufwand für die Ausführung des Verfahrens minimal ist.
In einer weiteren vorteilhaften Ausgestaltung der Erfindung betreffend das Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion erfolgt die Berechnung des aktuellen Kennwertes H(k,i) der Fil­ terfunktion aus dem signalabhängigen Noise-Input-Ratio NIR(k,i), und die Berücksichti­ gung von Informationen über den a priori Signal-zu-Rausch-Abstand erfolgt derart, daß vor der Berechnung des aktuellen Kennwertes H(k,i) das Noise-Input-Ratio NIR(k,i) durch ein korrigiertes Noise-Input-Ratio
wobei die Gewichtungsfaktoren wj reelle Zahlen kleiner 1 sind und N eine natürliche Zahl größer gleich 1 ist.
Die Vorteile dieser Ausgestaltung bestehen darin, daß mit ihr eine qualitativ hoch­ wertige Reduktion von Störungen erzielt werden kann und der rechentechnische Auf­ wand für die Ausführung des Verfahrens sehr gering ist.
In einer weiteren vorteilhaften Ausgestaltung der Erfindung betreffend das Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion wird als Filterfunktion verwendet
H(k,i) = max (b, √1-a.NIR'(k,i)), oder (9)
H(k,i) = max (b, (1-a.NIR'(k,i))), oder (10)
H(k,i) = max (b, (1-a.√NIR'(k,i))), (11)
wobei a und b positive reelle Zahlen sind,
vorzugsweise a ein Element aus dem Interval [1;4] ist, und
vorzugsweise b ein Element aus dem Interval [0,1;0,3] ist.
Die Vorteile dieser Ausgestaltung bestehen darin, daß mit ihr eine qualitativ hoch­ wertige Reduktion von Störungen erzielt werden kann und der rechentechnische Auf­ wand für die Ausführung des Verfahrens wesentlich geringer ist als beispielsweise bei Verwendung der in [3] vorgeschlagenen Besselfunktionen. Die vorzugsweise Auswahl der Parameter a und b aus den genannten Intervallen hat sich vor allem bei der Reduk­ tion von Störungen von Sprachsignalen als vorteilhaft erwiesen.
In einer weiteren vorteilhaften Ausgestaltung der Erfindung betreffend das Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion wird die Lage der Abbruchkante der Filterkennlinie an das gestörte Signal adaptiert, vorzugsweise derart,
daß sich die Lage der Abbruchkante bei der Filterung von Signalen hoher Frequenz unterscheidet von der Lage der Abbruchkante bei der Filterung von Signalen niedrigerer Frequenz, und/oder
daß sich die Lage der Abbruchkante bei der Filterung von Sprachsignalen unterscheidet von der Lage der Abbruchkante bei der Filterung von Sprachpausen.
Bei Sprachsignalen sind die höheren Frequenzen im Mittel energieärmer als die tieferen Frequenzen. Die höheren Frequenzen spielen aber eine wichtige Rolle bei der Sprachver­ ständlichkeit. Durch die Wahl der Lage der Abbruchkante kann für höhere Frequenzen eine Bevorzugung, z. B. eine geringere Dämpfung, erreicht werden, was zur Ver­ besserung der subjektiven Sprachqualität beiträgt.
In einer weiteren vorteilhaften Ausgestaltung der Erfindung betreffend das Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion erfolgt die Adaption der Lage der Abbruchkante der Filterkenn­ linie an das gestörte Signal
  • - derart, daß vor der Berechnung des aktuellen Kennwertes H(k,i) das Noise-Input-Ratio NIR(k,i) durch ein korrigiertes Noise-Input-Ratio
    wobei die Gewichtungsfaktoren wj reelle Zahlen kleiner 1 sind und N eine natürliche Zahl größer gleich 1 ist,
  • - vorzugsweise derart, daß vor der Berechnung des aktuellen Kennwertes H(k,i) das Noise-Input-Ratio NIR(k,i) durch ein korrigiertes Noise-Input-Ratio
    NIR'(k,i) := NIR(k,i)/[c(i) + (1-c(i)) H(k-1,i)] ersetzt wird (13)
Die Vorteile dieser Ausgestaltung bestehen darin, daß mit ihr die vorgenannte Ver­ schiebung der Lage der Abbruchkante auf einfache Weise erzielt werden kann, insbe­ sondere in der zweitgenannten, vorzugsweisen Ausgestaltung.
In einer weiteren vorteilhaften Ausgestaltung der Erfindung betreffend das Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion werden der oder die für die Berechnung des aktuellen korri­ gierten Noise-Input-Ratios NIR'(k,i) benötigten Filterkennwerte H(k-j,i) aus zurück­ liegenden Zeitsegmenten k-j vor der Berechnung des Noise-Input-Ratios NIR'(k,i) zunächst selbst korrigiert in der Form
H'(k-j,i) := fj H(k-j,i)ej , fj und ej reelle Zahlen (14)
Sprachqualität ist ein subjektiver Begriff, der mit Attributen wie z. B. Natürlichkeit, Verzerrungsfreiheit, Rauschfreiheit, ermüdungsarmes Hören, usw. belegt werden kann. Ein störendes Geräusch kann abhängig von seiner Art sehr unterschiedlichen zeitlichen und/oder spektralen Charakter aufweisen. Eine Parametrisierung gemäß Gleichung (14) ermöglicht über die zusätzlichen Freiheitsgrade oder Parameter e und f eine Beein­ flussung des Rückkopplungsmechanismusses und erlaubt so eine Veränderung der subjektiven Qualität der Sprache und der Reststörungen.
Besonders vorteilhaft erweist sich das Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion in den vorgenannten Ausführungsformen bei einer Verwendung zur Reduktion von Störungen in Sprachsignalen.
Im Folgenden wird anhand beispielhafter Ausführungen und Figuren das erfindungs­ gemäße Verfahren zur Reduktion von Störungen akustischer Signale mittels der adap­ tiven Filter-Methode der spektralen Subtraktion näher erläutert:
Es wird hier vorausgesetzt, daß die Signalpausen, in diesem Ausführungsbeispiel die Sprachpausen, genügend genau erkannt werden können. Dann kann das System zur Geräuschreduktion mittels des Pausengeräusches initialisiert werden. Hier wird der sogenannte 'spectral floor' b aus dem Geräuschmittelwert des Pausengeräusches bestimmt und der Anfangskennwert der Filterfunktion H(0,i) = b gesetzt. Dies kann auch für mehrere verschiedene Spektrallinien mit unterschiedlichen Frequenzen i erfolgen. Das System wird in jeder neuen Sprachpause adaptiert.
Fig. 1 zeigt die aus der Literatur bekannten Kennlinien der Standardfilterfunktionen (1) bis (3). Als 'Gain' wird dabei der Wert der H der Filterfunktion zu einem Zeitpunkt k und bei der Frequenz i bezeichnet. Der 'spectral floor' ist hier auf den Wert 0,2 festgesetzt. Der Kennwert H der Filterfunktion ('Gain') nimmt bei zunehmender Störung, also bei zunehmenden Noise-Input-Ratio NIR, ab.
Fig. 2 zeigt die Kennlinien der erfindungsgemäß modifizierten Standardfilterfunktionen (9) bis (11). In diesem Ausführungsbeispiel erfolgt die Berücksichtigung von Informatio­ nen über einen a priori Signal-zu-Rausch-Abstand derart, daß als alleinige Information über den a priori Signal-zu-Rausch-Abstand der Kennwert H(k-1,i) der jeweiligen Filter­ funktion aus dem direkt zurückliegenden Zeitsegment k-1 verwendet wird. Besonders auffällig im Vergleich zu Fig. 1 ist die scharfe Abbruchkante, die die Filterfunktion in zwei Bereiche aufteilt. Einen Bereich für die signalunabhängige starke Dämpfung für die Filterung von stark gestörten Signalen X(k,i) mit einem hohen Noise-Input-Ratio NIR(k,i) und einen für die signalabhängige geringe Dämpfung für die Filterung von wenig ge­ störten Signalen X(k,i) mit einem niedrigen Noise-Input-Ratio NIR(k,i).
Fig. 3 zeigt die Auswirkungen der Änderung des Parameters c(i) gemäß der Gleichung (13) auf die Lage der Abbruchkante der Filterkennlinie der 'power subtraction' (9). Mit zunehmendem Wert dieses Parameters c(i) verschiebt sich die Lage der Abbruchkante zu höheren Noise-Input-Ratio N/R(k,i) und erfolgt die 'Abschaltung' des Filters später.
In den beiden Fig. 4 und 5 sind jeweils das gleiche gestörte Sprachsignal X sowie die Auswirkungen verschiedener Filterungen auf den Sprachschätzwert E aufgetragen. In den ersten 20 Zeittakten liegt der Sprachpegel S jeweils bei einem minimalen Wert von -40 dB und steigt dann ab dem 21-ten Zeittakt sprunghaft auf einen Wert von 10 dB an. Im gesamten Meßzeitraum wird ein Störgeräusch N mit einem Pegel von circa 0 dB überlagert.
Fig. 4 zeigt die Auswirkungen einer erfindungsgemäß modifizierten Filterung auf das gestörtes Sprachsignal X, hier mittels 'Power Subtraction' entsprechend Gleichung (9). Im Vergleich dazu zeigt Fig. 5 die Auswirkungen der Standardfilterung mittels 'Power Subtraction' entsprechend Gleichung (1) auf das gleiche gestörte Sprachsignal.
Durch die erfindungsgemäß modifizierte Filterung (Fig. 4) wird in der Sprachpause, d. h. bis zum 20-ten Zeittakt (hier als 'index' bezeichnet), die volle Geräuschdämpfung von 14 dB erreicht, entsprechend einem 'spectral floor' von b = 0,2. Die erfindungs­ gemäß modifizierte Filterung schaltet den Sprachpegel mit Beginn des Sprachsignals S beim 21-ten Zeittakt praktisch verzögerungsfrei durch und filtert/dämpft dann signal­ abhängig. Zum Vergleich zeigt Fig. 5 die Auswirkungen der Standardfilterung auf das gleiche gestörte Sprachsignal. Hier wird in der Sprachpause die Dämpfung von 14 dB bei den unregelmäßig erfolgenden Geräuschanstiegen nicht erreicht. Dies wird dann als 'musical tone' hörbar. Fig. 4 weist dagegen eine konstante Pausendämpfung auf, d. h. das Störgeräusch N wird in der natürlichen Ausprägung mit einem 14 dB geringeren Pegel ausgegeben.
Das erfindungsgemäße Verfahren samt Vorrichtungen erweist sich in den beschrie­ benen Ausführungsformen als besonders geeignet für die Reduktion von Störungen in Sprachsignalen. Weitere denkbare Anwendungsmöglichkeiten ergeben sich zum Beispiel bei der Rauschunterdrückung in Musikstücken, vor allem bei alten Aufnahmen oder anderen mit mangelhafter Aufnahmequalität oder sonstigen Störeinflüssen.
Die Erfindung ist nicht nur auf die zuvor beschriebenen Ausführungsformen beschränkt, sondern vielmehr auf weitere übertragbar.
So ist zum Beispiel denkbar, anstatt die Filterung an einer einzelnen Spektrallinie durchzuführen, einen verallgemeinerten Ansatz zur Spektralanalyse, zum Beispiel mit einer aus der Literatur [4] bekannten Polyphasenfilterbank, zu verwenden, um dann die Signale der Filterbank mit dem gleichen Verfahren zu Filtern.
Literatur
[1] Boll, "Suppression of Acoustic Noise in Speech using Spectral Subtraction";
IEEE Trans. Acoust. Spech a. Signal Processing, Vol. ASSP-27, No. 2, p. 113-120, 1979
[2] Linhard, "Adaptive Geräuschreduktion im Frequenzbereich bei Sprachüber­ tragung"; Dissertation Universität Karlsruhe, 1988
[3] Ephraim, Malah, "Speech Enhancement using a Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator";
IEEE Trans. Acoust. Spech a. Signal Processing, Vol. ASSP-32, No. 6, S. 1109-1121, 1984
[4] Vaiy, "On the Enhancement of Noisy Speech", in "Signal Processing II" edited by Schussler, Elsevier Science Publishers B.V., p. 327-330, 1983

Claims (8)

1. Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion,
  • - bei dem die gestörten Signale X(k,i) in Zeitsegmenten k und der diskreten Frequenz i segmentweise mittels einer adaptiven Filterfunktion H(k,i) gefiltert werden, und
  • - bei dem für jedes Zeitsegment k und Frequenz i ein reales Noise-Input-Ratio NiR(k,i) derart bestimmt wird,
    • - daß es bei Signalen mit geringem Störgeräuschanteil kleine Werte aufweist, und
    • - daß es bei Signalen mit hohem Störgeräuschanteil große Werte aufweist, und
    • - bei dem die Adaption der Filterfunktion H(k,i) derart erfolgt,
    • - daß für die Berechnung des aktuellen Kennwertes H(k,i) der Filterfunktion Informationen über einen a priori Signal-zu-Rausch-Abstand berücksichtigt werden,
dadurch gekennzeichnet,
  • - daß die Kennlinie der Filterfunktion zweigeteilt ist und eine Abbruchkante aufweist, derart,
    • - daß die Filterung für stark gestörte Signale X(k,i) mit einem hohen Noise-Input-Ratio NIR(k,i) zu einer signalunabhängigen starken Dämpfung führt, und
    • - daß die Filterung für wenig gestörte Signale X(k,i) mit einem niedrigen Noise-Input-Ratio NIR(k,i) zu einer signalabhängigen geringen Dämpfung führt, und
  • - daß als alleinige Information über den a priori Signal-zu-Rausch-Abstand Kennwerte H(kj,i), j = 1, . . ., N der Filterfunktion aus zurückliegenden Zeitsegmenten k-j verwendet werden, mindestens jedoch ein Kennwert H(k-j0,i), j0 ∈ 1, . . ., N der Filterfunktion aus einem zurückliegenden Zeitsegment k-j0 verwendet wird.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß als alleinige Information über den a priori Signal-zu-Rausch-Abstand der Kennwert H(k-1,i) der Filterfunktion aus dem direkt zurückliegenden Zeitsegment k-1 verwendet wird.
3. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet,
  • - daß die Berechnung des aktuellen Kennwertes H(k,i) der Filterfunktion aus dem signalabhängigen Noise-Input-Ratio NIR(k,i) erfolgt, und
  • - daß die Berücksichtigung von Informationen über den a priori Signal-zu-Rausch- Abstand derart erfolgt, daß vor der Berechnung des aktuellen Kennwertes H(k,i) das Noise-Input-Ratio NIR(k,i) durch ein korrigiertes Noise-Input-Ratio
    ersetzt wird,
    wobei die Gewichtungsfaktoren wj reelle Zahlen kleiner 1 sind und N eine natürliche Zahl größer gleich 1 ist.
4. Verfahren nach Anspruch 3, dadurch gekennzeichnet, daß als Filterfunktion verwendet wird
H(k,i) = max (b, √1-a.NIR'(k,i)), oder
H(k,i) = max (b, (1-a.NIR'(k,i))), oder
H(k,i) = max (b, (1-a.√NIR'(k,i))),
wobei a und b positive reelle Zahlen sind,
vorzugsweise a ein Element aus dem Interval [1;4] ist, und
vorzugsweise b ein Element aus dem Interval [0,1;0,3] ist.
5. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet,
daß die Lage der Abbruchkante der Filterkennlinie an das gestörte Signal adaptiert wird, vorzugsweise derart,
daß sich die Lage der Abbruchkante bei der Filterung von Signalen hoher Frequenz unterscheidet von der Lage der Abbruchkante bei der Filterung von Signalen niedrigerer Frequenz, und/oder
daß sich die Lage der Abbruchkante bei der Filterung von Sprachsignalen unterscheidet von der Lage der Abbruchkante bei der Filterung von Sprachpausen.
6. Verfahren nach Anspruch 5, dadurch gekennzeichnet, daß die Lage der Abbruchkante der Filterkennlinie an das gestörte Signal adaptiert wird,
  • - derart, daß vor der Berechnung des aktuellen Kennwertes H(k,i) das Noise-Input-Ratio NIR(k,i) durch ein korrigiertes Noise-Input-Ratio
    ersetzt wird,
    wobei die Gewichtungsfaktoren wj reelle Zahlen kleiner 1 sind und N eine natürliche Zahl größer gleich 1 ist,
  • - vorzugsweise derart, daß vor der Berechnung des aktuellen Kennwertes H(k,i) das Noise-Input-Ratio NIR(k,i) durch ein korrigiertes Noise-Input-Ratio
    NIR'(k,i) := NIR(k,i)/[c(i) + (1-c(i)) H(k-1,i)] ersetzt wird.
7. Verfahren nach einem der vorhergehenden Ansprüche, dadurch gekennzeichnet, daß der oder die für die Berechnung des aktuellen korrigierten Noise-Input-Ratios NIR'(k,i) benötigten Filterkennwerte H(k-j,i) aus zurückliegenden Zeitsegmenten k-j vor der Berechnung des Noise-Input-Ratios NiR'(k,i) zunächst selbst korrigiert werden in der Form H'(k-j,i) := fj H(k-j,i)ej , fj und ej reelle Zahlen.
8. Verwendung eines Verfahrens zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion gemäß einem der vor­ hergehenden Absprüche zur Reduktion von Störungen in Sprachsignalen.
DE19747885A 1997-10-30 1997-10-30 Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion Expired - Lifetime DE19747885B4 (de)

Priority Applications (3)

Application Number Priority Date Filing Date Title
DE19747885A DE19747885B4 (de) 1997-10-30 1997-10-30 Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion
US09/530,527 US6643619B1 (en) 1997-10-30 1998-10-22 Method for reducing interference in acoustic signals using an adaptive filtering method involving spectral subtraction
PCT/EP1998/006707 WO1999023642A1 (de) 1997-10-30 1998-10-22 Verfahren zur reduktion von störungen akustischer signale mittels der adaptiven filter-methode der spektralen subtraktion

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE19747885A DE19747885B4 (de) 1997-10-30 1997-10-30 Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion

Publications (2)

Publication Number Publication Date
DE19747885A1 true DE19747885A1 (de) 1999-05-06
DE19747885B4 DE19747885B4 (de) 2009-04-23

Family

ID=7847058

Family Applications (1)

Application Number Title Priority Date Filing Date
DE19747885A Expired - Lifetime DE19747885B4 (de) 1997-10-30 1997-10-30 Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion

Country Status (3)

Country Link
US (1) US6643619B1 (de)
DE (1) DE19747885B4 (de)
WO (1) WO1999023642A1 (de)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8396234B2 (en) 2008-02-05 2013-03-12 Phonak Ag Method for reducing noise in an input signal of a hearing device as well as a hearing device

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7117149B1 (en) * 1999-08-30 2006-10-03 Harman Becker Automotive Systems-Wavemakers, Inc. Sound source classification
US20020054685A1 (en) * 2000-11-09 2002-05-09 Carlos Avendano System for suppressing acoustic echoes and interferences in multi-channel audio systems
US20030171900A1 (en) * 2002-03-11 2003-09-11 The Charles Stark Draper Laboratory, Inc. Non-Gaussian detection
US7895036B2 (en) 2003-02-21 2011-02-22 Qnx Software Systems Co. System for suppressing wind noise
US7949522B2 (en) 2003-02-21 2011-05-24 Qnx Software Systems Co. System for suppressing rain noise
US7885420B2 (en) 2003-02-21 2011-02-08 Qnx Software Systems Co. Wind noise suppression system
US8326621B2 (en) 2003-02-21 2012-12-04 Qnx Software Systems Limited Repetitive transient noise removal
US8271279B2 (en) 2003-02-21 2012-09-18 Qnx Software Systems Limited Signature noise removal
US8073689B2 (en) 2003-02-21 2011-12-06 Qnx Software Systems Co. Repetitive transient noise removal
US7725315B2 (en) 2003-02-21 2010-05-25 Qnx Software Systems (Wavemakers), Inc. Minimization of transient noises in a voice signal
DE10342307B4 (de) * 2003-09-12 2005-08-04 Siemens Ag Verfahren zur Entstörung übermittelter Audiosignale zwischen Telekommunikationsendgeräten
CA2566751C (en) * 2004-05-14 2013-07-16 Loquendo S.P.A. Noise reduction for automatic speech recognition
US8543390B2 (en) 2004-10-26 2013-09-24 Qnx Software Systems Limited Multi-channel periodic signal enhancement system
US7716046B2 (en) 2004-10-26 2010-05-11 Qnx Software Systems (Wavemakers), Inc. Advanced periodic signal enhancement
US7610196B2 (en) * 2004-10-26 2009-10-27 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US7949520B2 (en) 2004-10-26 2011-05-24 QNX Software Sytems Co. Adaptive filter pitch extraction
US8170879B2 (en) 2004-10-26 2012-05-01 Qnx Software Systems Limited Periodic signal enhancement system
US8306821B2 (en) * 2004-10-26 2012-11-06 Qnx Software Systems Limited Sub-band periodic signal enhancement system
US7680652B2 (en) 2004-10-26 2010-03-16 Qnx Software Systems (Wavemakers), Inc. Periodic signal enhancement system
US8284947B2 (en) * 2004-12-01 2012-10-09 Qnx Software Systems Limited Reverberation estimation and suppression system
US8027833B2 (en) * 2005-05-09 2011-09-27 Qnx Software Systems Co. System for suppressing passing tire hiss
US8311819B2 (en) 2005-06-15 2012-11-13 Qnx Software Systems Limited System for detecting speech with background voice estimates and noise estimates
US8170875B2 (en) 2005-06-15 2012-05-01 Qnx Software Systems Limited Speech end-pointer
JP4765461B2 (ja) * 2005-07-27 2011-09-07 日本電気株式会社 雑音抑圧システムと方法及びプログラム
US7813923B2 (en) * 2005-10-14 2010-10-12 Microsoft Corporation Calibration based beamforming, non-linear adaptive filtering, and multi-sensor headset
US7565288B2 (en) * 2005-12-22 2009-07-21 Microsoft Corporation Spatial noise suppression for a microphone array
EP2006841A1 (de) * 2006-04-07 2008-12-24 BenQ Corporation Signalverarbeitungsverfahren und Trainingsverfahren und Vorrichtungen dazu
US7844453B2 (en) 2006-05-12 2010-11-30 Qnx Software Systems Co. Robust noise estimation
US8326620B2 (en) 2008-04-30 2012-12-04 Qnx Software Systems Limited Robust downlink speech and noise detector
US8335685B2 (en) 2006-12-22 2012-12-18 Qnx Software Systems Limited Ambient noise compensation system robust to high excitation noise
US7912567B2 (en) * 2007-03-07 2011-03-22 Audiocodes Ltd. Noise suppressor
US8850154B2 (en) 2007-09-11 2014-09-30 2236008 Ontario Inc. Processing system having memory partitioning
US8904400B2 (en) 2007-09-11 2014-12-02 2236008 Ontario Inc. Processing system having a partitioning component for resource partitioning
US8694310B2 (en) 2007-09-17 2014-04-08 Qnx Software Systems Limited Remote control server protocol system
US8209514B2 (en) 2008-02-04 2012-06-26 Qnx Software Systems Limited Media processing system having resource partitioning
US9020158B2 (en) 2008-11-20 2015-04-28 Harman International Industries, Incorporated Quiet zone control system
US8135140B2 (en) 2008-11-20 2012-03-13 Harman International Industries, Incorporated System for active noise control with audio signal compensation
US8718289B2 (en) 2009-01-12 2014-05-06 Harman International Industries, Incorporated System for active noise control with parallel adaptive filter configuration
US8189799B2 (en) 2009-04-09 2012-05-29 Harman International Industries, Incorporated System for active noise control based on audio system output
US8199924B2 (en) 2009-04-17 2012-06-12 Harman International Industries, Incorporated System for active noise control with an infinite impulse response filter
US8077873B2 (en) 2009-05-14 2011-12-13 Harman International Industries, Incorporated System for active noise control with adaptive speaker selection

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995012919A1 (en) * 1993-11-01 1995-05-11 Qualcomm Incorporated A variable block size adaptation algorithm for noise-robust acoustic echo cancellation
WO1995016259A1 (en) * 1993-12-06 1995-06-15 Philips Electronics N.V. A noise reduction system and device, and a mobile radio station
DE4445983A1 (de) * 1994-12-22 1996-06-27 Becker Gmbh Rauschunterdrückung
WO1996024128A1 (en) * 1995-01-30 1996-08-08 Telefonaktiebolaget Lm Ericsson Spectral subtraction noise suppression method
DE19509149A1 (de) * 1995-03-14 1996-09-19 Donald Dipl Ing Schulz Codierverfahren
WO1997010586A1 (en) * 1995-09-14 1997-03-20 Ericsson Inc. System for adaptively filtering audio signals to enhance speech intelligibility in noisy environmental conditions

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
US5251263A (en) * 1992-05-22 1993-10-05 Andrea Electronics Corporation Adaptive noise cancellation and speech enhancement system and apparatus therefor
CN1129486A (zh) 1993-11-30 1996-08-21 美国电报电话公司 通信系统中降低传输噪声的方法
JP3484757B2 (ja) * 1994-05-13 2004-01-06 ソニー株式会社 音声信号の雑音低減方法及び雑音区間検出方法
US5544250A (en) * 1994-07-18 1996-08-06 Motorola Noise suppression system and method therefor
US5768473A (en) * 1995-01-30 1998-06-16 Noise Cancellation Technologies, Inc. Adaptive speech filter
DE19524847C1 (de) * 1995-07-07 1997-02-13 Siemens Ag Vorrichtung zur Verbesserung gestörter Sprachsignale
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5806025A (en) * 1996-08-07 1998-09-08 U S West, Inc. Method and system for adaptive filtering of speech signals using signal-to-noise ratio to choose subband filter bank
WO1999001942A2 (en) * 1997-07-01 1999-01-14 Partran Aps A method of noise reduction in speech signals and an apparatus for performing the method
US6415253B1 (en) * 1998-02-20 2002-07-02 Meta-C Corporation Method and apparatus for enhancing noise-corrupted speech

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1995012919A1 (en) * 1993-11-01 1995-05-11 Qualcomm Incorporated A variable block size adaptation algorithm for noise-robust acoustic echo cancellation
WO1995016259A1 (en) * 1993-12-06 1995-06-15 Philips Electronics N.V. A noise reduction system and device, and a mobile radio station
DE4445983A1 (de) * 1994-12-22 1996-06-27 Becker Gmbh Rauschunterdrückung
WO1996024128A1 (en) * 1995-01-30 1996-08-08 Telefonaktiebolaget Lm Ericsson Spectral subtraction noise suppression method
DE19509149A1 (de) * 1995-03-14 1996-09-19 Donald Dipl Ing Schulz Codierverfahren
WO1997010586A1 (en) * 1995-09-14 1997-03-20 Ericsson Inc. System for adaptively filtering audio signals to enhance speech intelligibility in noisy environmental conditions

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8396234B2 (en) 2008-02-05 2013-03-12 Phonak Ag Method for reducing noise in an input signal of a hearing device as well as a hearing device

Also Published As

Publication number Publication date
DE19747885B4 (de) 2009-04-23
WO1999023642A1 (de) 1999-05-14
US6643619B1 (en) 2003-11-04

Similar Documents

Publication Publication Date Title
DE19747885B4 (de) Verfahren zur Reduktion von Störungen akustischer Signale mittels der adaptiven Filter-Methode der spektralen Subtraktion
EP0948237B1 (de) Verfahren zur Störbefreiung eines Mikrophonsignals
DE112009000805B4 (de) Rauschreduktion
DE112011104737B4 (de) Geräuschunterdrückungsvorrichtung
DE60104091T2 (de) Verfahren und Vorrichtung zur Sprachverbesserung in verrauschte Umgebung
EP2158588B1 (de) Spektralglättungsverfahren von verrauschten signalen
DE69738288T2 (de) Einrichtung zur unterdrückung einer störenden komponente eines eingangssignals
DE69720087T2 (de) Verfahren und Vorrichtung zur Unterdrückung von Hintergrundmusik oder -geräuschen im Eingangssignal eines Spracherkenners
DE2719973A1 (de) Verfahren und vorrichtung zum adaptiven filtern von fast stationaerem geraeusch aus sprache
DE19629132A1 (de) Verfahren zur Verringerung von Störungen eines Sprachsignals
DE112007003674T5 (de) Methode und Apparat zur Einkanal-Sprachverbesserung basierend auf einem latenzzeitreduzierten Gehörmodell
DE102013011761A1 (de) Kraftfahrzeug mit einer Freisprecheinrichtung und Verfahren zur Erzeugung eines Frequenzganges für Freisprecheinrichtungen
EP3065417B1 (de) Verfahren zur unterdrückung eines störgeräusches in einem akustischen system
DE10157535B4 (de) Verfahren und Vorrichtung zur Reduzierung zufälliger, kontinuierlicher, instationärer Störungen in Audiosignalen
WO2001047335A2 (de) Verfahren zur elimination von störsignalanteilen in einem eingangssignal eines auditorischen systems, anwendung des verfahrens und ein hörgerät
DE60033039T2 (de) Vorrichtung und verfahren zur unterdrückung von zischlauten unter verwendung von adaptiven filteralgorithmen
EP0669606B1 (de) Verfahren zur Geräuschreduktion eines gestörten Sprachsignals
DE102019102414B4 (de) Verfahren und System zur Detektion von Reibelauten in Sprachsignalen
DE3230391C2 (de)
DE10025655B4 (de) Verfahren zum Entfernen einer unerwünschten Komponente aus einem Signal und System zum Unterscheiden zwischen unerwünschten und erwünschten Signalkomponenten
WO2003037032A1 (de) Verfahren und vorrichtung zur störbefreiung eines redundanten akustischen signals
DE19729521A1 (de) Verfahren und Vorrichtung zur Stör- und Echounterdrückung
DE10010037B4 (de) Verfahren zur Rekonstruktion tieffrequenter Sprachanteile aus mittelhohen Frequenzanteilen
EP1062659B1 (de) Verfahren und vorrichtung zur bearbeitung eines tonsignals
DE10137395C1 (de) Verfahren zur Unterdrückung von Störschall

Legal Events

Date Code Title Description
OM8 Search report available as to paragraph 43 lit. 1 sentence 1 patent law
8127 New person/name/address of the applicant

Owner name: HARMAN BECKER AUTOMOTIVE SYSTEMS (BECKER DIVISION)

8110 Request for examination paragraph 44
8127 New person/name/address of the applicant

Owner name: HARMAN BECKER AUTOMOTIVE SYSTEMS GMBH, 76307 KARLS

8364 No opposition during term of opposition
R071 Expiry of right