WO2000052917A1

WO2000052917A1 - Vorrichtung und verfahren zur geräuschunterdrückung in fernsprecheinrichtungen

Info

Publication number: WO2000052917A1
Application number: PCT/DE2000/000297
Authority: WO
Inventors: Gerhard Schmidt
Original assignee: Infineon Technologies Ag
Priority date: 1999-02-26
Filing date: 2000-02-01
Publication date: 2000-09-08
Also published as: EP1155561B1; DE50012821D1; EP1155561A1; US6970558B1

Abstract

Vorrichtung und Verfahren zur Geräuschunterdrückung in Fernsprecheinrichtungen, insbesondere mit Freisprecheinrichtung, mit einer Pegelwaage, wobei im Sende- und Empfangspfad der Fernsprecheinrichtung ein zusätzliches Filter mit einer Gruppenlaufzeit von weniger als 2 ms eingesetzt ist.

Description

Beschreibung

Vorrichtung und Verfahren zur Gerauschunterdruckung m Fernsprechemrichtungen

Die vorliegende Erfindung betrifft eine Vorrichtung und ein Verfahren zur Gerauschunterdruckung in Fernsprecheinrichtun- gen.

Insbesondere betrifft die vorliegende Erfindung eine solche Vorrichtung und ein solches Verfahren zur Verwendung m Fern- sprechemrichtungen mit Freisprecheinrichtung und mit einer Pegelwaage .

Im Stand der Technik sind bereits Vorrichtungen und Verfahren zur Gerauschunterdruckung m Fernsprecheinrichtungen, insbesondere mit Freisprecheinrichtung mit einer Pegelwaage bekannt. Diese Vorrichtungen weisen jedoch den Nachteil auf, daß die dort verwendeten Echounterdruckungen entweder sehr empfindlich gegen Störgeräusche sind (durch Störgeräusche auf Seiten des freisprechenden Gesprachsteilnehmers wird auf Ge- gensprechen erkannt, obwohl der freisprechende Teilnehmer zur Zeit nicht spricht) , zum anderen weisen mit entsprechenden Gerauschunterdruckungsflltern versehene Vorrichtungen gemäß dem Stand der Technik eine erhebliche Laufzeitverzogerung auf. Diese ist zwar m manchen Standards zulassig (beispielsweise bei GSM oder Videokonferenzanwendungen) , beim normalen Festnetzbetrieb ist die entsprechende Laufzeitverzogerung jedoch zu groß.

Es ist daher die Aufgabe der vorliegenden Erfindung, eine solche Vorrichtung und ein solches Verfahren dergestalt weiterzubilden, daß Nebengerausche wesentlich besser unterdruckt werden, und trotzdem keine unzulässig hohen Signalverzogerun- gen entstehen. Erfmdungsgemaß wird diese Aufgabe durch eine entsprechende Vorrichtung gelost, bei der im Sendepfad der Fernsprechein^¬ richtung ein zusätzliches Filter mit extrem kurzer Laufzeit angeordnet ist.

Es ist dabei weiter bevorzugt, auch im Empfangspfad der Fern- sprechemπchtung ein solches zusätzliches Filter mit extrem kurzer Laufzeit anzuordnen.

Das oder die zusätzlichen Filter sollten dabei eine Gruppenlaufzeit von < 2 ms aufweisen.

Um eine bessere Anpassung an wechselnde Störgeräusche zu erreichen, ist es besonders bevorzugt, daß das oder die zusatz- liehen Filter einstellbare Koeffizienten aufweisen und eine Steuerschaltung zur Einstellung der Koeffizienten vorgesehen ist .

Eine besonders geringe Signallaufzeit laßt sich vorzugsweise dadurch erzielen, daß das oder die zusätzlichen Filter im Vollbandbereich arbeiten, wahrend die Steuerschaltung zur Koeffizenteneinstellung im Teilbandbereich arbeitet.

Um eine hohe Frequenzselektivitat wegen der leistungsstarken niederfrequenten Signalanteile bei Sprache und gleichtzeitig eine möglichst geringe Laufzeit der Koefflzientenemstellung zu erzielen, ist es besonders bevorzugt, m der Steuerschaltung das Eingangssignal mit einer DFT-modulierten Polyphasen- filterbank mit phasenminimalem Prototyptiefpaßfllter zu ver- binden.

Zur Verbesserung von Nebengerauschen ist es besonders bevorzugt, die unterabgetasteten Ausgangssignale der Polyphasen- Filterbank an eine Kurzzeitleistungsschatzungsvorπchtung an zuschließen. Dabei ist es besonders bevorzugt, die Ausgange der Kurzzeit- leistungsschatzungsvorrichtung, die die Schatzwerte der Teil- bandleistungen tragen, mit einer Vorrichtung zur Schätzung der Leistungen des Hintergrundgeräusches und einer Vornch- tung zur psychoakustischen Gewichtung der gestörten Teilband- leistungen zu verbinden.

Weiter ist es bevorzugt, die Ausgange der Vorrichtung zur Schätzung der Leistungen des Hintergrundgeräusches über eine Vorrichtung zur nichtlinearen Anhebung der Gerauschsignale und die Ausgange der Vorrichtung zur psychoakustischen Gewichtung direkt mit einer Vorrichtung zur Berechnung der Teilbandgewichtungsfaktoren zu verbinden.

Weiter ist es bevorzugt, die Ausgange der Vorrichtung zur Berechnung der Teilbandgewichtungsfaktoren mit einer Vorrichtung zu einer modifizierten inversen diskreten Fouriertrans- formation zu verbinden, deren Ausgang mit dem Koeffizienteneingang des oder der zusätzlichen Filter verbunden ist.

Es ist dabei weiter bevorzugt, daß zumindest ein Teil der Ausgange der Kurzzeitleistungsschatzungsvorπchtung mit einer Vorrichtung zum Dampfungsausgleich verbunden sind, deren Ausgang mit einem Steuereingang der Vorrichtung zur Berechnung der Teilbandgewichtungsfaktoren verbunden ist.

Im Hinblick auf die Reduzierung der Signalverzogerung ist es besonders bevorzugt, daß es sich bei dem oder den zusätzlichen Filtern um kurze Transversalfilter handelt, vorzugsweise mit einer sehr geringen Ordnung von < 20.

Zur Losung der o.g. Aufgabe lehrt die vorliegende Erfindung auch ein gattungsgemaßes Verfahren, bei dem das Sendesignal der Fernsprecheinrichtung einer zusätzlichen Filterung mit sehr geringer Laufzeit unterworfen wird. Es ist dabei besonders bevorzugt, auch das Empfangssignal der Fernsprecheinrichtung einer solchen zusätzlichen Filterung mit sehr geringer Laufzeit zu unterwerfen.

Im Hinblick auf die Anforderungen an Festnetztelefonverbm- dungen ist es besonders bevorzugt, daß die Gruppenlaufzeit für die zusätzlichen Filterungen auf weniger als 2 ms eingestellt wird.

Es ist dabei besonders bevorzugt, daß die Filterung mittels kurzer Transversalfllter durchgeführt wird, deren Ordnung vorzugsweise kleiner als 20 ist.

Es ist dabei besonders bevorzugt, daß die Transversalfilter mit einstellbaren Koeffizienten gesteuert werden, die für beide Transversalfllter auf die gleiche Weise eingestellt werden.

Eine besonders schnelle und rechenzeiteffektive Verarbeitung laßt sich vorzugsweise dadurch erzielen, daß die Filterung im Vollbandbereich durchgeführt wird, wahrend die Bestimmung der Koeffizienten im Teilbandbereich durchgeführt wird.

Vorzugsweise werden mehrere, unterschiedliche Abtastraten m- nerhalb des Verfahrens verwendet.

Erfmdungsgemaß ist es besonders bevorzugt, die Bestimmung der Koeffizienten mittels einer Teilbandanalyse und einer Rucktransformation mittels einer modifizierten inversen dis- kreten Fouπertransformation durchzufuhren.

Dabei wird die modifizierte mverse die Fouriertransformation vorzugsweise auf die Teilbandfllterkoefflzienten angewendet.

Es ist dabei besonders bevorzugt, die Teilbandanalyse mittels einer Filterbank m Frequenzteilbandern zu implementieren. Die Filterbank wird dabei vorzugsweise als mittels digitaler Fouriertransformation modulierte Polyphasenfllterbank mit phasenminimalem Prototyptiefpaßfilter ausgeführt.

Es ist dabei besonders bevorzugt, daß bei der Bestimmung der Koeffizienten zusätzlich eine Kurzzeitleistungsschatzung mittels nichtlinearer Betragsglattungen der Teilbandsignale durchgeführt wird.

Vorzugsweise erfolgt bei der Bestimmung der Koeffizienten zusätzlich eine psychoakustische Gewichtung der geschätzten Summensignalleistungen.

Weiter ist es vorteilhaft, bei der Bestimmung der Koeffizien- ten zusätzlich eine nichtlineare Anhebung der Gerauschlei- stungen durchzufuhren. Dadurch können vorteilhafterweise verfahrensbedingte Störgeräusche, sogenannte "Musical tones" verhindert werden.

Damit nicht der Eindruck entsteht, der ferne Sprecher wurde bei Einsetzen von Störgeräuschen plötzlich leiser sprechen, ist es bevorzugt, bei der Bestimmung der Koeffizienten zusätzlich eine automatische Verstarkungssteuerung zu verwenden, welche die Filterkoefflzienten so gewichtet, daß das ge- rauscherfullte und das gerauschreduzierte Signal ein nahe- rungsweise gleiches Lautheitsempfinden hervorrufen.

Im Unterschied zu bisherigen Verfahren hat die vorliegende Erfindung den großen Vorteil, daß lediglich eine sehr geringe Signalverzogerung erfolgt und für das Gesamtverfahren nur ein relativ geringer Rechenaufwand erforderlich ist.

Die vorliegende Erfindung wird im folgenden anhand der beigefugten Zeichnungen naher erläutert. Es zeigt:

Fig . 1 das Modell einer Freisprecheinrichtung; Fig. 2 eine ausführlichere Darstellung mit den jeweils auf^¬ tretenden lokalen und fernen Hintergrundgeräuschen;

Fig. 3 eine Übersichtsdarstellung einer erfmdungsgemaßen Freisprecheinrichtung;

Fig. 4 die Dampfungsanforderungen in Abhängigkeit von der Echolaufzeit ;

Fig. 5 eine Ubersichtsdarstellung einer erfmdungsgemaßen Gerauschunterdruckung;

Fig. 6 ein gemitteltes Sprachspektrum deutscher Sprecher;

Fig. 7 die Struktur einer erfmdungsgemaßen Analysefllter- bank;

Fig. 8 eine schematische Darstellung der erf dungsgemaßen psychoakustischen Gewichtung;

Fig. 9 eine erfmdungsgemaße Berechnungsstruktur der Ge- rauschleistungsschatzung einem Teilband; und

Fig. 10 den beispielhaften Verlauf einer erfmdungsgemaßen Teilbanddampfung; und

Fig. 11 die Berechnungsform für die erfmdungsgemaßen Filter- koefflzienten.

In Fig. 1 ist ein vereinfachtes Modell einer Freisprecheinrichtung 10 mit Anschluß an eine digitale Verbindung 12 dargestellt. Die im europaischen ISDN-Netz verwendete A-Law- Codierung bzw. Decodierung ist m den beiden linken Blocken 14, 16 dargestellt. Auf der rechten Seite ist das Lautspre- cher-Raum-Mikrophonsystem 18 (LRM-System) mit dem lokalen Ge- sprachsteilnehmer 20, dem Benutzer der Freisprecheinrichtung, skizziert . Durch die akustische Kopplung zwischen Lautsprecher und Mi^¬ krophon kommt es zum Übersprechen über das LRM-System. Dieses Ubersprechen wird vom fernen Teilnehmer als störendes Echo wahrgenommen. Akustische Wellen treten dabei aus dem Laut^¬ sprecher aus und breiten sich im Raum aus. Durch Reflexion an den Wanden und anderen sich im Raum befindlichen Gegenstanden entstehen mehrere Ausbreitungspfade, durch die unterschiedliche Laufzeiten des Lautsprechersignals entstehen. Das Echosi- gnal am Mikrophon besteht somit aus der Überlagerung einer Vielzahl von Echoanteilen und ggf. dem Nutzsignal n(t) : dem lokalen Sprecher.

In Fig. 2 ist ein erweitertes Modell einer Fernsprechverbm- düng dargestellt. Das bisherige Modell (Fig. 1) wurde dabei um den Teil des fernen Gesprachsteilnehmers 120 ergänzt. Dargestellt ist eine ISDN-Verbindung 12, wobei auf der lokalen Seite eine Freisprecheinrichtung 10 verwendet wird. Der ferne Teilnehmer telefoniert mit einem Handapparat. Besonderes Au- genmerk wurde auf die jeweiligen Hintergrundgeräusche gelegt.

Auf der Seite mit der Freisprecheinrichtung wurden vom Mikrophon nicht nur die Sprache des lokalen Gesprachsteilnehmers (das eigentliche Nutzsignal), sondern auch Echoanteile des fernen Sprechers und lokale Hintergrundgeräusche aufgenommen. Beispiele für solche Gerauschquellen innerhalb von Buroraumen sind PC-Lufter oder Klimaanlagen. Beide sind im unteren Teil der Fig. 2 skizziert. Verwendet der lokale Sprecher die Frei- sprechemrichtung m Kraftfahrzeugen (GSM-Verbmdung) , so können Fahrtwind-, Roll- oder Motorgerausche die Verständlichkeit der Sprachanteile im Mikrophonsignal verschlechtern. Aufgabe einer digitalen Signalverarbeitung innerhalb der Freisprecheinrichtung sollte eine Verbesserung der Sprachqua- litat des zu sendenden Signals sein.

Auch auf der fernen Seite können sich störende Hintergrundgeräusche dem Sprachsignal des Gesprachsteilnehmers überlagern, obgleich diese bedingt durch die Bauart eines Handapparates leiser sind als im Freisprechfall . Bevor das Signal des fer^¬ nen Sprechers 120 auf dem Lautsprecher beim lokalen Teilneh^¬ mer 20 ausgegeben wird, kann auch hier versucht werden, die Sprachqualltat dieses Signals zu verbessern. Durch die zwischen der Gerauschentstehung und Gerauschunterdruckung lie^¬ gende Verbindung - einschließlich der Codierung und Decodie- rung - ist zu erwarten, daß dieser Teil der Gerauschunterdruckung schwieriger zu realisieren ist, als die lokale Ge- rauschreduktion. Bei diesem Teil der Gerauschunterdruckung kann gewählt werden, ob das Verfahren lediglich im Steuerungspfad der Pegelwaage (zur Vermeidung von fehlerhaften Sprachdetektionen) oder aber im Signalpfad plaziert werden soll .

In Fig. 3 ist eine Übersicht einer erfmdungsgemaßen Frei- sprechemrichtung dargestellt. Zentrales Element des Verfahrens ist eine Pegelwaage 22, welche im linken Teil der Fig. 3 dargestellt ist. Optional können zwei Verstarkungssteuerungen 24, 26 (Automatic Garn Control = AGC) m den Sende- und den Empfangspfad eingeschaltet werden. Die Pegelwaage garantiert die durch die ITU-T- bzw. ETSI-Empfehlungen vorgeschriebenen Mmdestdampfungen, indem sie abhangig von der Gesprachssitua- tion Dampfungen m den Sende- und/oder den Empfangspfad em- fugt. Bei Aktivität des fernen Teilnehmers wird der Empfangspfad freigeschaltet und das Signal des fernen Teilnehmers wird ungedämpft auf dem Lautsprecher ausgegeben. Die bei abgeschalteten oder schlecht abgeglichenen Kompensatoren entstehenden Echos werden durch die m den Sendepfad eingefügte Dampfung stark verringert. Bei Aktivität des lokalen Sprechers kehrt sich die Situation um. Wahrend der Empfangspfad stark bedampft wird, fugt die Pegelwaage 22 m den Sendepfad keine Dampfung ein und das Signal des lokalen Sprechers wird ungedämpft übertragen. Schwieriger wird die Steuerung der Pe- gelwaage 22 im Gegensprechfall . Hier erhalten beide Pfade

(und damit auch die Teilnehmersignale) jeweils die Hälfte der einzufügenden Dampfung oder bei nicht optimaler Steuerung wird zumindest einer der beiden Signalpfade gedampft. Gegen^¬ sprechen ist damit nicht oder nur eingeschränkt möglich.

Abhilfe schafft hier der Einsatz von adaptiven Echokompensa- toren 28 - dargestellt im rechten Teil der Fig. 3. Diese ver^¬ suchen, das LRM-System digital nachzubilden, um dann den Echoanteil des fernen Teilnehmers aus dem Mikrophonsignal herauszurechnen. Je nachdem, wie gut die Kompensatoren dies bewerkstelligen, kann die durch die Pegelwaage 22 emzufugen- de Gesamtdampfung reduziert werden.

In Freisprecheinrichtungen mit Gerauschreduktion gemäß dem Stand der Technik wird die Laufzeit hauptsächlich von der ge^¬ rauschreduzierenden Komponente bestimmt. In Fig. 4 sind die Ergebnisse einer Studie dargestellt. Hier wurde versucht, herauszufinden, welche Echodampfung abhangig von der Laufzeit dieses Echos notwendig ist, damit 90, 70 bzw. 50 Prozent der Befragten mit der Gesprachsqualitat zufrieden sind.

Basierend auf dieser Studie sind die Anforderungen, die an Freisprechsysteme mit Gerauschunterdruckungsverfahren gestellt werden, aufgrund der größeren Laufzeit hoher als die Anforderungen an herkömmliche Freisprechtelefone.

Da die Echokompensatoren m ihrer Leistungsfähigkeit begrenzt sind und derart hohe Echodampfungen mit der zur Verfugung stehenden Hardware nicht erreichen können, wurde ein sog. Postfilter 30 eingeführt. Eine detaillierte Beschreibung hierzu befindet sich m DE-A-198 06 015.

Zur Unterdrückung störender Hintergrundgeräusche werden zwei kurze Transversalfllter 31, 33 m den Sende- und m den Empfangspfad der Freisprecheinrichtung geschaltet. Das Filter 33 im Sendepfad soll lokale Hintergrundgeräusche reduzieren. Da- mit wird zum einen die Sprachqualltat des Sendesignals erhöht - zum anderen verringert sich die Wahrscheinlichkeit einer fehlerhaften Öffnung des Sendekanals durch die Pegelwaage 22. Das Filter 31 im Empfangspfad soll bei Gesprachssituationen, m denen auch das ferne Teilnehmersignal verrauscht ist, die Sprachqual_ltat dieses Signals verbessern. Beide Filter 31, 33 wurden so entworfen, daß die Gruppenlaufzeit gering ist und kleiner oder gleich 2 ms betragt. Sollte die Freisprechein^¬ richtung keine weiteren Verzogerungen enthalten, kann somit die ITU-T-Empfehlung G. 167 für Festnetztelefone m bezug auf die Laufzeit (bei Verwendung nur eines Gerauschunterdruk- kungsfilters im Signalpfad) eingehalten werden. Der gesamte Rechenaufwand für dieses Verfahren liegt bei weniger als zwei MIPS pro Filter (zugrundegelegt wurde der Signalprozessor Siemens SPC) , was eine Anwendung selbst auf einfachsten Signalprozessoren ermöglicht.

Im folgenden wird zunächst em Überblick über das erfmdungs- gemaße Verfahren zur Sprachverbesserung gegeben. Anschließend werden der Stand der Technik m bezug auf emkanalige Ge- rauschunterdruckungsverfahren sowie die Unterschiede zu dem erfmdungsgemaßen Verfahren beschrieben.

In Fig. 5 ist die Struktur der erfmdungsgemaßen Gerauschunterdruckung dargestellt. Die beiden Filter 31, 33 (im Sende- und Empfangspfad) werden mit dem gleichen Algorithmus eingestellt. Die eigentliche Signalfllterung erfolgt durch em kurzes (derzeit 16 Koeffizienten langes) Transversalfilter, welches im oberen Teil der Fig. 5 dargestellt ist. Bei einer Abtastrate von 8 kHz wird damit eine Verzögerung von maximal 2 ms (bei 16 Koeffizienten) m den Signalpfad eingeführt.

Für die Einstellung der Filterkoefflzienten wird zunächst eine Teilbandanalyse des Eingangssignals durchgeführt. Hierbei wird eine DFT-modulierte Polyphasenfllterbank 130 mit phasen- mmimalem Prototyptiefpaßfilter eingesetzt. Die Phasenmmima- litat des Prototyptiefpaßfilters garantiert eine möglichst geringe Analyseverzogerung - Polyphasenfllterbanke können selbst auf einfachsten Signalprozessoren mit geringem Rechenaufwand implementiert werden. Die Ausgangssignale der Filter- bank werden unterabgetastet einer Kurzzeitleistungsschatzung 132 zugef_ührt. Aus diesen Schatzwerten der Teilbandleistungen werden zum einen die Leistungen des Hintergrundgeräusches ge^¬ sch_ätzt (unterer Teil der Fig. 5), zum anderen erfolgt eine psychoakustische Gewichtung 134 der gestörten Teilbandlei^¬ stungen. Diese Gewichtung 134 soll Verzerrungen, welche s ch durch die Gerauschunterdruckung ergeben, möglichst gering halten. Die Gerauschschatzungen werden ebenfalls nichtlmear angehoben. Dies hat den Zweck der Vermeidung sog. "musical tones". Eine genaue Beschreibung dieses Effekts befindet sich in "P. Vary: Noise suppression by spectral magnitude esti a- tion - mechanism and theoretical li its, Signal Processing 8, Seite 387 - 400, 1985".

Aus den modifizierten Schätzungen der Summensignalleistungen und der Gerauschleistungen werden gemäß einer nichtlinearen Verarbeitung die Teilbandgewichtungsfaktoren bestimmt. Hierbei wird versucht, eine gleiche Lautheit des verrauschten und des gerauschreduzierten Signals zu erreichen. Eine Teilfunk- tion 136 mit der Bezeichnung Dampfungsausgleich versucht daher Signalanteile mit möglichst großem Signal-Storungs-Ab- stand im Zeit-Frequenz-Bereich zu finden und basierend auf diesen Signalanteilen die Koefflzientene stellung so zu modifizieren, daß die gleiche Lautheit des ungestörten und des gestörten Signals erreicht wird.

Die erhaltenen Teilbandgewichtungsfaktoren werden mittels einer modifizierten mversen DFT 138 m den Zeitbereich zuruck- transformiert . Hierbei wird eine Filteπmpulsantwort im Ge- Samtband generiert. Von der Möglichkeit der Rucktransformation der gewichteten Teilbandsignale wird aufgrund der hierfür notwendigen phasenmaximalen Synthesefllterbank und der damit verbundenen Laufzeit abgesehen.

Verfahren zur Gerauschunterdruckung gemäß dem bisherigen

Stand der Technik lassen sich grundsatzlich m drei Klassen einteilen: Verfahren, basierend auf DFT-Zerlegungen

Hier wird das Eingangssignal m Blocke unterteilt, diese werden dann mittels einer DFT den Frequenzbereich transformiert. Im Frequenzbereich wird die eigentliche Gerauschunterdruckung durchgeführt. Mittels des "Over- add-" oder des "Overlap-save-Prmzips" werden die Blocke wieder zu einem Zeitsignal zusammengesetzt.

Verfahren, basierend auf Filterbank-Zerlegungen

Das Gesamtbandsignal wird mittels einer Analysefllter- bank m einzelne Teilbander zerlegt. Hier können gleich- formige Filterbanke (alle Teilbander haben die gleiche Bandbreite) oder ungleichförmige Filterbanke (ungleiche Bandbreite) eingesetzt werden. Die Gerauschunterdruckung wird im Teilbandbereich (bandpaßgefllterte, unterabge- tastete Zeitsignale) durchgeführt. Mit einer Synthese- Filterbank wird aus den Teilbandsignalen wieder em Ge- samtbandsignal generiert. Verfahren, die auf einer Wave- let-Zerlegung basieren, sollen aufgrund der häufig verwendeten Filterbankrealisierung ebenfalls zu dieser Klasse gehören.

Verfahren, basierend auf Eigenwert-Zerlegungen

Bei diesen Verfahren wird versucht, eine Eigenwertzerle- gung der Autokorrelationsmatrix des Eingangssignals durchzufuhren. Bei den zu den kleinen Eigenwerten gehörenden Eigenvektoren wird davon ausgegangen, daß sie dem Gerauschanteil des Emgangssignals zugehörig sind. Diese werden zu Null gesetzt. Anschließend wird aus den modifizierten Eigenvektoren das gerauschreduzierte Ausgangs- Signal gebildet. Bei der o_ben genannten Aufteilung wurden aufgrund des Ver^¬ gleichs mit dem erfmdungsgemaßen Verfahren lediglich die e kanaligen, passiven Verfahren berücksichtigt. Durch die Eigenwertana_lyse sind Gerauschreduktionen nach dem letztge- nannten Prinzip sehr rechenaufwendig und benotigen lange Si^¬ gnallaufzeiten und werden daher hier nicht weiter behandelt.

F_ür _Gerauschreduktionsverfahren ist eine hohe Frequenzselek^¬ tivitat der Eingangssignalanalyse notwendig. Die hoherfre- quenten Signalanteile dürfen nicht durch Aliasmg bei Filterbanken oder durch den Leck-Effekt bei DFT-Zerlegungen gestört werden. Bei DFT-Zerlegungen fuhrt das zur Verwendung von Fensterfunktionen, die eine ausreichende Dampfung der Nebenmaxi- ma erreichen. Hierdurch wird aber ebenfalls der Hauptdurch- laßbereich verbreitert, was wiederum zu großen Blocklangen fuhrt. Es sind keine Verfahren bekannt, die mit Blocklangen B von lediglich B = 16 bei einer Abtastfrequenz von f_ab=8 kHz arbeiten. Die Laufzeiten von bisherigen DFT-basierenden Verfahren sind damit deutlich großer, als die durch die ITU vor- geschriebene Maximallaufzeit im Festnetzbereich von 2 ms.

Das Problem der Nachbarkanaldampfung kann durch Verwendung von Filterbankstrukturen gelost werden - allerdings mit dem Nachteil einer größeren Laufzeit. Innerhalb des Analyse- Synthese-Sytems kann die Laufzeit m gewissen Grenzen aufgeteilt werden. Wird allerdings die Analysefilterbank phasenminimal entworfen, so fuhrt das zu einer phasenmaximalen Synthesefilterbank. Auch mit reinen Filterbanksystemen lassen sich nicht die ITU-T-Forderungen nach der geringen Festnetz- laufzeit erfüllen.

Das erf dungsgemaße Verfahren kombiniert eine Teilbandanalyse (mit den Vorteilen der geringen Laufzeit von phasenminimalen Analysefilterbanken) und eine Rucktransformation mittels einer mversen DFT. Die mverse DFT wird allerdings nicht auf das Signal, sondern m einer modifizierten Form auf die Teil- bandfilterkoefflzienten angewendet. Die Forderung nach der hohen Frequenzselektivitat aufgrund der leistungsstarken nie^¬ derfrequenten Signalanteile bei Sprache und den damit verbun^¬ denen Aliasmg- oder Leckeffekten m den hoherfrequenten Be^¬ reichen kann hierdurch deutlich vermindert werden. Eine aus- fuhrlichere Beschreibung dieses Zusammenhangs folgt weiter unten. Die beschriebenen Schwierigkeiten bei geringen Block^¬ langen können somit vermieden werden. Durch diese Kombination ist es möglich, eine Gerauschreduktion mit geringer Laufzeit und nur geringem Rechenaufwand (geringe Zahl der Frequenz- stutzstellen) zu erreichen.

Bevor mit einer detaillierten Verfahrensbeschreibung begonnen wird, sind im folgenden die Eigenschaften des Freisprechverfahrens bzw. des Verfahrensteils, auf welchen sich die vor- liegende Erfindung konzentriert, tabellarisch aufgelistet.

Das Verfahren zeichnet sich dadurch aus, daß

nur sehr kurze Signallaufzeiten durch die Gerauschunter- druckung m den Signalpfad eingefügt werden,

die eigentliche Filterung im Vollbandbereich erfolgt, die Koeffizientenbestimmung für das Filter allerdings im Teilbandbereich durchgeführt wird,

mehrere, unterschiedliche Abtastraten innerhalb des Verfahrens verwendet werden (Multiratensystem) ,

die Frequenzanalyse mittels einer Filterbank m Fre- quenzteilbandern implementiert wird,

der Prototyptiefpaß der Filterbank phasenminimal entworfen wird,

eine Kurzzeitleistungsschatzung mittels nichtlinearer

Betragsglattungen der Teilbandsignale durchgeführt wird, eine psyc_hoakustische Gewichtung der geschätzten Summen^¬ signalleistungen durchgeführt wird,

eine nichtlmeare Anhebung der Gerauschleistungs- Schätzungen durchgeführt wird,

eine automatische Verstarkungssteuerung verwendet wird, welche die Filterkoefflzienten so gewichtet, daß das gerauschreduzierte Signal e naherungsweise gleiches Lautheitsempfinden hervorrufen.

Die eigentliche Signalfilterung zur Gerauschreduktion erfolgt durch e kurzes Transversalfilter, welches im (Gesamtband-) Signalpfad plaziert wird. Die Gesamtbandfilterung erfolgt ge- maß folgender Berechnungsvorschrift:

r(k) = g^τ(k) * x(k)

= ∑ g,(k)x(k - 1) ι=0

Mit g ( k ) wurde dabei der Filtervektor des Gesamtbandtransver- salfilters bezeichnet

g(*) = (&,(*),£,(*),&(*), g^ (k))^τ

Der Vektor x(k)beinhaltet die letzten N Abtastwerte des Em- gangssignals des Gerauschunterdruckungsfllters :

x(k) = (x(k), x(k - 1), x(k - 2),...x(k - N + \))^τ .

Die Ordnung N-l des Transversalfllters kann im Vergleich zu bisherigen Zeitbereichsverfahren sehr gering gewählt werden, z.B. N=16.

Für die Einstellung der Filterkoeffizienten wird eine Teil- bandzerlegung verwendet. Die Anzahl der Frequenzstutzstellen sollte bei dem hier vorgestellten Verfahren gleich der Anzahl der Fi_lterkoeffizienten des Gesamtbandfllters (N) sein. Die _Damp_fung eines Filterbandkanals gegenüber den anderen sollte so groß gewählt werden, daß trotz der Kopplung der niedrigen Frequenzanteile durch Aliasmg m den höheren Frequenzen em mittleres Signal-Aliasmg-Verhaltnis von etwa 20 dB eingehal^¬ ten werden kann. Der Wert von 20 dB entspricht dabei dem Ma^¬ ximalwert der Dampfung, welche die Gerauschunterdruckung ein^¬ fügen darf.

In Fig. 6 ist zur Veranschaulichung em gemitteltes Sprachspektrum dargestellt. Es wurde ermittelt aus acht deutschen Sprachproben von jeweils vier Sprechern und vier Sprecherinnen. Die Gesamtlange der Sprachprobe betrug etwa 50 s. Das Spektrum wurde berechnet, indem die Betragsquadrate der Fou- riertransformierten von Rahmen der Lange 1024 bei Gewichtung mit einem Hannmg-Fenster gemittelt wurden. Das gemittelte Spektrum ist logarithmisch über der Frequenz aufgetragen.

Aus dem gemittelten Sprachspektrum ist zu erkennen, daß be- reits eine Dampfung von etwa 40 dB notwendig ist, damit die niederfrequenten Signalanteile em mittleres Signal-Aliasmg- Verhaltnis von 0 dB m den hoherfrequenten Teilbandern erzeugen. Zusammen mit der maximalen Dampfung der Gerauschunterdruckung sind somit Restkanalda pfungen der Filterbank von etwa 60 dB notwendig.

Bei der Auswahl des Filterbanktyps spielt die der Implentie- rung zugrundeliegende Hardware-Plattform eine wesentliche Rolle. Zwar können mit IIR-Filterbanken die vorgegebenen Dampfungsanforderungen mit sehr geringen Filterordnungen erreicht werden, die Eigenschaften solcher Filterbanke sind allerdings sehr anfällig gegenüber Rechenungenauigkeiten von Festkomma-Signalprozessoren. In den meisten Fallen muß von 16 x 16 Bit-Multiplikationen, welche sehr schnell auf Consumer- Prozessoren durchgeführt werden können, zu 16 Bit x 32 Bit - oder gar zu 32 Bit x 32 Bit-Multiplikationen übergegangen werden. Diese letztgenannten Multiplikationsformen benotigen a_ber erheblich mehr Rechenaufwand, so daß dem hier be^¬ schriebenen Verfahren DFT-modulierte FIR-Polyphasenfllterban- ke eingesetzt wurden.

_Das erfmdungsgemaße Verfahren beruht auf der m "G. Wackers- reuther: Em Beitrag zum Entwurf digitaler Filterbanke, Nr. 64, Ausgewählte Arbeiten über Nachrichtensyteme, Erlangen, 1987" vorgestellten Filterbankrealisierung. Die mit der Un- terabtastrate r unterabgetasteten Teilbandsignale werden ge- maß den folgenden Berechnungsvorschriften bestimmt:

O) = Σ e "^vμυ^{?(n) v=0 mit

μ e {0,...,^}.

Das hochgestellte (r) soll dabei auf die Unterabtastung hin- weisen. Das tiefgestellte μ bzw. V wählt dabei eines der Teilbandsignale aus dem Bereich 0...N-1 aus. Da die kom- plexwertigen Signale X^^} (n) aus einem reellwertigen Signal x(k) berechnet wurden, können die oberen Frequenzbandsignale durch komplexe Konjugation aus den unteren Teilbandern be- stimmt werden. Um die für die Berechnungsvorschrift notwendigen Zwischensignale ü[^r)(n) zu berechnen, werden zunächst folgende Hilfssignale eingeführt:

x_p ^(N)(n) = x(nN - p)

mit n,p e Z (Menge der ganzen Zahlen) .

Mit h_TP(k) wurde dabei die Impulsantwort des der Filterbank zugrundeliegenden sog. Prototyptiefpasses bezeichnet. Mit den Hilfsgroßen X ^(N) (n) und hv ⁾(«)kann die Berechnung der Zwi^¬ schensignale υ^' iή) wie folgt angegeben werden:

Mit N_TP - 1 wurde dabei die Ordnung des Prototyptiefpasses bezeichnet. In Fig. 7 ist eine Strukturdarstellung der Filter- bankberechnung dargestellt. Lediglich das Füllen des Em- gangsspeichers erfolgt mit der vollen Abtastrate - alle weiteren Berechnungen (Faltung und mverse DFT) werden nur un- terabgertastet durchgeführt. Die zunächst komplex erscheinende Indizierung der Hilfsgroßen kann selbst auf einfachen Signalprozessoren effizient durchgeführt werden, ohne explizit jede einzelne Division bzw. Modulo-Berechnung auszufuhren.

Aus den Teilbandsignalen X_μ ^r ( ) werden durch nichtlineare Be- tragsglattungen Schatzwerte der Kurzzeitleistungen gebildet. Die Betragsbildung wird hierbei aus Aufwands- und Speichergrunden gemäß der folgenden Berechnungsform angenähert:

Die eigentlichen Kurzzeitschatzwerte werden durch mchtlmea- re IIR-Filterungen erster Ordnung gebildet:

x_μ ^r) (n) = ß_μ (n) x" {n) + {\ - ß_μ {n)) \x" (n - 1)

Die Zeitkonstante ß («)wιrd dabei so gewählt, daß einem Leistungsanstieg schnell und einem Leistungsabfall langsam gefolgt werden kann:

mιt O ≤ ß_r <ß_f < l

Durch die Wahl von unterschiedlichen Zeitkonstanten soll dem psychoakustischen Effekt der zeitlichen Nachverdeckung Rech^¬ nung getragen werden. Em plötzlicher Anstieg der Signallei- stungen wird von dem Gerauschunterdruckungsverfahren als ein^¬ setzende Sprache interpretiert. In solchen Fallen wird eine bereits eingefügte Dampfung schnell zurückgenommen. Bei einem plötzlichen Abfall der Signalleistungen wird vom Ende eines Sprachsegments ausgegangen. Durch den zeitlichen Verdeckungseffekt ist das menschliche Ohr nun kurzzeitig unempfindlich gegen das verbleibende Hintergrundgeräusch. Die Dampfung der Gerauschreduktion kann somit langsamer wieder eingefügt werden als sie zu Beginn der Sprachpassage zurückgenommen wurde.

Neben der zeitlichen Verdeckung kann auch der Effekt der Frequenz- bzw. der Simultanverdeckung zur Verringerung von Sprachverzerrungen ausgenutzt werden. Zu diesem Zweck werden die geschätzten Signalleistungen psychoakustisch bewertet.

Im Gegensatz zu Sprachcodierungsverfahren (z.B. MPEG-Audio- Codierung) wird hier von einem sehr einfachen psychoakusti- sehen Modell ausgegangen. Da m den niedrigen Frequenzbereichen oftmals nur sehr schlechte Signal-Gerausch-Verhaltnisse anzutreffen sind, wird die Suche nach Maskierungssignalen nur im ersten Teilband durchgeführt. Hoherfrequente

Bereiche werden aus Aufwandsgrunden nicht die Suche mit einbezogen. Die Mithorschwelle wird vom Maskierungssignal unabhängig angenommen und durch eine logarithmische Kennlinie angenähert. F_ür die modifizierten Schätzungen der Kurzzeitteilbandlei- stungen ergibt sich damit im untersten Teilband ( μ = 0⁾ :

x₀ ⁽»|= Max {| )| ,γ_ver γ_._s |_*;»|}

Für die oberen Teilbander μ e ergibt sich entspre-

chend:

In Fig. 8 ist die verwendete psychoakustische Gewichtung noch einmal schematisch dargestellt. Im linken Teil der Abbildung ist das Spektrum eines kurzen Ausschnitts (128 Takte) aus einem Sprachsignal sowie die mittleren Teilbandpegel (Balken) dargestellt. Ausgehend vom ersten Teilband (250 Hz bis 750 Hz bei f_at = 8 kHz und N = 16) wird eine Maskierungskurve generiert. Hierzu wird der Pegel im Band μ = 1 zunächst um den Faktor γ _abs abgesenkt. Ausgehend von diesem Referenzpunkt werden die Mithorschwellen durch logarithmisch abfallende Kurven angenähert. Dies ist im rechten Teil der Abbildung durch die Punkte symbolisiert. Liegen die gemessenen Teilbandpegel unterhalb der angenäherten Mithorschwelle, so erfolgt durch Maximumbildung eine kunstliche Anhebung.

Zur Schätzung der Hmtergrundgerauschleistungen wird eine sog. Minimumstatistik ausgewertet. Dieses Verfahren benotigt im Gegensatz zu den meisten anderen Verfahren zur Gerausch- schatzung keinen Sprachpausendetektor.

Das implementierte Verfahren zur Gerauschleistungsschatzung verwendet Schatzfenster der Lange N_Mc- (r N_MS) Takte. Innerhalb eines solchen Fensters wird durch Vergleichsoperationen das Minimum der geschätzten Emgangsleistung jedem Teilband bestimmt : falls n mod N _MS ≠ 1

sonst

Die Gerauschschatzung wird mehrstufig ausgeführt, d.h. die Mmima der vergangenen M_Ms Schatzfenster werden gespeichert. Das Erneuern der gespeicherten Blockmimma erfolgt gerade einen Unterabtasttakt bevor Gleichung 2.4 die Erneuerungsbedingung (n mod N_MS ≡ 1) erfüllt ist. Die vergangenen Mmima » bιs \ n μ M_k in) werden gemäß der folgenden Speichervorschrift gesichert:

falls n mod N M_λ„S ≡ 1 sonst

falls « mod N_MS ≡ 1 sonst

falls n mod N_MS ≡ 1

sonst

Die eigentliche Schätzung der Gerauschleistung m jedem Teilband erfolgt durch eine Minimumsuche über die gespeicherten Blockmimma und das aktuelle Blockminimum:

falls n mod N_{MS ≡}

, sonst

Durch diese Form der Minimumsuche kann der Berechnungsaufwand minimal gehalten werden. Pro Unterabtastung und Teilband sind zun_ächst nur zwei Vergleiche durchzufuhren. Hiermit werden die Großen n" { ) und n" {^ή) aktualisiert. Erst wenn N_M neue _Signalwerte eingetroffen sind, erfolgt eine weitere Ak^¬ tualisierung. Die vergangenen Blockmimma werden lediglich "weitergeschoben" und das aktuelle Blockminimum wird den ersten Verzogerungsspeicher kopiert. In Fig. 9 ist die Struk^¬ tur der Berechnung dargestellt.

Das "Gedächtnis" der hier vorgestellten Gerauschleistungs- Schätzung variiert mit der Zeit - das minimale Gedächtnis bezieht sich auf (r N_MS M_MS) Gesamtbandtakte, maximal kann auf die vergangenen (r N_MS (M_Mς+l ) ) Gesamtbandtakte zurückgegriffen werden. Die mittlere Gedachtnisdauer von (r N_MS (M_MS+ ) ) sollte so groß gewählt werden, daß mit großer Wahrschemlich- keit zumindest eine Sprachpause enthalten ist. Andererseits darf das Gedächtnis nicht zu groß gewählt werden, da sonst einem Anstieg der Gerauschleistung nur verspätet gefolgt werden kann. Zeiträume von 3 bis 5 Sekunden haben sich hier als akzeptabel herausgestellt.

Sollte mit den bisherigen Schatzwerten für die Summensignalleistungen und die Gerauschleistungen em Gerauschreduktions- filter gemäß einem Wiener-Ansatz im Frequenzbereich eingestellt werden, so fuhren die unterschiedlichen "Trägheiten" der Schätzungen zu hörbaren Artefakten. In Passagen ohne Sprachaktivitat folgen die Summenleistungsschatzungen den Kurzzeitschwankungen der Gerauschpegel relativ schnell - die Gerauschschatzungen detektieren lediglich die Mmima und sind daher naherungsweise konstant. Die resultierenden Dampfungen sind solchen Passagen zwar relativ hoch, die Pegelschwankungen der Summensmgalschatzer fuhren aber dennoch zu geringen Schwankungen der Dampfungsfaktoren. Am Ausgang der Gerauschreduktion ist dies als sog. "musical tones" zu hören.

Bisher bekannte Verfahren zur Sprachverbesserung verwenden zur Vermeidung dieser Artefakte eine Glattung der Summensi- gnalpegel m Fequenzrichtung. Hierbei werden meist IIR-Filter erster _Ordnung mit niedriger Glattungskonstante oder nichtli^¬ neare Medianfilter niedriger Ordnung eingesetzt.

In dem hier beschriebenen Verfahren wird em anderer Weg e - geschlagen - es werden nicht die Summensignalpegel sondern die Gerauschpegelschatzungen m einer weiteren Verfahrensstu- fe verändert.

Die Gerauschleistungsschatzwerte werden zunächst logarith- miert. Hierzu wurde eine spezielle Hardware-Logarithmierung, welche m "A. Hauenstein: Implementierung eines Freisprechal- gorithmus auf dem Siemens DSP-Core SPC, Diplomarbeit D 103, Darmstadt, 1995" beschrieben ist, verwendet. Im folgenden wird diese Funktion durch LOG ( ... ) abgekürzt, es gilt nahe- rungsweise:

Die nichtlineare Gerauschpegelanhebung wird wie folgt durch- gefuhrt:

Die Pegelanhebung A[_0G (n) wird m allen Teilbandern gleichermaßen verwendet. Sobald eine Sprachaktivitat dem verrauschten Summensignal festgestellt wird, erfolgt eine schnelle Absenkung der Pegelanhebung. Sollte keine Sprachaktivitat detektiert werden, erfolgt em langsames Anheben der Große A_{n L0G} (n) . Die Pegelanhebung wird sowohl durch einen Maximalwert als auch durch einen Minimalwert begrenzt: < K_& x l.abs (n)

Δ '⁽LOG ' Ό

Durch die additive Nachführung der Pegelanhebung können kurz^¬ zeitige Fehldetektionen der Sprachaktivitätserkennung tole^¬ riert werden. Für das Pegelinkrement A_ink bzw. für das Pegel^¬ dekrement Δ^ gilt:

Δ i.nk, <Δ dek

Für die beiden Begrenzungswerte Δ_Mιnund A_Maχ haben sich folgende Einstellungen bewährt:

'Min 5dB,

A Max * 20dB.

Die Untergrenze von etwa 5 dB gleicht dem systematischen Fehler, der durch die Minimumbestimmung bei der Geräuschschätzung entsteht, wieder aus. Diese Korrektur hängt vor allem von den Zeitkonstanten der IIR-Glättungsfilter ab - bei Veränderungen der Zeitkonstanten sollte die Untergrenze er- neut angepaßt werden. Die Entscheidung, ob Sprachaktivität detektiert wird, hängt von der Wahl der Konstante K_A ab .

Hierbei sollte die Summensignalleistung mindestens etwa 15 dB über der geschätzten Geräuschleistung liegen, um ein Absenken der Pegelanhebung auszulösen. Für die Konstante K_A gilt so- mit:

_A*5.

Für die Reduktion der Hintergrundgeräusche werden zunächst die Unterdrückungsfaktoren in jedem Teilband b^(r)(ή) bestimmt.

Hierfür wird nach einem parametrisierten Wiener-Ansatz vorgegangen. Das hier vorgestellte Verfahren verwendet die folgende Kenn^¬ linie zur Bestimmung der Teilbandfaktoren:

Die errechneten Dampfungsfaktoren werden auf einen linearen Minimalwert b_ι__n begrenzt . Bei zu klein gewählten Begrenzungs^¬ werten nehmen die Sprachverzerrungen zu. Außerdem verliert der ferne Gesprachsteilnehmer den akustischen Umgebungsem- druck. Eine Begrenzung von etwa 20 dB hat sich hier als gunstiger Wert herausgestellt. Es laßt sich damit eine Sprachverbesserung erzielen, ohne zu große Sprachverzerrungen zu erhalten. Außerdem bleibt die akustische Hmtergrundmforma- tion (z.B. der Teilnehmer befindet sich m einem Kfz) erhal- ten, ohne daß die vorhandenen Restgerausche die Unterhaltung störend beeinträchtigen.

Die Berechnung der eigentlichen Unterdruckungsfaktoren wird mit logarithmischen Großen durchgeführt. Vor der Begrenzung müssen diese Werte wieder m den linearen Bereich überfuhrt werden. Dies geschieht analog zur Logaπthmierung mit einer Naherungsform, die m "A. Hauenstein: Implementierung eines Freisprechalgorithmus auf dem Siemens DSP-Core SPC, Diplomarbeit D 103, Darmstadt, 1995" erläutert ist:

LIN(x) *\0 xlk

Die Konstante K ist dabei die gleiche wie bei der Logarith- mierung. Vor der Begrenzung der Hilfsgroßen wird em Dam- pfungsausgleich a⁽^_A n) emmultipliziert. Die Bestimmung dieser Große ist weiter unten beschrieben. Hiermit soll em annähernd gleiches Lautheitsempfmden für das gerauschreduzierte und das gerauscherfullte Signal erreicht werden.

Die logarithmischen Großen b_μ ^r _L ⁾ _0G (n) werden wie folgt bestimmt:

Durch die sog. Uberschatzungsfaktoren ß_us,₀ und -ß_us, -- kann die "Aggressivität" der Gerauschunterdruckung beeinflußt werden. Sollten diese Faktoren großer als eins gewählt werden, wird die Pegeldifferenz zwischen der Summensignalpegel- und der Gerauschpegelschatzung künstlich vergrößert und es wird mehr Dampfung eingefügt. Da die meisten Fahrzeuggerausche niedrigen Frequenzbereichen zu einem sehr schlechten Signal- Gerausch-Verhaltnis fuhren, kann die Uberschatzungsemstel- lung im niedrigsten Teilband (0 Hz bis 250 Hz bei N = 16 und f_ab = 8 kHz) getrennt von den übrigen Teilbandern gewählt werden. Durch die Begrenzung wird verhindert, daß die endgül^¬ tigen Faktoren b_μ (n) einen Wert großer als eins annehmen können.

In Fig. 10 ist em Beispielverlauf für die Dampfung m einem Teilband skizziert. Ausgehend von dem verrauschten Gesamtbandsignal, welches im oberen Teil der Fig. 10 dargestellt ist, sind zunächst die geschätzten und bewerteten Kurzzeit- leistungen des Summensignals LOG I x ^(r) (n) J und des Geräusches

LOG [ n_μ ^r) (n) \ dargestellt (mittlerer Teil der Abbildung). Die nichtlineare Gerauschpegelanhebung ist im Bereich von 1,5 Sekunden bis 2,7 Sekunden deutlich zu erkennen. Zu Beginn des Sprachsignals wurde die Gerauschanhebung nicht aktiviert. Die hieraus resultierenden Dampfungsschwankungen (musical tones) sind im unteren Teil der Abbildung im Bereich von 0 Sekunden bis 0,15 Sekunden deutlich zu erkennen. Die Gerauschreduktion wurde auf einen Maximalwert der Dampfung von 30 dB begrenzt. Durch den folgenden Teil des Verfahrens wird versucht, die Teilbanddampfungsfaktoren so zu beeinflussen, daß em glei^¬ ches Lautheitsempfinden des gerauscherfullten und des ge^¬ rauschreduzierten Signals hervorgerufen wird. Hierbei wird davon ausgegangen, daß das gestörte Sprachsignal zumindest m kurzen Zeit- und Frequenzabschnitten einen größeren Nutzsignalpegel aufweist als das Hintergrundgeräusch. Um den beno^¬ tigten Rechenaufwand gering zu halten, wird lediglich im zweiten Teilband nach leistungsstarken Signalanteilen gesucht. Sollte die Kurzzeitleistung diesem Teilband um einige Dezibel über dem geschätzten Hintergrundgerauschpegel liegen, so wird zunächst ein Dampfungsfaktor ohne Biasaus- gleich b₂ ^r _DA (n) bestimmt. Dieser wird dann invertiert und einer rekursiven Glattung zugeführt:

> K_DA

mit 0 < ß_DA < 1

Der vorläufige Teilbanddampfungsfaktor wird wie folgt bestimmt :

b;⁽l_0G(n) = Mιn ß

Die Große b₂ ^(r _L ⁾ _OG (n) kann dabei als Zwischenergebnis aus der Teilbandkoefflzientenbestimmung übernommen werden. In einem letzten Verfahrensabschnitt werden aus den bisher berechneten Teilbandkoeffizienten die Gesamtbandfilterkoeffi- zienten bestimmt. Die unterschiedlichen Abtastraten werden durch einfaches Beibehalten der alten Gesamtbandkoeffizienten überbrückt. Da sich die Teilbandkoeffizienten durch die IIR- Glattungen nur sehr langsam andern, wird auf eine aufwendige Anti-Imagmg-Filterung verzichtet. Die Filterkoeffizienten werden gemäß der Fig. 11 dargestellten Berechnungsform eingestellt. Bei dieser Berechnungsform wurden die Reellwer- tigkeit und die Symmetrie der Teilbandkoeffizienten verwendet.

Claims

Patentansprüche

1. Vorrichtung zur Gerauschunterdruckung m Fernsprechein^¬ richtungen, d a d u r c h g e k e n n z e i c h n e t, daß im Sendepfad der Fernsprecheinrichtung em zusätzliches Fil^¬ ter mit extrem kurzer Laufzeit angeordnet ist.

2. Vorrichtung nach Anspruch 1, d a d u r c h g e k e n n^¬ z e i c h n e t, daß auch im Empfangspfad der Fernsprechem- richtung em solches zusatzliches Filter mit extrem kurzer Laufzeit angeordnet ist.

3. Vorrichtung nach Anspruch 1 oder 2, d a d u r c h g e^¬ k e n n z e i c h n e t, daß das oder die zusatzlichen Filter eine Gruppenlaufzeit von < 2 ms aufweisen.

4. Vorrichtung nach Anspruch 1, 2 oder 3, d a d u r c h g e k e n n z e i c h n e t, daß das oder die zusatzlichen Filter einstellbare Koeffizienten aufweisen und eine Steuer- schaltung zur Einstellung der Koeffizienten vorgesehen ist.

5. Vorrichtung nach Anspruch 4, d a d u r c h g e k e n nz e i c h n e t, daß das oder die zusätzlichen Filter im Vollbandbereich arbeiten, wahrend die Steuerschaltung zur Koefflzientenemstellung im Teilbandbereich arbeitet.

6. Vorrichtung nach Anspruch 5, d a d u r c h g e k e n nz e i c h n e t, daß m der Steuerschaltung das Eingangssignal mit einer DFT-modulierten Polyphasenfllterbank (130) mit phasenminimalem Prototyptiefpaßfilter verbunden ist.

7. Vorrichtung nach Anspruch 6, d a d u r c h g e k e n z e i c h n e t, daß die unterabgetasteten Ausgangssignale der Polyphasenfllterbank (130) an eine Kurzzeitleistungs- schatzungsvorrichtung (132) angeschlossen sind.

8. Vorrichtung nach Anspruch 7, d a d u r c h g e k e n nz e i c h n e t, daß die Ausgange der Kurzzeitleistungs- schatzungsvorrichtung (132), die die Schatzwerte der Teil- bandleistungen tragen, mit einer Vorrichtung zur Schätzung der Leistungen des Hintergrundgeräusches und einer Vorrich^¬ tung (134) zur psychoakustischen Gewichtung der gestörten Teilbandleistungen verbunden sind.

9. Vorrichtung nach Anspruch 8, d a d u r c h g e k e n n^¬ z e i c h n e t, daß die Ausgange der Vorrichtung zur Schätzung der Leistungen des Hintergrundgeräusches über eine Vorrichtung zur nichtlmearen Anhebung der Gerauschsignale und die Ausgange der Vorrichtung (134) zur psychoakustischen Gewichtung direkt mit einer Vorrichtung zur Berechnung der Teilbandgewichtungsfaktoren verbunden sind.

10. Vorrichtung nach Anspruch 9, d a d u r c h g e k e n n- z e i c h n e t, daß die Ausgange der Vorrichtung zur Berechnung der Teilbandgewichtungsfaktoren mit einer Vorrichtung zur modifizierten mversen diskreten Fouriertransformation verbunden sind, deren Ausgang mit dem Koeffizienteneingang des oder der zusätzlichen Filter (31, 33) verbunden ist.

11. Vorrichtung nach Anspruch 9 oder 10, d a d u r c h g ek e n n z e i c h n e t, daß zumindest em Teil der Ausgange der Kurzzeitleistungsschatzungsvorπchtung (132) mit einer Vorrichtung (136) zum Dampf ungsausgleich verbunden sind, de- ren Ausgang mit einem Steueremgang der Vorrichtung zur Berechnung der Teilbandgewichtungsfaktoren verbunden ist.

12. Vorrichtung nach Anspruch 1, 2 oder 3, d a d u r c h g e k e n n z e i c h n e t, daß es sich bei dem oder den zu- satzlichen Filtern (31, 33) um kurze Transversalf ilter handelt, vorzugsweise mit einer sehr geringen Ordnung < 20.

13. Verfahren zur Gerauschunterdruckung Fernsprechemrich- tungen, d a d u r c h g e k e n n z e i c h n e t, daß das Sendesignal der Fernsprecheinrichtung einer zusätzlichen Filterung mit sehr geringer Laufzeit unterworfen wird.

14. Verfahren nach Anspruch 13, d a d u r c h g e k e n nz e i c h n e t, daß auch das Empfangssignal der Fernsprech- em ichtung einer solchen zusatzlichen Filterung mit sehr ge^¬ ringer Laufzeit unterworfen wird.

15. Verfahren nach Anspruch 13 oder 14, d a d u r c h g e- k e n n z e i c h n e t, daß die Gruppenlaufzeit für die zu^¬ s_ätzlichen Filterungen auf weniger als 2 ms eingestellt wird.

16. Verfahren nach Anspruch 13, 14 oder 15, d a d u r c h g e k e n n z e i c h n e t, daß die Filterung mittels kurzer Transversalfilter (31, 33) durchgeführt wird, deren Ordnung vorzugsweise < 20 ist.

17. Verfahren nach Anspruch 14 und 16, d a d u r c h g ek e n n z e i c h n e t, daß die Transversalfilter (31, 33) mit einstellbaren Koeffizienten gesteuert werden, die für beide Transversalfilter (31, 33) gleich eingestellt werden.

18. Verfahren nach Anspruch 17, d a d u r c h g e k e n nz e i c h n e t, daß die Filterung im Vollbandbereich durch- gefuhrt wird, wahrend die Bestimmung der Koeffizienten im Teilbandbereich durchgeführt wird.

19. Verfahren nach Anspruch 18, d a d u r c h g e k e n nz e i c h n e t, daß mehrere, unterschiedliche Abtastraten innerhalb des Verfahrens verwendet werden.

20. Verfahren nach Anspruch 18 oder 19, d a d u r c h g ek e n n z e i c h n e t, daß die Bestimmung der Koeffizienten mittels einer Teilbandanalyse und einer Rucktransformation mittels einer modifizierten mversen diskreten Fouπertrans- formation (DFT) erfolgt.

21. Verfahren nach Anspruch 20, d a d u r c h g e k e n nz e i c h n e t, daß die modifizierte diskrete Fouriertrans- formation auf die Teilbandfilterkoeffizienten angewendet wird.

22. Verfahren nach Anspruch 20 oder 21, d a d u r c h g ek e n n z e i c h n e t, daß die Teilbandanalyse mittels ei- ner Filterbank (130) Frequenzteilbandern implementiert wird.

23. Verfahren nach Anspruch 22, d a d u r c h g e k e n n- z e i c h n e t, daß die Filterbank (130) als DFT-modulierte Polyphasenfllterbank mit phasenminimalem Prototyptiefpaßfil^¬ ter ausgeführt wird.

24. Verfahren nach einem der Ansprüche 20 bis 23, d a- d u r c h g e k e n n z e i c h n e t, daß bei der Bestimmung der Koeffizienten zusatzlich eine Kurzzeitleistungs- schatzung mittels nichtlinearer Betragsglattungen der Teil- bandsignale durchgeführt wird.

25. Verfahren nach Anspruch 24, dadurch gekennzeichnet, daß bei der Bestimmung der Koeffizienten zusatzlich eine psychoa- kustische Gewichtung (134) der geschätzten Summensignalleistungen durchgeführt wird.

26. Verfahren nach Anspruch 24 oder 25, dadurch gekennzeichnet, daß bei der Bestimmung der Koeffizienten zusätzlich eine nichtlineare Anhebung der Gerauschleistungsschatzungen durchgeführt wird.

27. Verfahren nach Anspruch 24, 25 oder 26, d a d u r c g e k e n n z e i c h n e t, daß bei der Bestimmung der Koeffizienten zusatzlich eine automatische Verstarkungssteue- rung (136) verwendet wird, welche die Filterkoeffizienten so gewichtet, daß das gerauscherfullte und das gerauschreduzier- te Signal em naherungsweise gleiches Lautheitsempfinden hervorrufen.