DE19906512A1

DE19906512A1 - Auxiliary information signal transmission and/or recording method for digital audio signals uses insertion of auxiliary signals in at least one partial band or spectral component of audio signal after data reduction

Info

Publication number: DE19906512A1
Application number: DE1999106512
Authority: DE
Inventors: Frank Kurth
Original assignee: Individual
Current assignee: Individual
Priority date: 1999-02-17
Filing date: 1999-02-17
Publication date: 2000-09-07
Anticipated expiration: 2019-02-18
Also published as: DE19906512C2

Abstract

The method for transmission and/or storage of auxiliary information signals within digital audio signal uses transformation of each signal block of the latter signal into partial bands or spectral components using data reduction parameters provided by a psychoacoustic model, with insertion of the auxiliary information signals in at least one partial band or spectral component. An Independent claim for aplication of the auxiliary information signal transmission and/or recording method for coding and decoding of signals is also included.

Description

Die Erfindung betrifft ein Verfahren zum unbemerkten Über tragen und/oder Speichern von Zusatzinformationen inner halb eines Signals, insbesondere Audiosignals entsprechend dem Oberbegriff des Anspruchs 1.The invention relates to a method for unnoticed transfer carry and / or store additional information inside half of a signal, in particular audio signal accordingly the preamble of claim 1.

Terms

Die Begrifflichkeiten innerhalb der Beschreibung der Erfindung legen sich wie folgt fest. Digitale Audiosignale sind eine Repräsentation akustischer Signale als Folge diskreter zeitlicher Abtastwerte. Eine solche Repräsentation findet z. B. auf CDs; DAT-Geräten oder Digitalrechnern Anwendung. Charakteristisch ist eine bestimmte Abtastrate, z. B. 32000, 44100 oder 48000 Hz, sowie eine bestimmte Quantisierungsgenauigkeit, z. B. 12 oder 16 Bit. Hierbei gibt die Abtastrate die Anzahl diskreter Werte pro Sekunde und die Quantisierungs genauigkeit die Anzahl verwendeter Bits pro Abtastwert an. Der Oberbegriff des Anspruch 1 umfaßt die Verwendung der Komponenten eines Audiocodierverfahrens. Ein typisches solches Audiocodierverfahren ist durch den Standard ISO 11172-3 gegeben. Aufgabe von Verfahren nach ISO 11172-3 ist die Darstellung eines digitalen Audiosignals in einer codierten, datenreduzierten Form sowie die Rückgewinnung des digitalen Audiosignals hieraus. Die datenreduzierte Form besteht aus digitalen Codewörtern zur Darstellung des eigentlichen Signalinhalts, sowie aus Steuerinformationen zur decoderseitigen Bestimmung der Art der Datenreduktion und Ermöglichung der Rekonstruktion eines digitalen Audio signals.The terminology within the description of the Invention define themselves as follows. Digital audio signals are a representation of acoustic signals as a result discrete time samples. Such Representation takes place e.g. B. on CDs; DAT devices or Digital computers application. One is characteristic certain sampling rate, e.g. B. 32000, 44100 or 48000 Hz, as well as a certain quantization accuracy, e.g. B. 12 or 16 bit. Here the sampling rate gives the number discrete values per second and the quantization accuracy the number of bits used per sample. The preamble of claim 1 includes the use of the Components of an audio coding method. A typical one such audio coding process is through the ISO standard 11172-3 given. Abandonment of procedures according to ISO 11172-3 is the representation of a digital audio signal in a encoded, data-reduced form as well as the recovery of the digital audio signal from it. The data-reduced Form consists of digital code words to represent the actual signal content, as well as from control information for determining the type of data reduction on the decoder side and enable the reconstruction of digital audio signals.

Charakteristisch für solche Audiocodierverfahren ist die Überführung oder Transformation digitaler Audiosignale in eine Teilband- oder Spektralkomponentenrepräsentation bzw. eine entsprechende Rücküberführung oder Rücktransformation aus dieser heraus. Die Werte der Teilband- oder Spektral komponenten werden als im digitalen Audiosignal enthaltene Frequenzen oder Frequenzbänder interpretiert. Die Begriffe Teilband- und Spektralkomponenten finden im folgenden an allen Stellen eine synonyme Anwendung, an denen nur von Teilbandkomponenten gesprochen wird. Die Datenreduktion wird auf den Teilbandsignalen, üblicherweise durch den Vorgang der Quantisierung, durchgeführt. Dabei werden die Teilbandwerte durch Codewörter dargestellt, die charakteristischerweise mit weniger Bits als die Teil bandwerte repräsentiert werden. Die Datenreduktion kann weitere Schritte umfassen. Dazu gehört z. B. die Bildung von Skalenfaktoren, die durch Ausnutzung ähnlicher Amplitudenwerte innerhalb des Teilbandsignals eine kompakte Darstellung bestehend aus einem die Größenordnung der Amplituden beschreibenden Codewort, sowie mehreren den Inhalt der Teilbandwerte beschreibenden Codewörtern, erlaubt. Die übrigen verwendeten Begrifflichkeiten ergeben sich aus dem Standard ISO 11172-3.The characteristic of such audio coding methods is Transfer or transformation of digital audio signals into a subband or spectral component representation or a corresponding return or transformation out of this. The values of the subband or spectral components are included in the digital audio signal Frequencies or frequency bands interpreted. The terms Subband and spectral components are listed below all places a synonymous application, where only from Subband components is spoken. The data reduction is on the subband signals, usually by the Quantization process performed. The Subband values represented by code words that characteristically with fewer bits than the part band values are represented. The data reduction can include further steps. This includes e.g. B. education of scale factors by exploiting similar Amplitude values within the subband signal one compact representation consisting of a the order of magnitude the code word describing the amplitudes, as well as several the Content of the code words describing subband values, allowed. The other terms used result in from the standard ISO 11172-3.

State of the art

Verfahren zur unbemerkten Übertragung von Zusatz information innerhalb anderer Datensätze sind auch als Steganographieverfahren bekannt. Diese finden besonders in der Bildverarbeitung Anwendung. Zahlreiche Grundverfahren des Standes der Technik ersetzen im wesentlichen die niederwertigsten Bits eines Datensatzes durch Bits der einzubettenden Zusatzinformation. Verfahren, die das Ziel verfolgen, die Zusatzinformation innerhalb eines daten reduzierten Signals abzulegen, betten die Zusatz information häufig nach psychovisuellen oder psycho akustischen Gesichtspunkten in den Code der daten reduzierten Werte ein.Procedure for unnoticed transmission of additive information within other records is also available as Steganography method known. These are particularly found in the image processing application. Numerous basic procedures of the prior art essentially replace the least significant bits of a data record by bits of Additional information to be embedded. Procedures that target track the additional information within a data to drop the reduced signal, add the additive information often according to psychovisual or psycho acoustic aspects in the code of the data reduced values.

Ein Verfahren zum unbemerkten Übertragen und/oder Speichern von Zusatzinformation innerhalb eines codierten datenreduzierten Audiosignals unter Ausnutzung psycho akustischer Gesichtspunkte ist aus DE 44 30 864 A1 bekannt. Entsprechende Verfahren speichern die Zusatz information in den niederwertigen Bits der daten reduzierten Codewörter an den Stellen, an denen den reduzierten Codewörtern mehr Bits zur Verfügung stehen, als für eine Codierung, die frei von subjektiven Beeinträchtigungen ist, laut psychoakustischem Modell nötig ist. Als Variante kann sowohl durch die Entwendung zusätzlicher niederwertiger Bits, mit einer möglichen subjektiven Verschlechterung der Tonqualität, als auch, durch eine Erhöhung der Bitrate des Codes, bei Beibehaltung der durch den Coder produzierten Teile der datenreduzierten Codeworte, eine Erhöhung der Datenrate für die Zusatzinformation erreicht werden. In einem Ausführungsbeispiel für den letzteren Fall wird die Länge der binären Codeworte durch Anfügen der zusätzlich eingefügten Bits an den Stellen, die vom Decoder als niederwertigste Bits aufgefaßt werden, erhöht. Ein Decoder der keine Kenntnis von der Zusatzinformation hat, decodiert das verlängerte Codewort. Erweitert man dieses Verfahren um die Decodierung eines gegebenen Datenstroms zu einem zeitlichen Audiosignal, erhält man ein Verfahren zum Übertragen von Zusatzinformationen innerhalb von Audiosignalen.A method for unnoticed transmission and / or Storage of additional information within a coded data-reduced audio signal using psycho acoustic aspects is from DE 44 30 864 A1 known. Appropriate procedures save the addition information in the low-order bits of the data reduced code words where the reduced code words, more bits are available, than for coding that is free of subjective Impairment is, according to the psychoacoustic model is necessary. As a variant, both through the theft additional low-order bits, with a possible one subjective deterioration in sound quality, as well, by increasing the bit rate of the code, at Preservation of the parts of the data-reduced code words, an increase in the data rate for the additional information can be reached. In one The embodiment for the latter case is the length the binary code words by adding the inserted bits at the positions indicated by the decoder as least significant bits are increased. A decoder who has no knowledge of the additional information, decodes the extended code word. If you expand this Process for decoding a given data stream for a temporal audio signal, a method is obtained to transfer additional information within Audio signals.

Verfahren aus der Bildverarbeitung, deren Aufgabe die Einbettung eines digitalen Wasserzeichens in ein gegebenes Bild ist, sind von der Aufgabenstellung her verwandt, unterscheiden sich aufgrund der stark unterschiedlichen Eigenschaften zwischen Bild- und Audiosignalen jedoch erheblich vom erfindungsgemäßen Verfahren und werden daher hier nicht weiter berücksichtigt.Processes from image processing, the task of which Embedding a digital watermark in a given one Image is, are related in terms of the task, differ due to the very different Properties between image and audio signals, however significantly from the method according to the invention and are therefore not considered further here.

Disadvantages of the prior art

Die bekannten Verfahren, die mittels direkter Manipulation niederwertiger Bits zeitlicher Signale arbeiten, bringen schon bei sehr kleinen Anzahlen veränderter Bits pro Code wort bzw. bei einer sehr kleinen Einbettungsbitbreite erhebliche Qualitätsverluste mit sich. Somit ist die Einbettung bei Kenntnis des Originalsignals perzeptuell erkennbar. Weiterhin sind die auf diese Weise eingebetteten Zusatzinformationen leicht und ohne weitere Hilfsmittel aus dem Audiosignal ablesbar. Verfahren, die Signale in Teilbänder transformieren, dort die nieder wertigen Bits der Teilbandwerte ohne deren gezielte Auswahl manipulieren und danach ein zeitliches Signal rekonstruieren, schaffen zwar Abhilfe gegen die leichte Ablesbarkeit der eingebetteten Zusatzinformation, liefern aber schon bei geringen verwendeten Bitbreiten unerwünschte Qualitätseinbußen beim zeitlichen Audio signal.The known methods by means of direct manipulation lower-order bits of temporal signals work even with very small numbers of changed bits per code word or with a very small embedding bit width considerable loss of quality. So that is Perceptual embedding if the original signal is known recognizable. Furthermore, they are this way embedded additional information easily and without further Tools readable from the audio signal. Procedures that Transform signals into subbands, down there significant bits of the subband values without their targeted Manipulate selection and then a time signal reconstruct, to remedy the light Readability of the embedded additional information but even with small bit widths used undesirable loss of quality in temporal audio signal.

Das Verfahren nach DE 44 30 864 A1 bettet die Zusatz informationen in den datenreduzierten Code ein, allerdings erlaubt eine Erweiterung durch einen nachgeschalteten Decoder wie oben beschrieben, ebendiese Zusatz informationen in das zeitliche Audiosignal einzubetten. Besonders bei geringen erlaubten Bitraten des daten reduzierten Codes ist jedoch zu erwarten, daß die Menge der übertragbaren Zusatzinformationen pro Datenblock nur klein sein wird. Weiterhin liefert die in den Ausführungs beispielen zu DE 44 30 864 A1 angewandte Technik der Erweiterung der Codewörter um niederwertige Bits bei zahl reichen Quantisierungs- bzw. Dequantisierungsarten einen Rekonstruktionsfehler, der im allgemeinen über dem Rekonstruktionsfehler, der bei Verwendung der nicht erweiterten Codewörter auftritt, entsteht, liegt. Daher kann bei diesem Verfahren das induzierte Rauschens die Maskierungsschwelle übersteigen und somit Qualitäts einbußen des zeitlichen Audiosignals verursachen.The method according to DE 44 30 864 A1 embeds the additive information in the data-reduced code, however allows an extension by a downstream Decoder as described above, this addition to embed information in the temporal audio signal. Especially when the bit rate of the data is low reduced codes, however, is expected to be the amount of the transferable additional information per data block only will be small. Furthermore, it delivers in the execution Examples of technology applied to DE 44 30 864 A1 Extension of the code words by low-order bits at number enough types of quantization or dequantization Reconstruction error that is generally above the Reconstruction error when not using the extended code words occurs, arises, lies. Therefore With this method, the induced noise Exceed masking threshold and thus quality cause loss of the temporal audio signal.

Object of the invention

Die Aufgabe des erfindungsgemäßen Verfahrens besteht demgegenüber in der direkten Einbettung der Zusatz informationen in die decodierten und rückquantisierten Subbandsignale nach psychoakustischen Gesichtspunkten mit dem Ziel, daß die Einbettung bei einer Wiedergabe des zeitlichen Audiosignals nicht wahrnehmbar ist. Eine Variante des Verfahrens hat die Aufgabe, die Zusatz informationen so in die Teilbandsignale einzubetten, daß der durch die Quantisierung induzierte Rekonstruktions fehler durch die Einbettung nicht vergrößert wird. Eine weitere Aufgabe der Erfindung ist die möglichst optimale- Ausnutzung der nach psychoakustischen Gesichtspunkten zur Verfügung stehenden Kapazität für die einzubettenden Zusatzinformationen. Eine weitere Aufgabe betrifft die Codierung und Einbettung der Zusatzinformation derart, daß ein entsprechender Coder bzw. Decoder diese wieder rekonstruieren kann. Dies ermöglicht die Übermittlung der Zusatzinformation an einen Empfänger. Eine weitere Aufgabe des erfindungsgemäßen Verfahrens besteht in der Robustheit des verwendeten Codes gegenüber arithmetischen Fehlern des Transformations-Rücktransformationspaares, wie sie z. B. bei der im Standard ISO 11172-3 verwendeten Teilbandtrans formation auftreten.The object of the method according to the invention is in contrast, in the direct embedding of the additive information in the decoded and quantized back Subband signals from a psychoacoustic point of view the aim that the embedding when playing the temporal audio signal is imperceptible. A Variant of the process has the task of adding to embed information in the subband signals so that the reconstruction induced by the quantization error is not increased by the embedding. A Another object of the invention is the optimal Exploitation of the psychoacoustic point of view Available capacity for the embedded Further information. Another task concerns Coding and embedding of the additional information in such a way that a corresponding coder or decoder again can reconstruct. This enables the transmission of the Additional information to a recipient. Another job The method according to the invention consists in the robustness of the code used against arithmetic errors of the Transformation reverse transformation pair, as z. B. with the subband trans used in the standard ISO 11172-3 formation occur.

Solution of the task

Die Aufgabe wird durch die kennzeichnenden Merkmale eines Verfahrens nach Anspruch 1 gelöst. Vorteilhafte Weiter bildungen und Ausgestaltungen des erfindungsgemäßen Verfahrens ergeben sich aus den Unteransprüchen.The task is characterized by the characteristic features of a Method according to claim 1 solved. Advantageous Next Formations and refinements of the invention Procedures result from the subclaims.

Description of the procedure

Die Erfindung macht sich Eigenschaften von Verfahren nach dem Oberbegriff des Anspruchs 1 zu Nutze. Audiosignale werden in aufeinanderfolgenden oder sich untereinander überlappenden Blöcken zeitlich zusammenhängender Signal werte, z. B. unter Verwendung von gefensterten Fourier transformationen, Cosinustransformationen und/oder Filter bänken, in Teilbandsignale zerlegt. Mit Hilfe psycho akustischer Modelle werden die Parameter zur Daten reduktion so festgelegt, daß, oft unter der Bedingung der Einhaltung der maximal für einen Datenblock verfügbaren Bitrate, das durch die Datenreduktion verursachte Rauschen die Maskierungsschwelle, die festlegt, ob gewisse Spektralkomponenten hörbar sind, nicht überschreitet. Zu den Parametern der Datenreduktion gehören bei den meisten Verfahren die Art der Quantisierung, der dafür pro Block zur Verfügung gestellte Platz in Form der Bitbreite eines Codewortes pro Teilblock, sowie Skalenfaktoren. Bei der Quantisierung werden Signalwerte eines zusammenhängenden Amplitudenbereichs auf ein Codewort abgebildet. Der Decoder bildet bei der Rückquantisierung dieses Codewort auf einen Repräsentanten innerhalb des initialen Amplitudenbereichs ab. Zur Reduzierung des maximalen Rekonstruktionsfehlers auf die Hälfte der Intervallgröße wird für solch einen Repräsentanten ein Wert in der Mitte des Intervalls gewählt. Da bei der Rückquantisierung kein Codewort auf die anderen Werte innerhalb des Amplituden bereichs abgebildet wird, können diese zum Transport der Zusatzinformationen verwendet werden. Die Aufgabe der Einbettung der Zusatzinformationen wird durch gezielte Abbildung auf bestimmte Repäsentanten innerhalb des Amplitudenbereichs gelöst. Dabei gibt das Codewort den Rückquantisierungsrepräsentanten und die einzubettende Zusatzinformation die Position innerhalb des Amplituden bereichs des Repräsentanten an.The invention mimics properties of processes the preamble of claim 1 to use. Audio signals be in successive or with each other overlapping blocks of time-related signal values, e.g. B. using windowed Fourier transformations, cosine transformations and / or filters banks, broken down into subband signals. With the help of psycho acoustic models become the parameters for data reduction so that, often under the condition of Compliance with the maximum available for a data block Bit rate, the noise caused by data reduction the masking threshold that determines whether certain Spectral components are audible, does not exceed. To the data reduction parameters belong to most Procedure the type of quantization that is per block provided space in the form of a bit width Codewords per sub-block, as well as scale factors. In the Quantization become signal values of a coherent Amplitude range mapped to a code word. The Decoder forms this code word when quantizing back to a representative within the initial Amplitude range. To reduce the maximum Reconstruction error to half the interval size becomes a middle value for such a representative of the interval selected. Since there is no return quantization Codeword to the other values within the amplitude area, these can be used to transport the Additional information can be used. The task of Embedding the additional information is done through targeted Mapping to specific representatives within the Amplitude range solved. The code word gives the Back quantization representatives and the one to be embedded Additional information the position within the amplitudes area of the representative.

In einer ersten Ausprägung des Verfahrens wird diese Repräsentantenauswahl durch direktes Ersetzen der nieder wertigen Bits durch Teile des einzubettenden Codes durch geführt. Diese Methode führt bei vielen Quantisierungs- bzw. Rückquantisierungsarten im allgemeinen zu einem höheren als dem maximal durch diese Quantisierung normalerweise verursachten Quantisierungsfehler. Bei manchen Anwendungen ist dieser Fehler jedoch akzeptabel.In a first version of the method, this is Representative selection by directly replacing the lower significant bits through parts of the code to be embedded guided. This method leads to many quantization or requantization types in general to one higher than the maximum by this quantization usually caused quantization errors. At however, this error is acceptable in some applications.

In einer Variante des Verfahrens wird encoderseitig zu jedem für das Verfahren relevanten Teilbandwert ein Tendenzbit in den Code integriert, das angibt, ob dieser Teilbandwert größergleich dem zur Rekonstruktion verwendeten Repräsentanten ist, oder kleiner. Die für die Einbettung des Codes zur Verfügung stehenden Werte des Amplitudenbereichs werden in solche größergleich dem zur Rekonstruktion verwendeten Repräsentanten und solche kleiner diesem Repräsentanten eingeteilt. Zeigt das über tragene Tendenzbit, daß der ursprüngliche Teilbandwert größergleich dem zur Rekonstruktion verwendeten Repräsentanten war, wird einer der Amplitudenwerte größer gleich diesem Repräsentanten als Codierung der Zusatz informationen verwendet, ansonsten einer der Amplituden werte kleiner dem des Repräsentanten. Dies kann durch Addition bzw. Subtraktion der Binärdarstellung des Codes und des Repräsentanten realisiert werden. Auf diese Art und Weise wird der ursprüngliche Rekonstruktionsfehler durch die Einbettung nicht vergrößert.In a variant of the method, the encoder side closes each subband value relevant to the procedure Trend bit integrated into the code, which indicates whether this Subband value greater than that for reconstruction representatives used, or smaller. The for the Embedding the code available values of the Amplitude range are greater than those in such Reconstruction used representatives and such smaller than this representative. Show that about carried trend bit that the original subband value greater than that used for reconstruction Representative, one of the amplitude values becomes larger like this representative as the coding of the addition information used, otherwise one of the amplitudes values smaller than that of the representative. This can be done by Addition or subtraction of the binary representation of the code and the representative can be realized. In this manner and way the original reconstruction error becomes not enlarged by the embedding.

Der Einbettung der Zusatzinformationen schließt sich die Rücktransformation des bearbeiteten Blockes, mit Zusammen setzung der resultierenden zeitlichen Datenblöcke zu einem zeitlichen Audiosignal, an.The embedding of the additional information is closed Reverse transformation of the processed block, with together setting the resulting temporal data blocks into one temporal audio signal, on.

Die Rückgewinnung der eingebetteten Zusatzinformationen kann blockweise nach Durchführung der, zur obigen Rück transformation gehörigen, Umkehrtransformation durch geführt werden. Unter der Annahme der Invertierbarkeit oder Umkehrbarkeit der Transformation, kann ein entsprechender Decoder aus den resultierenden Teilband signalen die vom Einbettungsmechanismus ausgewählten Amplitudenwerte ablesen und unter Verwendung der bekannten zur Rekonstruktion verwendeten Repräsentanten die Zusatzinformation extrahieren.The recovery of the embedded additional information can be carried out in blocks after performing the return to the above transformation, inverse transformation through be performed. Assuming invertibility or reversibility of the transformation, can be a corresponding decoder from the resulting subband signals the ones selected by the embedding mechanism Read the amplitude values and use the known ones Representatives used the for the reconstruction Extract additional information.

Es werden vorteilhafte Varianten und Erweiterungen des beschriebenen Verfahrens angegeben. Da in Decoderstufen meist nicht die Parameter des psychoakustischen Modells, sondern nur die zur Decodierung benötigten Parameter zur Verfügung stehen, ist es vorteilhaft, den für die Einbettung zur Verfügung stehenden Platz für die verschiedenen Gebiete der Teilbänder oder Frequenzregionen aus den Decodierparametern zu berechnen. Dabei kann die Quantisierungsauflösung in Verbindung mit der Quantisierungsart zur Errechnung der maximal einbettbaren Codegröße der Zusatzinformation verwendet werden. Bei Benutzung von Skalenfaktoren ist die obige maximalen Codegröße um den, durch die Skalierungsfaktoren bei der Rekonstruktion erzielten, Genauigkeitsgewinn zu reduzieren.There are advantageous variants and extensions of described procedure. Because in decoder stages mostly not the parameters of the psychoacoustic model, but only the parameters required for decoding Are available, it is advantageous for the Available space for embedding different areas of the sub-bands or frequency regions to be calculated from the decoding parameters. The Quantization resolution in connection with the Quantization type to calculate the maximum embeddable Code size of the additional information can be used. At Use of scale factors is the maximum above Code size by the, by the scaling factors at Reconstruction achieved accuracy gain too to reduce.

In der Praxis vorkommende Transformations- und Rück transformationsverfahren liefern in der Regel Arithmetik- oder Rekonstruktionsfehler innerhalb des bearbeiteten Datenstroms. Zur Vermeidung einer Beeinträchtigung des eingebetteten Codes ist es zweckmäßig, obiges Tendenzbit-Verfahren unter Verwendung von Redundanz durch zuführen. Weiterhin ist es zweckmäßig, bei Verfahren, die die oben beschriebene direkte Biteinbettung verwenden, die Codewörter der Zusatzinformationen jeweils mittels eines Codes gegen Arithmetik- oder Transformationsfehler zu sichern.Practical transformation and re transformation methods usually provide arithmetic or reconstruction errors within the processed Data stream. To avoid impairing the embedded codes it is appropriate to do the above Trend bit method using redundancy respectively. Furthermore, it is expedient in processes that use the direct bit embedding described above, the Codewords of the additional information in each case by means of a Codes against arithmetic or transformation errors to back up.

Zwecks Decodierbarkeit der eingebetteten Zusatz informationen seitens eines dafür vorgesehenen Coders, ist es von Vorteil, den eingebetteten Code mit charakteristischen Merkmalen oder Marken zu versehen, die auf die zur Einbettung verwendeten Teilbandwerte verweisen, sowie Bitbreite und Position des Codes innerhalb dieser Teilbandwerte enthalten. Da beliebige Signale Eingabe eines solchen Coders sein können und somit Fehldecodierungen möglich sind, sollte eine eingebettete Marke von einer Qualität sein, die eine Entscheidung über einen vorhandenen Code mit einer hohen Erfolgs wahrscheinlichkeit erlaubt. In order to decodable the embedded addition information from a designated coder it is beneficial to use the embedded code to provide characteristic features or brands that on the subband values used for embedding refer, as well as bit width and position of the code contained within these subband values. Because any Signals can be input of such a encoder and thus Incorrect decoding is possible, should be an embedded one Be a quality brand that makes a decision about an existing code with high success probability allowed.

Möglich ist weiterhin eine Kaskadierung der Schritte
Cascading of the steps is also possible

- embedding of additional information,
- reverse transformation.

Dies kann z. B. bei Verfahren wie ISO 11172-3, Layer III, von Vorteil sein, die eine Kaskade zweier verschiedener Transformationen zur Spektralkomponentenzerlegung verwenden. Zur Rückgewinnung der eingebetteten Zusatz information ist hier die entsprechend umgekehrte Reihen folge der Transformations-Decodierstufen zu verwenden.This can e.g. B. in methods such as ISO 11172-3, Layer III, be advantageous, the cascade of two different Transformations for spectral component decomposition use. To recover the embedded additive information here is the reverse order follow the transform decoding stages.

Advantages of the invention

Die Vorteile des Verfahrens liegen einerseits in der großen Kapazität an übertragbarer Zusatzinformation, wie sie aus der Ausnutzung der vergröberten Darstellung der rückquantisierten Teilbandwerte resultiert. Wird weiterhin beim verwendeten Audiocodec die geforderte Bitrate erniedrigt, sinkt z. B. bei Verfahren nach DE 44 03 864 A1 im allgemeinen die Bitkapazität, wohingegen beim erfindungsgemäßen Verfahren, unter der realistischen Annahme einer induzierten gröberen Quantisierung, die Bit kapazität ansteigt. Vorteilhaft ist weiterhin, daß Verfahren nach Unteransprüchen 2 und 6 gewährleisten, daß der ursprüngliche, durch die Datenreduktion und Rekonstruktion entstandene Rekonstruktionsfehler nicht überschritten wird. Somit wird die durch das gewählte psychoakustische Modell gewährleistete Qualität des rekonstruierten Audiosignals im Gegensatz zu Verfahren nach dem Stand der Technik nicht verschlechtert, sondern in der durch die Datenreduktion induzierten Qualität belassen.The advantages of the method are on the one hand large capacity of transferable additional information, such as them from the use of the coarser representation of the back-quantized subband values result. Will continue the required bit rate for the audio codec used lowered, decreases z. B. in methods according to DE 44 03 864 A1 generally the bit capacity, whereas the inventive method, under the realistic Assumption of an induced coarser quantization, the bit capacity increases. It is also advantageous that Process according to subclaims 2 and 6 ensure that the original, through data reduction and Reconstruction errors did not arise is exceeded. Thus, the one chosen by The psychoacoustic model guarantees the quality of the reconstructed audio signal as opposed to method not deteriorated according to the prior art, but in the quality induced by data reduction leave.

Das Verfahren verändert weiterhin bei Audiocodecs mit den Merkmalen nach dem Oberbegriff des Anspruchs 1 nicht den encoderseitig erzeugten datenreduzierten Code und benötigt lediglich die Kenntnis über die Art der Datenreduktion (Quantisierungsart, Skalenfaktoren u. ä.) und die dabei verwendeten Einstellungen. Daher ist das Verfahren einfach auf eine Vielzahl verschiedener solcher Codecs anzupassen. Bei dem Standard ISO 11172-3 liefern beispielsweise die dem Decoder zur Rückgewinnung des zeitlichen Audiosignals übermittelten Steuerinformationen bereits alle zur Einbettung der Zusatzinformation benötigten Parameter. Daraus folgt weiterhin, daß bei dem Verfahren der Einbettung sowohl zeitliche Audiosignale als auch daten reduzierter Code als Eingabe dienen können. Dies gilt jedoch bei Verfahren nach den Unteransprüchen 2 und 6 nur, wenn in den datenreduzierten Code als Zusatzinformation die benötigten Tendenzinformationen eingefügt wurden.The process continues to change for audio codecs with the Features according to the preamble of claim 1 not the Data-reduced code generated on the encoder side and required only knowledge of the type of data reduction (Type of quantization, scale factors, etc.) and the settings used. Therefore, the procedure is simple adapt to a variety of such codecs. In the ISO 11172-3 standard, for example, the the decoder for the recovery of the temporal audio signal already submitted tax information for Embedding the additional information required parameters. It also follows that in the process of Embedding both temporal audio signals and data reduced code can serve as input. this applies however, in the process according to subclaims 2 and 6 only, if in the data-reduced code as additional information the required trend information has been inserted.

Vorteilhaft ist außerdem, daß sowohl eine Wiedergabe und Verwendung auf herkömmlichen digitalen Medien als auch die Decodierung der eingebetteten Zusatzinformationen durch einen entsprechenden Coder bzw. Decoder möglich ist.It is also advantageous that both a reproduction and Use on conventional digital media as well Decoding of the embedded additional information by a corresponding coder or decoder is possible.

application areas

Das erfindungsgemäße Verfahren findet als universelle Methode zur versteckten Übermittlung von Zusatz informationen in herkömmlichen digitalen Audiosignalen zahlreiche Anwendungen, insbesondere als speziell auf Audiosignal ausgerichtetes Steganographieverfahren. Als Anwendungsbeispiel ist die Verschlüsselung von Texten, Noten, Instrumentierung oder anderen inhaltsbasierten Merkmalen innerhalb des Audiodatenstroms denkbar. Diese Informationen können z. B. auf, mit dem erfindungsgemäßen Verfahren konformen Decodern ausgestatteten, CD-Spielern verwendet werden. Dies kann etwa zur simultanen Ausgabe von akustischen und textuellen Informationen zu Musik stücken, die Gesangsstimmen enthalten, genutzt werden. Bei nicht mit einem solchen Zusatzdecoder ausgestatteten Wiedergabemedien entstehen in diesem Falle keine Beeinträchtigungen der Tonqualität.The inventive method takes place as a universal Hidden delivery method information in conventional digital audio signals numerous applications, especially as specific to Audio signal oriented steganography process. As Application example is the encryption of texts, Sheet music, instrumentation or other content-based Features within the audio data stream conceivable. This Information can e.g. B. on, with the invention Process compliant decoders equipped CD players be used. This can be for simultaneous output of acoustic and textual information about music pieces that contain vocal parts can be used. At not equipped with such an additional decoder Playback media are not created in this case Impaired sound quality.

Weiterhin liegt die Anwendung auf Systemen, die naturgemäß psychoakustische Transformations- oder Teilbandcoder verwenden, nahe. Dies können z. B. Audiodatenbanken sein, die heutzutage häufig datenreduzierte Archivierungsformen für Audiomaterial verwenden. Wird beispielsweise ein Musikstück aus der Datenbank eines Audio-on-Demand Anbieter extrahiert, decodiert und auf CD an einen Kunden geschickt, so können Zusatzinformationen wie Versandtag, Vertreiber, Käufer oder sogar Copyrightrechte unbemerkt eingebettet werden.Furthermore, the application lies on systems that are natural psychoacoustic transformation or subband encoder use, close. This can e.g. B. be audio databases, the archiving forms that are often reduced in data today use for audio material. For example, a Piece of music from the database of an audio-on-demand Provider extracted, decoded and on CD to a customer sent, so additional information such as shipping date, Distributors, buyers or even copyright rights go unnoticed be embedded.

Die Verwendung eines geheimgehaltenen Transformations verfahrens in Verbindung mit einem gegen leichte Signal veränderungen robusten Codec für die eingebettete Information erlaubt hier einen recht effektiven Schutz gegen Decodierung und/oder Entfernung der Copyright information durch Unbefugte.The use of a secret transformation procedure in connection with an against light signal changes robust codec for embedded Information allows for quite effective protection here against decoding and / or removal of the copyright information by unauthorized persons.

Embodiments

Die Erfindung wird nachfolgend anhand der Zeichnung näher erläutert. Es zeigen:The invention will now be described with reference to the drawing explained. Show it:

Abb. 1 Blockschaltbild eines konventionellen Codecs, Fig. 1 block diagram of a conventional codec,

Abb. 2 Blockschaltbild eines Codecs zur Einbettung mit dem Bitersetzungsverfahren, Fig. 2 Block diagram of a codec for embedding with the bit replacement method,

Abb. 3 Blockschaltbild eines Codecs zur Einbettung mit dem Tendenzbitverfahren, Fig. 3 Block diagram of a codec for embedding with the trend bit method,

Abb. 4 Illustration des Bitersetzungsverfahrens, Fig. 4 Illustration of the bit replacement process,

Abb. 5 Illustration des Tendenzbitverfahrens, und Fig. 5 Illustration of the trend bit method, and

Abb. 6 Blockschaltbild eines Decoders zur Rückgewinnung der eingebetteten Zusatzinformationen. Fig. 6 Block diagram of a decoder for the recovery of the embedded additional information.

introduction

Wer kennt sie nicht, die Audiocassettenaufnahme der Tonbandkopie der Langspielplatte, die zwar schon einige deutliche Qualitätseinbußen gegenüber dem Original aufzuweisen hat, aber dennoch ein recht zufrieden stellendes Hörerlebnis liefert - zumindest bis die Cassettenrecorderanlage im Pkw mit der Zeit physikalische Abnutzungen bemerkbar macht oder sogar selbst produziert. Spätestens seit dem Beginn des digitalen Zeitalters sollten solche "analogen" Probleme der Vergangenheit angehören. So sollte man denken. Jedoch treten ähnlich Generationseffekte auch im Zusammenhang mit digitalen audiovisuellen Aufnahmen auf. Bei Mobilkommunikation mit geringer Bandbreite kann zum Beispiel die Hintereinander schaltung (Tandeming) mehrerer verschiedener Codier-De codiert-Stufen (CoDecs) zu einer signifikanten Verschlechterung der Qualität des zu übertragenden Audio signals führen. Die Notwendigkeit solcher CoDecs erwächst aus der Forderung an eine deutliche Reduzierung der Daten rate (Kompression), Gewährleistung einer Fehlerkorrektur gegenüber Übertragungsfehlern sowie einer möglichen Daten formatwandlung zwischen verschiedenen Netzen.Who does not know the audio cassette recording of the Tape copy of the LP, which is already a few significant loss of quality compared to the original has to show, but still quite satisfied provides a listening experience - at least until the Cassette recorder system in the car over time physical Wear noticeable or even produced by yourself. At least since the beginning of the digital age should be such "analog" problems of the past belong to. That's how you should think. However, similar occur Generation effects also in connection with digital audiovisual recordings. With mobile communication with For example, the bandwidth can be narrow Switching (tandeming) of several different coding de encoded levels (CoDecs) to a significant Deterioration in the quality of the audio to be transmitted signals. The need for such CoDecs is growing from the demand for a significant reduction in data rate (compression), ensuring error correction against transmission errors and possible data format conversion between different networks.

Ein weiteres Szenario, welches fortschreitend an Bedeutung gewinnt, liefert die Archivierung von großen Datenmengen in digitalen (Musik-)Bibliotheken. Das vorgestellte Verfahren ist daher insbesondere für die Aufwendung bei Audiodaten gedacht, funktioniert aber selbstverständlich auch bei anderen Daten, z. B. Videodaten. Aufgrund des massiven Datenaufkommens, wie z. B. bei der digitalen Archivierung von Radioproduktionen, liegt es nahe, die anfallenden Daten in ein platzsparendes Format umzuwandeln. Diese Anforderung leisten die im nächsten Abschnitt beschriebenen psychoakustischen Kompressions verfahren mit Datenreduktionsraten von bis zu 1. 12 bei HiFi-Aufnahmen und perzeptuell transparenter Qualität (keine hörbaren Qualitätsunterschiede). Da die Original daten bei solch hohen Kompressionsraten nicht mehr aus dem Code reproduzierbar sind - die dekomprimierten Daten stimmen nur noch perzeptuell mit dem Original überein - handelt es sich hier um verlustbehaftete Verfahren. Eine wiederholte Anwendung des Kompressionsverfahrens auf die dekomprimierten Daten (Daten der ersten Generation) arbeitet somit auf den verfälschten Originaldaten.Another scenario, which is becoming increasingly important wins, delivers the archiving of large amounts of data in digital (music) libraries. The featured The procedure is therefore particularly suitable for the expenditure Audio data thought, but works of course also with other data, e.g. B. video data. Because of the massive amount of data, such as B. in the digital Archiving of radio productions, it is obvious that accumulating data in a space-saving format convert. The next one will meet this requirement Section described psychoacoustic compression process with data reduction rates of up to 1. 12 at HiFi recordings and perceptually transparent quality (no audible quality differences). Because the original with such high compression rates, no longer data from the Code is reproducible - the decompressed data only match the original perceptually - these are lossy procedures. A repeated application of the compression process to the decompressed data (first generation data) thus works on the falsified original data.

Versuche zeigen, daß bei hohen Kompressionsraten schon nach sehr wenigen Wiederholungen der Komprimierung und Dekomprimierung die erzeugten Audiodaten der n-ten Generation eine im Vergleich zum Original perzeptuell unzumutbare Qualität ausweisen.Experiments show that with high compression rates after very few repetitions of compression and Decompression of the generated audio data of the nth Generation one perceptual compared to the original show unreasonable quality.

Aufgaben einer Musikbibliothek, z. B. in Verbindung mit Audioeditier- und Schnittsystemen, bestehen in Retrieval und Weitergabe sowie in Verarbeitung (z. B. Abmischen mehrerer Audiostücke) und wiederholter Speicherung der Audiodaten. Geschieht die Weitergabe unkomprimiert (z. B. via CD oder DAT), erhält der Empfänger Daten erster Generation, die mit den oben beschriebenen Problemen behaftet sind. Werden mehrere dekomprimierte Datensätze zusammengemischt oder auch nur editiert, so wird zur erneuten Speicherung in der Musikbibliothek wiederum nur auf Daten der ersten Generation gearbeitet. Zur sinnvollen Verwendbarkeit einer solchen digitalen Musikbibliothek ist somit ein Verfahren zur Vermeidung solcher Generations effekte notwendig. Tasks of a music library, e.g. B. in connection with Audio editing and editing systems exist in retrieval and transfer and processing (e.g. mixing several audio tracks) and repeated storage of the Audio data. If the transfer is uncompressed (e.g. via CD or DAT), the recipient receives data first Generation that has the problems described above are afflicted. Are multiple decompressed records mixed together or even edited, so becomes renewed storage in the music library again only worked on first generation data. For meaningful Usability of such a digital music library is thus a method for avoiding such generations effects necessary.

Psychoacoustic procedures with high compression rates

Die höchsten Kompressionsraten bei Erhalt perzeptueller Transparenz erreichen momentan Codierer, die Eigenschaften der menschlichen auditiven Wahrnehmung ausnutzen. Dabei werden wesentliche Resultate der Psychoakustik verwendet, wobei sog. Maskierungseffekte einen Schwerpunkt bilden. Grob geht es hierbei um das Phänomen der Verdeckung bestimmter Signalkomponenten durch andere. Hierbei unter scheidet man Zeit- und Frequenzverdeckung. Zeitverdeckung bedeutet, daß in der zeitlichen Abfolge zweier Signale eines der Signale das andere als unhörbar erscheinen lassen kann. Hierbei tritt der Effekt der Vorwärtsverdeckung (ein Signal verdeckt das Nachfolgende) auf einem größeren Zeitintervall auf als der Effekt der Rückwärtsverdeckung (ein Signal verdeckt das Vorhergehende). Frequenzverdeckung läßt sich auf der Spektral- oder Fourieranalyse eines Signals auf einem (relativ kurzen) Zeitintervall beschreiben. Hierbei werden alle Ereignisse als gleichzeitig auftretend interpretiert. Durch Experimente ist zu belegen, daß das Frequenzspektrum in Teilbänder zerlegt werden kann, so daß innerhalb dieser Teilbänder starke Signalanteile schwächere übertönen. Ein psychoakustischer Coder führt zur Ausnutzung der Maskierungseffekte eine Kurzzeitfourieranalyse des Signals durch und berechnet hieraus die Maskierungsparameter eines psychoakustischen Modells. Das Signal wird außerdem, häufig durch eine Subbandtransformation, in Subband signale, die den oben erwähnten Teilbändern entsprechen, zerlegt. Im wesentlichen bestimmen nun die Maskierungs parameter, wie groß die Reduktion der Datenrate pro Subband sein darf, ohne daß wahrnehmbare Störgeräusche entstehen.The highest compression rates on receiving perceptual Coders, properties, currently achieve transparency exploit human auditory perception. Here essential results of psychoacoustics are used, focus on so-called masking effects. It is roughly about the phenomenon of concealment certain signal components by others. Here under one separates time and frequency concealment. Time concealment means that in the chronological order of two signals one of the signals the other appears to be inaudible can leave. Here the effect of Forward masking (one signal hides the following) on a larger time interval than the effect of Back cover (a signal covers that Previous). Frequency masking can be found on the Spectral or Fourier analysis of a signal on a Describe (relatively short) time interval. Here are all events interpreted as occurring simultaneously. Experiments have shown that the frequency spectrum can be broken down into sub-bands, so that within this Subband strong signal components drown out weaker components. On psychoacoustic coder leads to the exploitation of the Masking effects a short-term Fourier analysis of the signal and calculates the masking parameters of a psychoacoustic model. The signal will also often through a subband transformation, in subband signals corresponding to the sub-bands mentioned above, disassembled. The masking is now essentially determined parameter, how big the reduction of the data rate per Subband may be without any perceptible noise arise.

Die Datenreduktion wird im wesentlichen durch eine veränderte, vergröbernde Quantisierung der digitalen Subbandsignale geleistet. Die hierbei verlorengegangenen Daten sind bei der Dekomprimierung nicht mehr rekonstruierbar. Somit wird das Signal erster Generation gegenüber dem Original verändert und eine erneute Berechnung des psychoakustischen Modells auf dem veränderten Signal liefert i. a. einen unterschiedlichen Parametersatz. Diese Parameterveränderung stellt bei CoDecs dieser Art einen wesentlichen Grund für die Generationseffekte dar.The data reduction is essentially through a changed, coarsening quantization of digital Subband signals performed. The lost here Data is no longer in decompression reconstructable. Thus, the signal is first generation changed from the original and a new one Calculation of the psychoacoustic model on the changed signal provides i. a. a different one Parameter set. This parameter change provides CoDecs of this type are an essential reason for Generation effects.

What does the proposed procedure do

Das hier vorgestellte Verfahren stellt einen Lösungs vorschlag dar, der für psychoakustische Kompressions verfahren eine beliebige Wiederholung von Kompression und Dekompression zuläßt, somit beliebig viele Generationen erlaubt, und dabei die perzeptuelle Qualität der ersten Generation erhält. Genauer ist die Erstellung von Kopien weiterer Generationen bei der Wahl geeigneter Coder parameter theoretisch verlustfrei, praktisch von der Qualität der Genauigkeit der verwendeten Rechner arithmetik. Das Verfahren arbeitet bezüglich der benötigten Zusatzinformationen in situ, d. h., es werden keine zusätzlichen Datenformate benötigt. Die vom Decoder erzeugten (PCM) Audiodaten können auf jedem herkömmlichen digitalen Medium gespeichert und davon sowohl mit Standardmedien wiedergegeben werden, als auch mit einem dem vorgeschlagenen Verfahren konformen Encoder im obigen Sinne verlustfrei komprimiert werden.The procedure presented here provides a solution suggestion for psychoacoustic compression proceed any repetition of compression and Allows decompression, so any number of generations allowed, while maintaining the perceptual quality of the first Generation. The creation of copies is more precise generations when choosing suitable encoders parameters theoretically lossless, practically of the Quality of the accuracy of the computers used arithmetic. The process works on the required additional information in situ, d. that is no additional data formats required. The one from the decoder generated (PCM) audio data can be on any conventional digital medium stored and both with Standard media can be played, as well as with a Encoder conforming to the proposed method in the above Senses are compressed lossless.

Two basic ideas

Das Verfahren basiert im wesentlichen auf zwei Grundideen, aus denen sich zwei fundamentale Teilalgorithmen ableiten. Am Anfang steht die Erkenntnis, daß die oben beschriebenen Subbandcodierer zwei Arten von Daten erzeugen, die grob quantisierten Subbandsignale (den eigentlichen Code) und die entsprechenden Seiteninformationen. Die Seiten information besteht z. B. aus Information über Quantisierungsstufen, -art oder verwendete Subbänder. Durch die Seiteninformation (im folgenden auch als Steuer information oder Codierparameter bezeichnet) kann sowohl der Decodierer aus dem Code ein entsprechendes Ausgabe signal rekonstruieren, als auch der codierer aus den subbandtransformierten. Signalen den Code. Letzteres zusammen mit der Annahme einer invertierbaren ("verlust freien") Subbandtransformation führt zur Einsicht, daß es im Prinzip ausreichend ist, nur einmalig die Seiten information mit Hilfe des psychoakustischen Modells zu berechnen und bei allen folgenden Generationen die originale Seiteninformation zu verwenden. Bei einer verlustfreien Transformation gewährleistet dies bei allen nachfolgenden Generationen die Rekonstruktion des Signals erster Generation.The process is essentially based on two basic ideas, from which two fundamental sub-algorithms are derived. At the beginning there is the knowledge that those described above Subband encoders produce two types of data that are rough quantized subband signals (the actual code) and the corresponding page information. The sides information exists e.g. B. from information about Quantization levels, type or subbands used. Through the page information (hereinafter also as a tax information or coding parameters) can both the decoder from the code a corresponding output reconstruct signal, as well as the encoder from the subband transformed. Signals the code. The latter along with the assumption of an invertible ("loss free ") subband transformation leads to the understanding that it is sufficient in principle, only once the pages information using the psychoacoustic model calculate and for all subsequent generations the to use original page information. At a lossless transformation ensures this for everyone subsequent generations the reconstruction of the signal first generation.

Probleme erwachsen aus der Aufgabe, die Seiteninformation zusätzlich zu den dekomprimierten Signaldaten zu verwalten. Dies führt ad hoc zu
Problems arise from the task of managing the page information in addition to the decompressed signal data. This leads to ad hoc

- ≧ 2 files for an audio file (actual PCM data and page information),
- a new data format for storing the pages information,
- The problem that the page information is not without further via standard media (e.g. CD or DAT) can be transported.
- an increased data volume.

Die erste Grundidee liefert ein Verfahren, das PCM-Daten und Seiteninformation in eine Datei codiert (Hybridcode). Diese Datei ist sowohl als Audiodatei verwendbar und auf Standardmedien ohne wahrnehmbaren Qualitätsverlust wieder zugeben, als auch von einem entsprechenden Codierer so entschlüsselbar, daß die gesamte Seiteninformation rekonstruiert werden kann. Das wichtigste Prinzip hierbei ist die Verwendung der psychoakustischen Parameter in einer Weise, die die Kombination von PCM-Code und Seiten information ohne Qualitätsverlust erlaubt. Grob beschreiben die Maskierungsparameter, in welche Subbänder die Seiteninformationen codiert werden können.The first basic idea provides a process called PCM data and page information encoded in a file (hybrid code). This file can be used both as an audio file and on Standard media again without noticeable loss of quality admit, as well as from a corresponding encoder decipherable that the entire page information can be reconstructed. The most important principle here is the use of the psychoacoustic parameters in a way that the combination of PCM code and pages information allowed without loss of quality. Rough describe the masking parameters in which subbands the page information can be encoded.

Die Codierung in die Subbandsignale, die als "gezielte Dequantisierung" beschrieben werden kann und die in der Signalverarbeitung einer Art Aufmodulierung auf ein Trägersignal entspricht, verwendet die zweite Grundidee. Diese Idee führt zu einem Algorithmus, der unter Verwendung einer geringen Mehrinformation die gezielte Dequantisierung so erlaubt, daß die Anforderungen des psychoakustischen Models eingehalten werden. Dies garantiert, daß der Hybridcode perzeptuell mindestens die Qualität einer entsprechenden Audiodatei erster Generation, die ohne Anwendung des Verfahrens erstellt wurde, besitzt. Der Preis hierfür ist die geringfügig größere Seiteninformation, die eine leicht vergrößerte komprimierte Datei liefert.The coding in the subband signals, which are called "targeted Dequantization "and can be described in the Signal processing of a kind of modulation on a Corresponds to carrier signal, uses the second basic idea. This idea leads to an algorithm that is under Using a little more information the targeted Dequantization allows the requirements of the psychoacoustic models are observed. This guarantees that the hybrid code perceptually at least the Quality of a corresponding audio file first Generation that created without using the procedure was owned. The price for this is marginal larger page information that slightly enlarged compressed file delivers.

Eigenheiten der in der Zeichnung dargestellten Codecs und Teilbänder sind:
Peculiarities of the codecs and subbands shown in the drawing are:

- The transformation used is a subband transformation (no spectral transformation).
- The input signal is monophonic.
- The data reduction takes place only in the form of a Quantization instead.
- The number of subbands is greater than three.
- The number of bits per subband value is twelve.
- The number of subband values per subband and signal block is eight.
- The quantization shown in Fig. 4 maps a twelve-bit subband value to a four-bit code word.
- The subband values are binary coded, and that is low the most significant bit is shown in the figure on the right.
The functional units 4 , 6 , 13 and 16 are considered individually (depending on the application example, these can be implemented within a single functional unit. In particular, if the data-reduced code 12 generated is not to be used separately, the units 6 , 12 and 13. Data 5 and 14 , and 11 and 15 , and 22 and 23 are thus identified.)

Eigenheiten des in Abb. 5 dargestellten Tendenz bitverfahrens sind:
Peculiarities of the tendency bit method shown in Fig. 5 are:

- The amplitude range of the subband value under consideration is 0, 1, 2,. . . , 9th
- The number of selected code words is two.
- The division of the amplitude range is linear.
- The back quantization takes place at the center of the the interval assigned to the respective code word.

Abb. 1 zeigt einen konventionellen Audiocodec. Das zeitliche Audiosignal 1 wird blockweise von der Filterbank 2 in Teilbänder 3 zerlegt und dem Quantisierer 4 zugeführt. Das zeitliche Audiosignal 1 wird weiterhin blocksynchron einer psychoakustischen Analyse 7 unter zogen. Die durch diese Analyse errechneten Parameter 8 bestimmen in Kombination mit einer, vorher bestimmten, geforderten Bitrate die Bitzuteilung 9. Aus der Bitzuteilung errechnen sich Quantisierungsparameter 10 unter deren Verwendung die Teilbandwerte 3 vom Quantisierer 4 in datenreduzierte Teilbandwerte 5 über führt werden. Diese Codewörter 5 werden zusammen mit den zur Rückquantisierung benötigten Quantisierungsparametern 11 einem Multiplexer 6 zugeführt, der diese wie auch immer zur weiteren Übertragung codiert, und überträgt 12. Fig. 1 shows a conventional audio codec. The temporal audio signal 1 is broken down in blocks by the filter bank 2 into subbands 3 and fed to the quantizer 4 . The temporal audio signal 1 is still subjected to a block-synchronous psychoacoustic analysis 7 . The parameters 8 calculated by this analysis determine the bit allocation 9 in combination with a previously determined, required bit rate. From the bit allocation to the subband quantization parameter 10 3 values are calculated using them by the quantizer 4 in data reduced subband values 5 are transferred. These code words 5 , together with the quantization parameters 11 required for the back quantization, are fed to a multiplexer 6 , which however encodes them for further transmission, and transmits 12 .

Decoderseitig decodiert ein Demultiplexer 13 die Code wörter 14 und die zur Rückquantisierung benötigten Quantisierungsparameter 15 und führt diese der Rück quantisierungsstufe 16 zu. Nach erfolgter Rück quantisierung werden die Teilbandwerte 17 der Rekonstruktionsfilterbank 18 zugeführt und in einen Block des zeitlichen Ausgabesignals 19 transformiert.On the decoder side, a demultiplexer 13 decodes the code words 14 and the quantization parameters 15 required for the back quantization and supplies them to the back quantization stage 16 . After re-quantization, the subband values 17 are fed to the reconstruction filter bank 18 and transformed into a block of the temporal output signal 19 .

Abb. 2 zeigt einen Audiocodec zur Einbettung von Zusatzinformationen mit dem Bitersetzungsverfahren. Das zeitliche Audiosignal 1 wird blockweise von der Filterbank 2 in Teilbänder 3 zerlegt und dem Quantisierer 4 zugeführt. Das zeitliche Audiosignal 1 wird weiterhin blocksynchron einer psychoakustischen Analyse 7 unter zogen. Die durch diese Analyse errechneten Parameter 8 bestimmen in Kombination mit einer, vorher bestimmten, geforderten Bitrate die Bitzuteilung 9. Aus der Bitzuteilung errechnen sich Quantisierungsparameter 10 unter deren Verwendung die Teilbandwerte 3 vom Quantisierer 4 in datenreduzierte Teilbandwerte 5 über führt werden. Diese Codewörter 5 werden zusammen mit den zur Rückquantisierung benötigten Quantisierungsparametern 11 einem Multiplexer 6 zugeführt, der diese wie auch immer zur weiteren Übertragung codiert und überträgt 12. Decoderseitig decodiert ein Demultiplexer 13 die Code wörter 14 und die zur Rückquantisierung benötigten Quantisierungsparameter 15. Der Demultiplexer 13 führt die Codewörter 14 dem Rückquantisierer 16 sowie die Quantisierungsparameter 15 dem Rückquantisierer 16 und dem Einbettungsmodul 20 zu. Nach erfolgter Rückquantisierung werden die Teilbandwerte 17 dem Einbettungsmodul 20 zugeführt. Mit Hilfe der Quantisierungsparameter 15 bestimmt das Einbettungsmodul 20 Parameter für die Einbettung nach der Bitersetzungsmethode und führt: die Einbettung der Zusatzinformationen 25 durch. Die resultierenden Teilbandsignale 21 werden der Rekonstruktionsfilterbank 18 zugeführt und in einen Block des zeitlichen Ausgabesignals 19 transformiert. Fig. 2 shows an audio codec for embedding additional information with the bit replacement method. The temporal audio signal 1 is broken down in blocks by the filter bank 2 into subbands 3 and fed to the quantizer 4 . The temporal audio signal 1 is still subjected to a block-synchronous psychoacoustic analysis 7 . The parameters 8 calculated by this analysis determine the bit allocation 9 in combination with a previously determined, required bit rate. From the bit allocation to the subband quantization parameter 10 3 values are calculated using them by the quantizer 4 in data reduced subband values 5 are transferred. These code words 5 , together with the quantization parameters 11 required for back quantization, are fed to a multiplexer 6 which , however, encodes and transmits 12 for further transmission. On the decoder side, a demultiplexer 13 decodes the code words 14 and the quantization parameters 15 required for the back quantization. The demultiplexer 13 supplies the code words 14 to the back quantizer 16 and the quantization parameters 15 to the back quantizer 16 and the embedding module 20 . After the back quantization has taken place, the subband values 17 are fed to the embedding module 20 . With the aid of the quantization parameters 15 , the embedding module 20 determines parameters for the embedding according to the bit replacement method and carries out: the embedding of the additional information 25 . The resulting subband signals 21 are fed to the reconstruction filter bank 18 and transformed into a block of the temporal output signal 19 .

Abb. 3 zeigt einen Audiocodec zur Einbettung von Zusatzinformationen mit dem Tendenzbitverfahren. Das zeit liche Audiosignal 1 wird blockweise von der Filterbank 2 in Teilbänder 3 zerlegt und dem Quantisierer 4 zugeführt. Das zeitliche Audiosignal 1 wird weiterhin blocksynchron einer psychoakustischen Analyse 7 unterzogen. Die durch diese Analyse errechneten Parameter 8 bestimmen in Kombination mit einer, vorher bestimmten, geforderten Bitrate die Bitzuteilung 9. Aus der Bitzuteilung errechnen sich Quantisierungsparameter 10 unter deren Verwendung die Teilbandwerte 3 vom Quantisierer 4 in datenreduzierte Teilbandwerte 5 überführt werden. Zusätzlich errechnet der Quantisierer 4 bei der. Datenreduktion die Tendenzbit-Information der relevanten Teilbandwerte. Zur Bestimmung relevanter Teilbandwerte errechnet der Quantisierer 4 die Anzahl der zur Einbettung der Zusatz information 25 benötigten Teilbandwerte and wählt anschließend Teilbandwerte aus. Die Codewörter 5 werden zusammen mit den zur Rückquantisierung benötigten Quantisierungsparametern 11 sowie der Tendenz bitinformation 22 einem Multiplexer 6 zugeführt, der diese wie auch immer zur weiteren Übertragung codiert und über trägt 12. Decoderseitig decodiert ein Demultiplexer 13 die Codewörter 14 und die zur Rückquantisierung benötigten Quantisierungsparameter 15. Der Demultiplexer führt die Codewörter 14 dem Rückquantisierer 16, die Tendenz bitinformation 23 dem Einbettungsmodul 20, sowie die Quantisierungsparmeter 15 dem Rückquantisierer 16 und dem Einbettungsmodul 20 zu. Nach erfolgter Rückquantisierung werden die Teilbandwerte 17 dem Einbettungsmodul zugeführt. Mit Hilfe der Quantisierungsparameter 15 und der Tendenzbitinformation 23 bestimmt das Einbettungsmodul 20 Parameter für die Einbettung nach der Tendenzbitmethode und führt die Einbettung der Zusatzinformationen 25 durch. Die resultierenden Teilbandsignale werden der Rekonstruktionsfilterbank 18 zugeführt und in einen Block des zeitlichen Ausgabesignals 19 transformiert. Fig. 3 shows an audio codec for embedding additional information using the trend bit method. The temporal audio signal 1 is broken down in blocks from the filter bank 2 into subbands 3 and fed to the quantizer 4 . The temporal audio signal 1 is also subjected to a block-synchronous psychoacoustic analysis 7 . The parameters 8 calculated by this analysis determine the bit allocation 9 in combination with a previously determined, required bit rate. From the bit allocation to the subband quantization parameter 10 3 values are calculated using them by the quantizer 4 in data reduced subband values 5 are transferred. In addition, the quantizer 4 calculates the. Data reduction the trend bit information of the relevant subband values. To determine relevant subband values, the quantizer 4 calculates the number of subband values required to embed the additional information 25 and then selects subband values. The code words 5 are fed together with the quantization parameters 11 required for the back quantization and the tendency bit information 22 to a multiplexer 6 which, as always, encodes and transmits them for further transmission 12 . On the decoder side, a demultiplexer 13 decodes the code words 14 and the quantization parameters 15 required for the back quantization. The demultiplexer supplies the code words 14 to the back quantizer 16 , the tendency bit information 23 to the embedding module 20 , and the quantization parameters 15 to the back quantizer 16 and the embedding module 20 . After the back quantization has taken place, the subband values 17 are fed to the embedding module. Using the quantization parameters 15 and the trend bit information 23 , the embedding module 20 determines parameters for the embedding according to the trend bit method and carries out the embedding of the additional information 25 . The resulting subband signals are fed to the reconstruction filter bank 18 and transformed into a block of the temporal output signal 19 .

Abb. 4 zeigt ein Beispiel für das Bitersetzungs verfahren. Aus dem ersten Teilband T1 der abgebildeten Teilbänder 1 eines Blocks wird der sechste Teilbandwert betrachtet: Die Quantisierung bildet den zwölf-Bit Teil bandwert 2 auf ein vier-Bit Codewort 3 ab. Die Rück quantisiserung 4 bildet den Code 3 auf einen zwölf-Bit Teilbandwert ab. Die Einbettung nach dem Bitersetzungs verfahren ersetzt die acht niederwertigen Bits von 4 durch Bits der Zusatzinformationen (a1 . . . , a8). Der Teilbandwert mit eingebettetem Code 5 wird an die entsprechende Stelle der rückzutransformierenden Teilbänder 6 eingefügt. Fig. 4 shows an example of the bit replacement procedure. The sixth sub-band value is considered from the first sub-band T1 of the illustrated sub-bands 1 of a block: the quantization maps the twelve-bit sub-band value 2 to a four-bit code word 3 . The back quantization 4 maps the code 3 to a twelve-bit subband value. The bit replacement method embedding replaces the eight least significant bits of 4 with bits of additional information (a1..., A8). The subband value with embedded code 5 is inserted at the corresponding position of the subband 6 to be transformed back.

Abb. 5 zeigt ein Beispiel für das Tendenzbitverfahren für einen Teilbandwert. Die zu übertragende Zusatz information Z sei durch einen der Werte 0, 1, oder 2 gegeben. Die zugrunde liegende Quantisierung ist in den Schritten A bis E gegeben. Das exemplarische Amplituden intervall A von 0 bis 9 ist in die Intervalle A1 von 0 bis 4 und A2 von 5 bis 9 eingeteilt. Werte aus dem Intervall A1 werden auf das Codewort C1 und Werte aus dem Intervall A2 auf das Codewort C2 abgebildet (B und C). Die Rekonstruktion D bildet das Codewort C1 auf den Wert 2 und das Codewort C2 auf den Wert 7 ab. Ein Quantisierer entsprechend 4 aus Abb. 3 bildet das Tendenzbit T für einen, nach der Vorschrift (A-C) in das Codewort C1 quantisierten, Teilbandwert gemäß Tabelle 1. Die Rück quantisierungsstufe bestimmt aus dem Codewort; der Zusatzinformation Z und dem Tendenzbit T einen rück quantisierten Wert unter Einhaltung der dazu möglichen Werte aus Tabelle 2. Eine dazu anwendbare Vorschrift ist die Addition der Zusatzinformation Z zu dem nach C-E rück quantisierten Wert von Ci, falls T = 1, sowie die Subtraktion der Zusatzinformation Z von dem nach C-E rück quantisierten Wert von Ci, falls T = 0. Die möglichen Rekonstruktionsstufen nach Tabelle 2 folgen aus der Forderung, daß der maximale Quantisierungsfehler wie er durch A-E entsteht, auch unter Verwendung des Tendenz bitverfahrens vom Betrag kleiner als zwei sein soll. Fig. 5 shows an example of the trend bit method for a subband value. The additional information Z to be transmitted is given by one of the values 0, 1 or 2. The underlying quantization is given in steps A to E. The exemplary amplitude interval A from 0 to 9 is divided into the intervals A1 from 0 to 4 and A2 from 5 to 9. Values from the interval A1 are mapped to the code word C1 and values from the interval A2 to the code word C2 (B and C). The reconstruction D maps the code word C1 to the value 2 and the code word C2 to the value 7. A quantizer corresponding to 4 from FIG. 3 forms the trend bit T for a subband value quantized according to the regulation (AC) into the code word C1 according to Table 1. The re-quantization level determines from the code word; the additional information Z and the trend bit T a back-quantized value while observing the possible values from Table 2. One applicable rule is the addition of the additional information Z to the CE-back-quantized value of Ci, if T = 1, and the subtraction of the Additional information Z from the value of Ci re-quantized according to CE, if T = 0. The possible reconstruction stages according to Table 2 follow from the requirement that the maximum quantization error as it arises from AE, even when using the tendency bit method, to be less than two should.

Abb. 6 zeigt ein Blockschaltbild eines Decoders zur Rückgewinnung der eingebetteten Zusatzinformationen. Das zeitliche Audiosignal 1 wird blockweise von der Filterbank 2 in Teilbänder 3 transformiert. Ein Detektor 4 prüft unter Einbeziehung der verwendeten Einbettungsart und Kenntnis aller möglichen Bit- oder Codebreiten, ob eine Markierung eines eingebetteten Codes vorliegt. Falls dies der Fall ist, werden Teilbandsignale 5 und Position der Zusatzinformation an eine Extraktionsstufe 6 übergeben, die die Teilbandwerte 7 rekonstruiert und die Zusatz informationen 8 extrahiert. Ist die verwendete Filterbank nicht translationsinvariant, so kann der Detektor 4 gegebenenfalls eine Translation des zeitlichen Audio signals 1 steuern 9, und eine Wiederholung der Schritte betreffend der Komponenten 2, 3, 4 und 9 herbeiführen. Fig. 6 shows a block diagram of a decoder for the recovery of the embedded additional information. The temporal audio signal 1 is transformed in blocks by the filter bank 2 into subbands 3 . A detector 4 , taking into account the type of embedding used and knowledge of all possible bit or code widths, checks whether there is a mark on an embedded code. If this is the case, subband signals 5 and the position of the additional information are transferred to an extraction stage 6 , which reconstructs the subband values 7 and extracts the additional information 8 . If the filter bank used is not translation-invariant, the detector 4 can optionally control 9 a translation of the temporal audio signal 1 , and bring about a repetition of the steps relating to the components 2 , 3 , 4 and 9 .

Claims

1. Method for transmitting and / or storing additional information within a signal, in particular an audio signal, for at least one block of the signal

1. the parameters of a calculation rule, in particular a psychoacoustic model, are available,
2. a subband or spectral transformation of the signal is carried out,
3. a data reduction is carried out by quantization based on the parameters,
4. the data reduction is reversed by re-quantization,
5. and a reverse transformation is carried out,

characterized by

1. that in at least one subband, a subset of a subband or a subset of spectral components of the back-quantized data, the additional information is embedded at locations which are represented in a coarser resolution as a result of the previous quantization steps.

2. The method according to claim 1, characterized in that with the help of one obtained from the original signal Trend information the embedding of the addition information in the signal values by adding or Subtraction is carried out so that the original quantization error is not exceeded.

3. The method according to claim 1, characterized in that the additional information by replacing the significant bits according to the quantization coarsening is embedded.

4. The method according to claim 3, characterized in that the embedded additional information with an error corrective code is provided.

5. The method according to any one of claims 1 to 3, characterized characterized that the embedded additional information is provided with an arithmetic code.

6. The method according to claim 2, characterized in that the additional information redundant or with an error corrective code is embedded.

7. The method according to any one of claims 1 to 6, characterized characterized by cascades of two or more Embedding and reverse transformation steps are provided.

8. The method according to any one of claims 1 to 7, characterized characterized that the position, the size or the Bit width of the embedded additional information Coding of individual blocks of additional information is marked.

9. The method according to any one of claims 1 to 8, characterized characterized that the position, the size or the Bit width of the embedded additional information separately in the form of a table of contents in certain parts bands or subsets of spectral components is embedded.

10. The method according to any one of claims 1 to 9, characterized characterized in that between quantization and Dequantization of storage and / or further Processing, coding and transmission steps of the source-coded and data-reduced data stream is carried out.

11. The method according to any one of claims 1 to 10, characterized characterized that the steps of quantization and Dequantization within a functional unit be carried out.

12. The method according to any one of claims 1 to 11, characterized characterized that in addition to quantization Scale factors can be used for data reduction.