WO2007045797A1 - Method, program and device for describing a music file, method and program for comparing two music files with one another, and server and terminal for carrying out these methods - Google Patents

Method, program and device for describing a music file, method and program for comparing two music files with one another, and server and terminal for carrying out these methods Download PDF

Info

Publication number
WO2007045797A1
WO2007045797A1 PCT/FR2006/051057 FR2006051057W WO2007045797A1 WO 2007045797 A1 WO2007045797 A1 WO 2007045797A1 FR 2006051057 W FR2006051057 W FR 2006051057W WO 2007045797 A1 WO2007045797 A1 WO 2007045797A1
Authority
WO
WIPO (PCT)
Prior art keywords
description
musical
file
vector
calculated
Prior art date
Application number
PCT/FR2006/051057
Other languages
French (fr)
Inventor
Luigi Lancieri
Lucille Tanquerel
Original Assignee
France Telecom
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by France Telecom filed Critical France Telecom
Publication of WO2007045797A1 publication Critical patent/WO2007045797A1/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/0008Associated control or indicating means
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/075Musical metadata derived from musical analysis or for use in electrophonic musical instruments
    • G10H2240/081Genre classification, i.e. descriptive metadata for classification or selection of musical pieces according to style
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2240/00Data organisation or data communication aspects, specifically adapted for electrophonic musical tools or instruments
    • G10H2240/121Musical libraries, i.e. musical databases indexed by musical parameters, wavetables, indexing schemes using musical parameters, musical rule bases or knowledge bases, e.g. for automatic composing methods
    • G10H2240/155Library update, i.e. making or modifying a musical database using musical parameters as indices
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2250/00Aspects of algorithms or signal processing methods without intrinsic musical character, yet specifically adapted for or used in electrophonic musical processing
    • G10H2250/025Envelope processing of music signals in, e.g. time domain, transform domain or cepstrum domain
    • G10H2250/031Spectrum envelope processing

Definitions

  • Method, program and device for describing a musical file Method and program for comparing two music files with each other, and server and terminal for the implementation of these methods.
  • the present invention relates to a method, a program and a device for describing a musical file, a method and a program for comparing two music files with each other, and a server and a terminal for implementing these methods.
  • Typical coordinates of such a description vector are, for example, the Centroid, the Rolloff, the ZeroCrossings or the MFCCs (Mel-Frequency Cepstral Coefficients). Some of these description coordinates are determined using a frequency spectrum of at least one sample of a signal representing the musical file.
  • a method of describing a musical file of the type in which a description vector comprising at least one description coordinate defined using at least one description vector, is already known. a parameter calculated from a frequency spectrum of at least one sample segment of a signal representing the musical file. It should be noted that a conventional description vector is generally obtained after relatively long calculations, which can make the application of such a musical file description method long and laborious.
  • the object of the invention is in particular to remedy this drawback by providing a method for describing a musical file in which a description vector that can be obtained after simple and fast calculations is used, while maintaining a good quality of the description of the music file.
  • the object of the invention is a method for describing a musical file of the aforementioned type, characterized in that a first calculated parameter corresponds to a directing coefficient of a regression line of points of a space to two dimensions, the coordinates of these points being frequencies and amplitudes defining the frequency spectrum.
  • This steering coefficient makes it possible to define a straight line forming an approximation of the shape of the frequency spectrum of the sample segment.
  • This steering coefficient makes it possible to obtain a coordinate of the description vector, called the oscillation of the frequency spectrum. It is obtained after simple calculations and satisfactorily describes the music file.
  • a first descriptive vector description coordinate is an average of such master coefficients calculated over a plurality of samples.
  • This first coordinate makes it possible to define an average approximate form of the spectrum of the signal.
  • the description vector comprises at least one description coordinate defined using a second calculated parameter corresponding to a speed of variation between two directional coefficients of two adjacent segments of the sample of predetermined identical durations. Indeed, knowing the directional coefficients associated with two identical adjacent segments, and knowing the duration of these segments, it is easy to calculate the speed at which the directional coefficient evolves between these two segments.
  • a second descriptive vector description coordinate is an average of such master coefficient change rates calculated over a plurality of samples. This second coordinate, combined with the first coordinate, makes it possible to improve the description of the musical file.
  • the description vector comprises at least one description coordinate defined by means of a third calculated parameter corresponding to a steering coefficient acceleration calculated using two transmission speeds. variation of the coefficients, each velocity being calculated between two adjacent segments of a triplet of adjacent segments of the sample.
  • a third descriptive vector description coordinate is an average of such master coefficient variation accelerations calculated over a plurality of samples.
  • This third coordinate combined with the first and second coordinates, makes it possible to improve the description of the musical file.
  • at least one descriptive vector description coordinate is a standard deviation of parameters of the same nature calculated over several samples.
  • the description vector is preferably defined in a six-dimensional space, its coordinates in this space being respectively the means and standard deviations of the driving coefficients, speeds and accelerations. This description vector with six description coordinates effectively describes the musical file.
  • the description vector comprises at least one description coordinate defined using a calculated parameter corresponding to a derivative of order greater than two of the variation of the directing coefficient.
  • the description vector may comprise any number of coordinates, each coordinate being calculated from a derivative of order greater than two of the variation of the steering coefficient.
  • each sample is chosen according to a predefined distribution law in the musical file. Alternatively, each sample can be chosen randomly.
  • the description vector of the musical file is incorporated into a description file associated with the musical file.
  • the description vector of the musical file is compared with a table of musical genres in order to determine a musical genre closest to the musical file.
  • the invention also relates to a method for comparing two music files with each other, characterized in that, each musical file being described according to a description method as defined above, the description vectors of the musical files are compared with each other in order to determine a similarity between these music files.
  • a Euclidean distance is calculated between the respective description vectors of the two music files, these music files being considered to be similar if the calculated Euclidian distance is less than a predetermined threshold.
  • the invention also relates to a computer program for describing a musical file, characterized in that it comprises software instructions for the implementation of a description method as defined above.
  • the invention also relates to a computer program for comparing two music files, characterized in that it comprises software instructions for the implementation of a comparison method as defined above.
  • the invention further relates to a server comprising a database in which music files are stored, characterized in that, each musical file being associated with a description vector obtained by a description method as defined above, the server comprises means for receiving a description vector, means for comparing this description vector with the description vectors of the musical files, and means for sending at least one file selected from a musical file whose vector of description is similar to the received description vector and a file with a link to such a music file.
  • the invention also relates to a terminal characterized in that it comprises means for storing a description vector obtained by means of a description method as defined above, means for sending the description vector to a server such that defined above, and means for receiving at least one music file sent by the server.
  • the invention relates to a device for describing a musical file, such as a terminal or a server, characterized in that it comprises means for implementing a description method as defined above.
  • FIG. 1 represents a signal representing a musical file
  • FIG. 2 represents a frequency spectrum of a segment of the signal of FIG. 1;
  • FIG. 3 represents the steps of a description method according to the invention of the musical file represented by the signal of FIG. 1;
  • FIG. 4 represents a computer system in which the description method of FIG. 3 is implemented.
  • FIG. 1 shows a signal S, in the form of an amplitude / time curve. This signal S represents a musical file.
  • FIG. 2 shows points P of a two-dimensional space defined by a first axis ⁇ of coordinates, representing frequencies, and a second axis A of coordinates, representing amplitudes.
  • the points P define a frequency spectrum of a segment si, s2, s3 of a sample E of FIG.
  • these points P are obtained by means of a Fourier transform of the signal on the segment si, s2, s3 considered.
  • Frequency spectra are defined in the same way for each segment si, s2, s3 of sample E.
  • FIG. 2 also shows a regression line D of the points P obtained. using the Fourier transform of the signal on the segment si, s2, s3 considered.
  • FIG. 3 shows the steps of a description method of the musical file using this description vector.
  • a sample E of the signal S is taken.
  • this sample is taken according to a predefined distribution law in the signal S, but it could alternatively be taken randomly.
  • a set of points P defining the frequency spectrum of the signal S on this segment si, s2, s3 is determined.
  • each line D thus determined forms a first calculated parameter.
  • Each first calculated parameter corresponding to a segment si, s2, s3 of the sample E is then stored for later use.
  • a second parameter calculated using the first calculated parameter of each segment of the pair of segments is determined.
  • Each second calculated parameter corresponds to a speed of variation between two directing coefficients of two adjacent segments si, s2 (respectively s2, s3) of the sample E.
  • This speed is easily obtained by calculating a difference between the coefficients of the two adjacent segments, and dividing this difference by the duration of a segment.
  • the sample E having three segments si, s2, s3 adjacent, thus determining two rates of variation of the director coefficient, each forming a second calculated parameter.
  • Each second calculated parameter is stored for later use.
  • a steering coefficient acceleration is determined, calculated using the two master coefficient variation rates calculated in step 40.
  • This acceleration is easily obtained by calculating a difference between these two calculated speeds, then dividing this difference by the duration of a segment.
  • the acceleration of director coefficient variations forms a third calculated parameter, which is stored for later use.
  • the number of sufficient samples is generally quite small. This rather small number reflects the fact that it is generally possible to recognize a musical genre by listening only a few seconds of a music file. This number of samples is preferably a parameter chosen during the implementation of the method.
  • the size of the set of samples taken is preferably smaller than the size of the signal representing the musical file, as can be seen in FIG.
  • a set of samples representing 10% of a musical file is generally sufficient to describe this musical file in a relevant way. Thus, it is not useful for all the samples to represent the entire music file. By reducing the number of samples taken, it reduces the time of implementation of the process. Thus, a set of samples representing between 10 and 50% of the musical file is preferably chosen, which constitutes an optimal compromise between a good quality of description of the musical file and a speed of implementation of the method.
  • Each of these averages forms a description coordinate of the description vector.
  • the standard deviations for each calculated parameter of the same nature are also calculated on all the samples taken.
  • Each of these standard deviations forms a description coordinate of the description vector.
  • the description vector comprises six description coordinates.
  • the description vector is incorporated into a description file, called descriptor, associated with the musical file.
  • a description vector can be stored very easily, its size being relatively small. Indeed, the size of such a description vector is for example of the order of 12 bytes.
  • a step 80 the description vector of the musical file is compared with a table of musical genres for determining, according to the coordinates of the description vector, which is the musical genre closest to the musical file.
  • the music file has been described in such a way as to allow it to be classified in a musical genre.
  • the invention makes it possible to perform a method of comparing two music files with each other in the following manner.
  • a Euclidean distance is calculated between the respective description vectors of the two music files. These music files are considered as being similar if the calculated Euclidean distance is less than a predetermined threshold.
  • the Euclidean distance between the description vectors of these musical files is also substantially zero.
  • Figure 4 shows a computer system designated by the general reference 100.
  • the computer system 100 includes a terminal 102, such as a server, a personal computer, a compact disc player, and so on.
  • a terminal 102 such as a server, a personal computer, a compact disc player, and so on.
  • the terminal 102 is capable of communicating with a server 104 and a device 105 for describing a musical file, for example a description server of a musical file, via a network 106, such as the Internet network. .
  • the description server 105 is provided with means 107 for implementing the previously described description method.
  • the implementation means 107 comprise means for storing a computer program for the description of a musical file, comprising software instructions for implementing the previously described description method and means for storage of a description vector obtained by this description method.
  • the terminal 102 can obtain a description vector corresponding to a musical file by sending this musical file to the description server 105.
  • This description server 105 determines the description vector by means of the description method previously described and sends this vector of description. description at the terminal 102.
  • the terminal 102 could itself be a description device provided with means for implementing the previously described description method. In this case, the terminal 102 could itself determine a description vector corresponding to a musical file stored in this terminal 102.
  • the terminal 102 further comprises means 108 for sending to the server 104 a description vector obtained using the description method, and means 110 for receiving at least one musical file sent by this server 104.
  • the server 104 includes a database 112 in which are stored music files and description vectors associated with these music files. These description vectors are obtained by means of the description method described above.
  • the server 104 further comprises means 114 for receiving a description vector, means 116 for comparing this description vector with the description vectors of the music files, and means 118 for sending at least one file. , such as a musical file whose description vector is similar to the received description vector.
  • the comparison means 116 are provided with means for storing a computer program for the comparison of two music files, comprising software instructions for implementing the comparison method previously described.
  • a user of the terminal 102 wishes to obtain music files similar to a musical file stored in the terminal 102, he generates a description vector of this musical file using the description computer program, then sends the description vector to the server 104 using the sending means 108.
  • the server 104 receives this description vector using the reception means 114.
  • the comparison means 116 then compare this description vector with the description vectors stored in the database 112 using the comparison method previously described. to determine at least one music file similar to the music file stored in the terminal 102.
  • the file sending means 118 send this music file similar to the terminal 102.
  • the file sending means 118 could send a file containing a link to such a musical file. In this case, the user could use this link to download the music file.
  • the description vector could include more or less description coordinates.
  • additional description coordinates may be calculated from two-order derivatives of the variation of the steering coefficient. It should be noted that in order to calculate a derivative of order N of the variation of the directing coefficient, where N is any integer, it is necessary that each sample E taken has N + 1 segments. This derivative of order N is then calculated by iteration of calculations similar to the calculations of the aforementioned acceleration.

Abstract

In this describing method, a description vector is used that contains at least one description coordinated defined with the aid of at least one parameter calculated from a frequency spectrum of at least one segment (s1, s2, s3) of a sample (E) of a signal (S) representing the music file. A first calculated parameter corresponds to a directional coefficient of a regression line of points of a two-dimensional space, the coordinates of these points being frequencies and amplitudes defining the frequency spectrum.

Description

Procédé, programme et dispositif de description d'un fichier musical, procédé et programme de comparaison de deux fichiers musicaux entre eux, et serveur et terminal pour la mise en œuvre de ces procédés.Method, program and device for describing a musical file, method and program for comparing two music files with each other, and server and terminal for the implementation of these methods.
La présente invention concerne un procédé, un programme et un dispositif de description d'un fichier musical, un procédé et un programme de comparaison de deux fichiers musicaux entre eux, et un serveur et un terminal pour la mise en œuvre de ces procédés.The present invention relates to a method, a program and a device for describing a musical file, a method and a program for comparing two music files with each other, and a server and a terminal for implementing these methods.
Afin d'effectuer des traitements automatiques de données audio, tels que des classements de fichiers musicaux par genre musicaux dans une base de données comportant de tels fichiers ou des comparaisons de plusieurs fichiers musicaux entre eux, il est connu d'associer des descripteurs respectifs à ces fichiers musicaux, comportant chacun au moins un vecteur de description.In order to perform automatic processing of audio data, such as music file rankings by music genre in a database comprising such files or comparisons of several music files with each other, it is known to associate respective descriptors with these music files, each comprising at least one description vector.
Dans ce cas, le classement ou la comparaison des fichiers musicaux est réalisé à l'aide de ces vecteurs de description.In this case, the classification or the comparison of the musical files is carried out using these vectors of description.
Des coordonnées classiques d'un tel vecteur de description sont par exemple le Centroid, le Rolloff, le ZeroCrossings ou les MFCC (Mel-Frequency Cepstral Coefficients). Certaines de ces coordonnées de description sont déterminées à l'aide d'un spectre fréquentiel d'au moins un échantillon d'un signal représentant le fichier musical. Ainsi, on connaît déjà, dans l'état de la technique, un procédé de description d'un fichier musical, du type dans lequel on utilise un vecteur de description comprenant au moins une coordonnée de description définie à l'aide d'au moins un paramètre calculé à partir d'un spectre fréquentiel d'au moins un segment d'échantillon d'un signal représentant le fichier musical. On notera qu'un vecteur de description classique est généralement obtenu au terme de calculs relativement longs, ce qui peut rendre longue et laborieuse l'application d'un tel procédé de description de fichier musical.Typical coordinates of such a description vector are, for example, the Centroid, the Rolloff, the ZeroCrossings or the MFCCs (Mel-Frequency Cepstral Coefficients). Some of these description coordinates are determined using a frequency spectrum of at least one sample of a signal representing the musical file. Thus, in the state of the art, a method of describing a musical file, of the type in which a description vector comprising at least one description coordinate defined using at least one description vector, is already known. a parameter calculated from a frequency spectrum of at least one sample segment of a signal representing the musical file. It should be noted that a conventional description vector is generally obtained after relatively long calculations, which can make the application of such a musical file description method long and laborious.
L'invention a notamment pour but de remédier à cet inconvénient en fournissant un procédé de description d'un fichier musical dans lequel on utilise un vecteur de description pouvant être obtenu au terme de calculs simples et rapides, tout en conservant une bonne qualité de la description du fichier musical.The object of the invention is in particular to remedy this drawback by providing a method for describing a musical file in which a description vector that can be obtained after simple and fast calculations is used, while maintaining a good quality of the description of the music file.
A cet effet, l'invention a pour objet un procédé de description d'un fichier musical du type précité, caractérisé en ce qu'un premier paramètre calculé correspond à un coefficient directeur d'une droite de régression de points d'un espace à deux dimensions, les coordonnées de ces points étant des fréquences et des amplitudes définissant le spectre fréquentiel. Ce coefficient directeur permet de définir une droite formant une approximation de la forme du spectre fréquentiel du segment d'échantillon.For this purpose, the object of the invention is a method for describing a musical file of the aforementioned type, characterized in that a first calculated parameter corresponds to a directing coefficient of a regression line of points of a space to two dimensions, the coordinates of these points being frequencies and amplitudes defining the frequency spectrum. This steering coefficient makes it possible to define a straight line forming an approximation of the shape of the frequency spectrum of the sample segment.
Ce coefficient directeur permet d'obtenir une coordonnée du vecteur de description, appelée balancement du spectre fréquentiel. Il est obtenu au terme de calculs simples et permet de décrire de manière satisfaisante le fichier musical.This steering coefficient makes it possible to obtain a coordinate of the description vector, called the oscillation of the frequency spectrum. It is obtained after simple calculations and satisfactorily describes the music file.
De préférence, une première coordonnée de description du vecteur de description est une moyenne de tels coefficients directeurs calculés sur plusieurs échantillons. Cette première coordonnée permet de définir une forme approximative moyenne du spectre du signal. Dans un mode de réalisation particulier de l'invention, le vecteur de description comprend au moins une coordonnée de description définie à l'aide d'un deuxième paramètre calculé correspondant à une vitesse de variation entre deux coefficients directeurs de deux segments adjacents de l'échantillon de durées identiques prédéterminées. En effet, connaissant les coefficients directeurs associés à deux segments adjacents identiques, et connaissant la durée de ces segments, il est facile de calculer la vitesse à laquelle évolue le coefficient directeur entre ces deux segments.Preferably, a first descriptive vector description coordinate is an average of such master coefficients calculated over a plurality of samples. This first coordinate makes it possible to define an average approximate form of the spectrum of the signal. In a particular embodiment of the invention, the description vector comprises at least one description coordinate defined using a second calculated parameter corresponding to a speed of variation between two directional coefficients of two adjacent segments of the sample of predetermined identical durations. Indeed, knowing the directional coefficients associated with two identical adjacent segments, and knowing the duration of these segments, it is easy to calculate the speed at which the directional coefficient evolves between these two segments.
De préférence, une deuxième coordonnée de description du vecteur de description est une moyenne de telles vitesses de variation de coefficient directeur calculées sur plusieurs échantillons. Cette deuxième coordonnée, combinée à la première coordonnée, permet d'améliorer la description du fichier musical.Preferably, a second descriptive vector description coordinate is an average of such master coefficient change rates calculated over a plurality of samples. This second coordinate, combined with the first coordinate, makes it possible to improve the description of the musical file.
Dans un autre mode de réalisation particulier de l'invention, le vecteur de description comprend au moins une coordonnée de description définie à l'aide d'un troisième paramètre calculé correspondant à une accélération de coefficient directeur calculée à l'aide de deux vitesses de variation de coefficients directeurs, chaque vitesse étant calculée entre deux segments adjacents d'un triplet de segments adjacents de l'échantillon.In another particular embodiment of the invention, the description vector comprises at least one description coordinate defined by means of a third calculated parameter corresponding to a steering coefficient acceleration calculated using two transmission speeds. variation of the coefficients, each velocity being calculated between two adjacent segments of a triplet of adjacent segments of the sample.
En effet, connaissant les vitesses associées aux paires de segments adjacents pris deux à deux dans le triplet de segments adjacents, et connaissant la durée de ces segments, il est facile de calculer une accélération du coefficient directeur entre les trois segments du triplet.Indeed, knowing the speeds associated with pairs of adjacent segments taken two by two in the triplet of adjacent segments, and knowing the duration of these segments, it is easy to calculate an acceleration of the steering coefficient between the three segments of the triplet.
De préférence, une troisième coordonnée de description du vecteur de description est une moyenne de telles accélérations de variation de coefficient directeur calculées sur plusieurs échantillons. Cette troisième coordonnée, combinée aux première et deuxième coordonnées, permet d'améliorer la description du fichier musical. On notera qu'il est encore possible d'améliorer la description du fichier musical. En effet, de manière optionnelle, au moins une coordonnée de description du vecteur de description est un écart type de paramètres de même nature calculés sur plusieurs échantillons. Ainsi, le vecteur de description est de préférence défini dans un espace à six dimensions, ses coordonnées dans cet espace étant respectivement les moyennes et écarts types des coefficients directeurs, des vitesses et des accélérations. Ce vecteur de description à six coordonnées de description décrit de manière efficace le fichier musical.Preferably, a third descriptive vector description coordinate is an average of such master coefficient variation accelerations calculated over a plurality of samples. This third coordinate, combined with the first and second coordinates, makes it possible to improve the description of the musical file. Note that it is still possible to improve the description of the music file. Indeed, optionally, at least one descriptive vector description coordinate is a standard deviation of parameters of the same nature calculated over several samples. Thus, the description vector is preferably defined in a six-dimensional space, its coordinates in this space being respectively the means and standard deviations of the driving coefficients, speeds and accelerations. This description vector with six description coordinates effectively describes the musical file.
Dans un autre mode de réalisation, le vecteur de description comprend au moins une coordonnée de description définie à l'aide d'un paramètre calculé correspondant à une dérivée d'ordre supérieur à deux de la variation du coefficient directeur. Dans ce cas, le vecteur de description peut comporter un nombre quelconque de coordonnées, chaque coordonnée étant calculée à partir d'une dérivée d'ordre supérieur à deux de la variation du coefficient directeur. Généralement, chaque échantillon est choisi selon une loi de distribution prédéfinie dans le fichier musical. En variante, chaque échantillon peut être choisi aléatoirement.In another embodiment, the description vector comprises at least one description coordinate defined using a calculated parameter corresponding to a derivative of order greater than two of the variation of the directing coefficient. In this case, the description vector may comprise any number of coordinates, each coordinate being calculated from a derivative of order greater than two of the variation of the steering coefficient. Generally, each sample is chosen according to a predefined distribution law in the musical file. Alternatively, each sample can be chosen randomly.
De préférence, le vecteur de description du fichier musical est incorporé dans un fichier de description associé au fichier musical. Enfin, dans un mode de réalisation particulier, le vecteur de description du fichier musical est comparé avec une table de genres musicaux afin de déterminer un genre musical le plus proche du fichier musical.Preferably, the description vector of the musical file is incorporated into a description file associated with the musical file. Finally, in a particular embodiment, the description vector of the musical file is compared with a table of musical genres in order to determine a musical genre closest to the musical file.
L'invention concerne également un procédé de comparaison de deux fichiers musicaux entre eux, caractérisé en ce que, chaque fichier musical étant décrit selon un procédé de description tel que défini précédemment, des vecteurs de description des fichiers musicaux sont comparés entre eux afin de déterminer une similarité entre ces fichiers musicaux.The invention also relates to a method for comparing two music files with each other, characterized in that, each musical file being described according to a description method as defined above, the description vectors of the musical files are compared with each other in order to determine a similarity between these music files.
De préférence, une distance euclidienne est calculée entre les vecteurs de description respectifs des deux fichiers musicaux, ces fichiers musicaux étant considérés comme similaires si la distance euclidienne calculée est inférieure à un seuil prédéterminé.Preferably, a Euclidean distance is calculated between the respective description vectors of the two music files, these music files being considered to be similar if the calculated Euclidian distance is less than a predetermined threshold.
L'invention concerne également un programme d'ordinateur de description d'un fichier musical, caractérisé en ce qu'il comporte des instructions logicielles pour la mise en œuvre d'un procédé de description tel que défini précédemment. L'invention concerne également un programme d'ordinateur de comparaison de deux fichiers musicaux, caractérisé en ce qu'il comporte des instructions logicielles pour la mise en œuvre d'un procédé de comparaison tel que défini précédemment.The invention also relates to a computer program for describing a musical file, characterized in that it comprises software instructions for the implementation of a description method as defined above. The invention also relates to a computer program for comparing two music files, characterized in that it comprises software instructions for the implementation of a comparison method as defined above.
L'invention concerne en outre un serveur comportant une base de données dans laquelle sont stockés des fichiers musicaux, caractérisé en ce que, chaque fichier musical étant associé à un vecteur de description obtenu par un procédé de description tel que défini précédemment, le serveur comporte des moyens de réception d'un vecteur de description, des moyens de comparaison de ce vecteur de description avec les vecteurs de description des fichiers musicaux, et des moyens d'envoi d'au moins un fichier choisi parmi un fichier musical dont le vecteur de description est similaire au vecteur de description reçu et un fichier comportant un lien vers un tel fichier musical.The invention further relates to a server comprising a database in which music files are stored, characterized in that, each musical file being associated with a description vector obtained by a description method as defined above, the server comprises means for receiving a description vector, means for comparing this description vector with the description vectors of the musical files, and means for sending at least one file selected from a musical file whose vector of description is similar to the received description vector and a file with a link to such a music file.
L'invention concerne également un terminal caractérisé en ce qu'il comporte des moyens de stockage d'un vecteur de description obtenu grâce à un procédé de description tel que défini précédemment, des moyens d'envoi du vecteur de description à un serveur tel que défini précédemment, et des moyens de réception d'au moins un fichier musical envoyé par le serveur.The invention also relates to a terminal characterized in that it comprises means for storing a description vector obtained by means of a description method as defined above, means for sending the description vector to a server such that defined above, and means for receiving at least one music file sent by the server.
L'invention concerne enfin un dispositif de description d'un fichier musical, tel qu'un terminal ou un serveur, caractérisé en ce qu'il comporte des moyens de mise en œuvre d'un procédé de description tel que défini précédemment. L'invention sera mieux comprise à la lecture de la description qui va suivre, donnée uniquement à titre d'exemple et faite en se référant aux dessins annexés dans lesquels :Finally, the invention relates to a device for describing a musical file, such as a terminal or a server, characterized in that it comprises means for implementing a description method as defined above. The invention will be better understood on reading the description which follows, given solely by way of example and with reference to the appended drawings in which:
- la figure 1 représente un signal représentant un fichier musical ;FIG. 1 represents a signal representing a musical file;
- la figure 2 représente un spectre fréquentiel d'un segment du signal de la figure 1 ;FIG. 2 represents a frequency spectrum of a segment of the signal of FIG. 1;
- la figure 3 représente les étapes d'un procédé de description selon l'invention du fichier musical représenté par le signal de la figure 1 ; etFIG. 3 represents the steps of a description method according to the invention of the musical file represented by the signal of FIG. 1; and
- la figure 4 représente un système informatique dans lequel est mis en œuvre le procédé de description de la figure 3. On a représenté sur la figure 1 un signal S, sous la forme d'une courbe amplitude/temps. Ce signal S représente un fichier musical.FIG. 4 represents a computer system in which the description method of FIG. 3 is implemented. FIG. 1 shows a signal S, in the form of an amplitude / time curve. This signal S represents a musical file.
On a représenté également des échantillons E du signal S. Chaque échantillon E comporte trois segments d'échantillon si , s2, s3 adjacents de mêmes durées prédéterminées. On a représenté sur la figure 2 des points P d'un espace à deux dimensions défini par un premier axe ω de coordonnées, représentant des fréquences, et un second axe A de coordonnées, représentant des amplitudes. Les points P définissent un spectre fréquentiel d'un segment si, s2, s3 d'un échantillon E de la figure 1.Also shown are samples E of the signal S. Each sample E has three sample segments si, s2, s3 adjacent of same predetermined durations. FIG. 2 shows points P of a two-dimensional space defined by a first axis ω of coordinates, representing frequencies, and a second axis A of coordinates, representing amplitudes. The points P define a frequency spectrum of a segment si, s2, s3 of a sample E of FIG.
Généralement, ces points P sont obtenus à l'aide d'une transformée de Fourrier du signal sur le segment si , s2, s3 considéré. On définit de la même manière des spectres fréquentiels pour chaque segment si, s2, s3 d'échantillon E.Generally, these points P are obtained by means of a Fourier transform of the signal on the segment si, s2, s3 considered. Frequency spectra are defined in the same way for each segment si, s2, s3 of sample E.
Ces spectres fréquentiels permettent de calculer des paramètres permettant de définir des coordonnées de description d'un vecteur de description du fichier musical représenté par le signal de la figure 1. On a également représenté sur la figure 2 une droite D de régression des points P obtenus à l'aide de la transformée de Fourrier du signal sur le segment si , s2, s3 considéré.These frequency spectra make it possible to calculate parameters making it possible to define description coordinates of a description vector of the musical file represented by the signal of FIG. 1. FIG. 2 also shows a regression line D of the points P obtained. using the Fourier transform of the signal on the segment si, s2, s3 considered.
On a représenté sur la figure 3 les étapes d'un procédé de description du fichier musical utilisant ce vecteur de description. Lors d'une étape 10, on prélève un échantillon E du signal S. De préférence, cet échantillon est prélevé selon une loi de distribution prédéfinie dans le signal S, mais il pourrait en variante être prélevé de manière aléatoire.FIG. 3 shows the steps of a description method of the musical file using this description vector. In a step 10, a sample E of the signal S is taken. Preferably, this sample is taken according to a predefined distribution law in the signal S, but it could alternatively be taken randomly.
Lors d'une étape 20, on détermine, pour chaque segment si, s2, s3 de l'échantillon E, un ensemble de points P définissant le spectre fréquentiel du signal S sur ce segment si , s2, s3 considéré.During a step 20, for each segment si, s2, s3 of the sample E, a set of points P defining the frequency spectrum of the signal S on this segment si, s2, s3 is determined.
Lors d'une étape 30, on réalise, pour chaque ensemble de points P, une régression linéaire de ces points P. Cette régression linéaire permet de déterminer une droite de régression D, telle que représentée sur la figure 2.During a step 30, for each set of points P, a linear regression of these points P is carried out. This linear regression makes it possible to determine a regression line D, as represented in FIG. 2.
Le coefficient directeur de chaque droite D ainsi déterminée forme un premier paramètre calculé. Chaque premier paramètre calculé correspondant à un segment si, s2, s3 de l'échantillon E est alors stocké en vue d'une utilisation ultérieure.The directing coefficient of each line D thus determined forms a first calculated parameter. Each first calculated parameter corresponding to a segment si, s2, s3 of the sample E is then stored for later use.
Lors d'une étape 40, on détermine, pour chaque paire de segments adjacents si , s2 et s2, s3 de l'échantillon E, un deuxième paramètre calculé à l'aide du premier paramètre calculé de chaque segment de la paire de segments. Chaque deuxième paramètre calculé correspond à une vitesse de variation entre deux coefficients directeurs de deux segments adjacents si , s2 (respectivement s2, s3) de l'échantillon E.In a step 40, for each pair of adjacent segments si, s2 and s2, s3 of the sample E, a second parameter calculated using the first calculated parameter of each segment of the pair of segments is determined. Each second calculated parameter corresponds to a speed of variation between two directing coefficients of two adjacent segments si, s2 (respectively s2, s3) of the sample E.
Cette vitesse s'obtient facilement en calculant une différence entre les coefficients directeurs des deux segments adjacents, puis en divisant cette différence par la durée d'un segment. L'échantillon E comportant trois segments si , s2, s3 adjacents, on détermine ainsi deux vitesses de variation du coefficient directeur, formant chacune un deuxième paramètre calculé.This speed is easily obtained by calculating a difference between the coefficients of the two adjacent segments, and dividing this difference by the duration of a segment. The sample E having three segments si, s2, s3 adjacent, thus determining two rates of variation of the director coefficient, each forming a second calculated parameter.
Chaque deuxième paramètre calculé est stocké, en vue d'une utilisation ultérieure.Each second calculated parameter is stored for later use.
Lors d'une étape 50, on détermine une accélération de coefficient directeur, calculée à l'aide des deux vitesses de variation de coefficient directeur calculé lors de l'étape 40.In a step 50, a steering coefficient acceleration is determined, calculated using the two master coefficient variation rates calculated in step 40.
Cette accélération s'obtient facilement en calculant une différence entre ces deux vitesses calculées, puis en divisant cette différence par la durée d'un segment.This acceleration is easily obtained by calculating a difference between these two calculated speeds, then dividing this difference by the duration of a segment.
L'accélération de variations de coefficient directeur forme un troisième paramètre calculé, qui est stocké en vue d'une utilisation ultérieure.The acceleration of director coefficient variations forms a third calculated parameter, which is stored for later use.
Ainsi, on a donc stocké, pour l'échantillon E prélevé, six paramètres calculés, à savoir trois coefficients directeurs (premiers paramètres calculés), deux vitesses de variation de coefficient directeur (deuxièmes paramètres calculés) et une accélération de variation de coefficient directeur (troisième paramètre calculé).Thus, for the sampled sample E, six computed parameters have been stored, namely three guiding coefficients (first calculated parameters), two rates of variation of the guiding coefficient (second calculated parameters) and an acceleration of variation of the guiding coefficient ( third calculated parameter).
Il est possible de renouveler les étapes 10 à 50 autant de fois que l'on juge nécessaire, afin de déterminer des paramètres calculés pour un nombre d'échantillons suffisant pour permettre une bonne représentation du fichier musical. Ce nombre d'échantillons suffisant dépend par exemple d'une taille du fichier musical. On réalise donc dans ce cas un échantillonnage de type probabiliste, en utilisant une loi de distribution des échantillons E permettant de ne prélever que des échantillons E distincts deux à deux.It is possible to repeat the steps 10 to 50 as many times as necessary, in order to determine parameters calculated for a sufficient number of samples to allow a good representation of the musical file. This sufficient number of samples depends for example on a size of the music file. In this case, therefore, probabilistic type sampling is performed, using a distribution law of the samples E making it possible to take only separate samples E two by two.
On notera que le nombre d'échantillons suffisant est généralement assez faible. Ce nombre assez faible traduit le fait qu'il est généralement possible de reconnaître un genre musical en écoutant uniquement quelques secondes d'un fichier musical. Ce nombre d'échantillons est de préférence un paramètre choisi lors de la mise en œuvre du procédé.It should be noted that the number of sufficient samples is generally quite small. This rather small number reflects the fact that it is generally possible to recognize a musical genre by listening only a few seconds of a music file. This number of samples is preferably a parameter chosen during the implementation of the method.
En particulier, la taille de l'ensemble des échantillons prélevés est de préférence inférieure à la taille du signal représentant le fichier musical, comme cela est visible sur la figure 1.In particular, the size of the set of samples taken is preferably smaller than the size of the signal representing the musical file, as can be seen in FIG.
On notera qu'un ensemble d'échantillons représentant 10% d'un fichier musical est généralement suffisant pour décrire de façon pertinente ce fichier musical. Ainsi, il n'est pas utile que l'ensemble des échantillons représente la totalité du fichier musical. En réduisant le nombre d'échantillons prélevés, on réduit le temps de mise en œuvre du procédé. On choisit donc de préférence un ensemble d'échantillons représentant entre 10 et 50% du fichier musical, ce qui constitue un compromis optimal entre une bonne qualité de description du fichier musical et une rapidité de mise en œuvre du procédé.It should be noted that a set of samples representing 10% of a musical file is generally sufficient to describe this musical file in a relevant way. Thus, it is not useful for all the samples to represent the entire music file. By reducing the number of samples taken, it reduces the time of implementation of the process. Thus, a set of samples representing between 10 and 50% of the musical file is preferably chosen, which constitutes an optimal compromise between a good quality of description of the musical file and a speed of implementation of the method.
Lorsque le nombre d'échantillons prélevé est suffisant, on passe à une étapeWhen the number of samples taken is sufficient, we go to a step
60 au cours de laquelle on calcule une moyenne, sur tous les échantillons E prélevés, des premiers paramètres calculés ainsi qu'une moyenne, sur tous les échantillons prélevés, des deuxièmes paramètres calculés, et une moyenne, sur tous les échantillons prélevés, des troisièmes paramètres calculés.60 during which an average is calculated, on all the samples E taken, of the first parameters calculated as well as an average, on all the samples taken, of the second calculated parameters, and an average, on all the samples taken, of the third calculated parameters.
Chacune de ces moyennes forme une coordonnée de description du vecteur de description.Each of these averages forms a description coordinate of the description vector.
On calcule également, lors de cette étape 60, les écarts types pour chaque paramètre calculé de même nature, sur tous les échantillons prélevés. Chacun de ces écarts types forme une coordonnée de description du vecteur de description.In this step 60, the standard deviations for each calculated parameter of the same nature are also calculated on all the samples taken. Each of these standard deviations forms a description coordinate of the description vector.
Ainsi, le vecteur de description comporte six coordonnées de description.Thus, the description vector comprises six description coordinates.
Lors d'une étape 70, le vecteur de description est incorporé dans un fichier de description, dit descripteur, associé au fichier musical. Un tel vecteur de description peut être stocké très facilement, sa taille étant relativement faible. En effet, la taille d'un tel vecteur de description est par exemple de l'ordre de 12 octets.During a step 70, the description vector is incorporated into a description file, called descriptor, associated with the musical file. Such a description vector can be stored very easily, its size being relatively small. Indeed, the size of such a description vector is for example of the order of 12 bytes.
Lors d'une étape 80, le vecteur de description du fichier musical est comparé avec une table de genres musicaux permettant de déterminer, en fonction des coordonnées du vecteur de description, quel est le genre musical le plus proche du fichier musical.In a step 80, the description vector of the musical file is compared with a table of musical genres for determining, according to the coordinates of the description vector, which is the musical genre closest to the musical file.
On a ainsi décrit le fichier musical de manière à permettre son classement dans un genre musical.The music file has been described in such a way as to allow it to be classified in a musical genre.
L'invention permet d'effectuer un procédé de comparaison de deux fichiers musicaux entre eux de la façon suivante. En comparant les vecteurs de description associés respectivement aux fichiers musicaux, déterminés selon le procédé de description tel que décrit précédemment, il est possible de déterminer si les fichiers musicaux sont similaires ou non, c'est à dire s'ils appartiennent à un même genre musical.The invention makes it possible to perform a method of comparing two music files with each other in the following manner. By comparing the description vectors associated respectively with the music files, determined according to the description method as described above, it is possible to determine whether the music files are similar or not, that is to say if they belong to the same genre musical.
Par exemple, on calcule une distance euclidienne entres les vecteurs de description respectifs des deux fichiers musicaux. Ces fichiers musicaux sont considérés comme étant similaires si la distance euclidienne calculée est inférieure à un seuil prédéterminé.For example, a Euclidean distance is calculated between the respective description vectors of the two music files. These music files are considered as being similar if the calculated Euclidean distance is less than a predetermined threshold.
Dans le cas où les deux fichiers musicaux comparés contiennent un même morceau musical, mais de qualités différentes, leurs vecteurs de description selon l'invention sont sensiblement identiques. Dans ce cas, la distance euclidienne entre ces vecteurs de description est sensiblement nulle.In the case where the two compared music files contain the same musical piece, but of different qualities, their description vectors according to the invention are substantially identical. In this case, the Euclidean distance between these description vectors is substantially zero.
De la même manière, dans le cas où les deux fichiers musicaux comparés contiennent un même morceau musical, ces fichiers musicaux n'ayant pas le même format, la distance euclidienne entre les vecteurs de description de ces fichiers musicaux est également sensiblement nulle.In the same way, in the case where the two compared music files contain the same musical piece, these musical files not having the same format, the Euclidean distance between the description vectors of these musical files is also substantially zero.
Un exemple de mise en œuvre de l'invention est décrit en référence à la figure 4, sur laquelle on a représenté un système informatique désigné par la référence générale 100.An exemplary implementation of the invention is described with reference to Figure 4, which shows a computer system designated by the general reference 100.
Le système informatique 100 comporte un terminal 102, tel qu'un serveur, un ordinateur personnel, un lecteur de disque compact, etc.The computer system 100 includes a terminal 102, such as a server, a personal computer, a compact disc player, and so on.
Le terminal 102 est susceptible de communiquer avec un serveur 104 et un dispositif 105 de description d'un fichier musical, par exemple un serveur de description d'un fichier musical, par l'intermédiaire d'un réseau 106, tel que le réseau Internet.The terminal 102 is capable of communicating with a server 104 and a device 105 for describing a musical file, for example a description server of a musical file, via a network 106, such as the Internet network. .
Le serveur 105 de description est muni de moyens 107 de mise en œuvre du procédé de description précédemment décrit. Par exemple, les moyens 107 de mise en œuvre comportent des moyens de stockage d'un programme d'ordinateur pour la description d'un fichier musical, comportant des instructions logicielles pour la mise en œuvre du procédé de description précédemment décrit et des moyens de stockage d'un vecteur de description obtenu par ce procédé de description. Ainsi, le terminal 102 peut obtenir un vecteur de description correspondant à un fichier musical en envoyant ce fichier musical au serveur de description 105. Ce serveur de description 105 détermine alors le vecteur de description grâce au procédé de description précédemment décrit et envoie ce vecteur de description au terminal 102.The description server 105 is provided with means 107 for implementing the previously described description method. For example, the implementation means 107 comprise means for storing a computer program for the description of a musical file, comprising software instructions for implementing the previously described description method and means for storage of a description vector obtained by this description method. Thus, the terminal 102 can obtain a description vector corresponding to a musical file by sending this musical file to the description server 105. This description server 105 then determines the description vector by means of the description method previously described and sends this vector of description. description at the terminal 102.
On notera qu'en variante, le terminal 102 pourrait être lui même un dispositif de description muni de moyens de mise en œuvre du procédé de description précédemment décrit. Dans ce cas, le terminal 102 pourrait déterminer lui même un vecteur de description correspondant à un fichier musical stocké dans ce terminal 102.It will be noted that, alternatively, the terminal 102 could itself be a description device provided with means for implementing the previously described description method. In this case, the terminal 102 could itself determine a description vector corresponding to a musical file stored in this terminal 102.
Le terminal 102 comporte en outre des moyens 108 d'envoi au serveur 104 d'un vecteur de description obtenu à l'aide du procédé de description, et des moyens 110 de réception d'au moins un fichier musical envoyé par ce serveur 104. Le serveur 104 comporte une base de donnée 112 dans laquelle sont stockés des fichiers musicaux et des vecteurs de description associés à ces fichiers musicaux. Ces vecteurs de description sont obtenus grâce au procédé de description précédemment décrit. Le serveur 104 comporte en outre des moyens 114 de réception d'un vecteur de description, des moyens 116 de comparaison de ce vecteur de description avec les vecteurs de description des fichiers musicaux, et des moyens 118 d'envoi d'au moins un fichier, tel qu'un fichier musical dont le vecteur de description est similaire au vecteur de description reçu. Les moyens de comparaison 116 sont munis de moyens de stockage d'un programme d'ordinateur pour la comparaison de deux fichiers musicaux, comportant des instructions logicielles pour la mise en œuvre du procédé de comparaison précédemment décrit.The terminal 102 further comprises means 108 for sending to the server 104 a description vector obtained using the description method, and means 110 for receiving at least one musical file sent by this server 104. The server 104 includes a database 112 in which are stored music files and description vectors associated with these music files. These description vectors are obtained by means of the description method described above. The server 104 further comprises means 114 for receiving a description vector, means 116 for comparing this description vector with the description vectors of the music files, and means 118 for sending at least one file. , such as a musical file whose description vector is similar to the received description vector. The comparison means 116 are provided with means for storing a computer program for the comparison of two music files, comprising software instructions for implementing the comparison method previously described.
Ainsi, lorsqu'un utilisateur du terminal 102 désire obtenir des fichiers musicaux similaires à un fichier musical stocké dans le terminal 102, il génère un vecteur de description de ce fichier musical à l'aide du programme d'ordinateur de description, puis envoie ce vecteur de description au serveur 104 à l'aide des moyens d'envoi 108.Thus, when a user of the terminal 102 wishes to obtain music files similar to a musical file stored in the terminal 102, he generates a description vector of this musical file using the description computer program, then sends the description vector to the server 104 using the sending means 108.
Le serveur 104 reçoit ce vecteur de description à l'aide des moyens de réception 114. Les moyens de comparaison 116 comparent ensuite ce vecteur de description aux vecteurs de description stockés dans la base de données 112 à l'aide du procédé de comparaison précédemment décrit, afin de déterminer au moins un fichier musical similaire au fichier musical stocké dans le terminal 102.The server 104 receives this description vector using the reception means 114. The comparison means 116 then compare this description vector with the description vectors stored in the database 112 using the comparison method previously described. to determine at least one music file similar to the music file stored in the terminal 102.
Lorsque ce fichier musical similaire est déterminé, les moyens 118 d'envoi de fichier envoient ce fichier musical similaire au terminal 102. En variante, les moyens 118 d'envoi de fichier pourraient envoyer un fichier comportant un lien vers un tel fichier musical. Dans ce cas, l'utilisateur pourrait utiliser ce lien pour télécharger le fichier musical.When this similar musical file is determined, the file sending means 118 send this music file similar to the terminal 102. As a variant, the file sending means 118 could send a file containing a link to such a musical file. In this case, the user could use this link to download the music file.
On notera que l'invention n'est pas limitée au mode de réalisation précédemment décrit.It should be noted that the invention is not limited to the embodiment previously described.
En effet, le vecteur de description pourrait comporter davantage ou moins de coordonnées de description.Indeed, the description vector could include more or less description coordinates.
Par exemple, des coordonnées de description supplémentaires peuvent être calculées à partir de dérivées d'ordre supérieur à deux de la variation du coefficient directeur. On notera que pour calculer une dérivée d'ordre N de la variation du coefficient directeur, où N est un nombre entier quelconque, il est nécessaire que chaque échantillon E prélevé comporte N+1 segments. Cette dérivée d'ordre N est alors calculée par itération de calculs similaires aux calculs de l'accélération précités. For example, additional description coordinates may be calculated from two-order derivatives of the variation of the steering coefficient. It should be noted that in order to calculate a derivative of order N of the variation of the directing coefficient, where N is any integer, it is necessary that each sample E taken has N + 1 segments. This derivative of order N is then calculated by iteration of calculations similar to the calculations of the aforementioned acceleration.

Claims

REVENDICATIONS
1. Procédé de description d'un fichier musical, du type dans lequel on utilise un vecteur de description comprenant au moins une coordonnée de description définie à l'aide d'au moins un paramètre calculé à partir d'un spectre fréquentiel d'au moins un segment (si , s2, s3) d'échantillon (E) d'un signal (S) représentant le fichier musical, caractérisé en ce qu'un premier paramètre calculé correspond à un coefficient directeur d'une droite (D) de régression de points (P) d'un espace à deux dimensions, les coordonnées de ces points étant des fréquences (ω ) et des amplitudes (A) définissant le spectre fréquentiel .A method for describing a musical file, of the type in which a description vector comprising at least one description coordinate defined using at least one parameter calculated from a frequency spectrum of at least one sample segment (si, s2, s3) (E) of a signal (S) representing the musical file, characterized in that a first calculated parameter corresponds to a directing coefficient of a line (D) of regression of points (P) of a two-dimensional space, the coordinates of these points being frequencies (ω) and amplitudes (A) defining the frequency spectrum.
2. Procédé de description d'un fichier musical selon la revendication 1, caractérisé en ce que le vecteur de description comprend au moins une coordonnée de description définie à l'aide d'un deuxième paramètre calculé correspondant à une vitesse de variation entre deux coefficients directeurs de deux segments (si , s2 ; s2, s3) adjacents de l'échantillon (E) de durées identiques prédéterminées.2. Method for describing a musical file according to claim 1, characterized in that the description vector comprises at least one description coordinate defined using a second calculated parameter corresponding to a speed of variation between two coefficients. director of two adjacent segments (si, s2, s2, s3) of the sample (E) of predetermined identical durations.
3. Procédé de description d'un fichier musical selon la revendication 2, caractérisé en ce que le vecteur de description comprend au moins une coordonnée de description définie à l'aide d'un troisième paramètre calculé correspondant à une accélération de variation de coefficient directeur calculée à l'aide de deux vitesses de variation de coefficients directeurs, chaque vitesse étant calculée entre deux segments (si , s2 ; s2, s3) adjacents d'un triplet de segments adjacents (si , s2, s3) de l'échantillon (E).3. A method of describing a musical file according to claim 2, characterized in that the description vector comprises at least one description coordinate defined by means of a third calculated parameter corresponding to an acceleration of variation of the directing coefficient. calculated using two rates of variation of the coefficients, each velocity being calculated between two adjacent segments (si, s2, s2, s3) of a triplet of adjacent segments (si, s2, s3) of the sample ( E).
4. Procédé de description d'un fichier musical selon l'une quelconque des revendications 1 à 3, caractérisé en ce que le vecteur de description comprend au moins une coordonnée de description définie à l'aide d'un paramètre calculé correspondant à une dérivée d'ordre supérieur à deux de la variation du coefficient directeur.4. A method of describing a musical file according to any one of claims 1 to 3, characterized in that the description vector comprises at least one description coordinate defined using a calculated parameter corresponding to a derivative. of order greater than two of the variation of the guiding coefficient.
5. Procédé de description d'un fichier musical selon l'une quelconque des revendications 1 à 4, caractérisé en ce qu'au moins une coordonnée de description du vecteur de description est une moyenne de paramètres de même nature calculés sur plusieurs échantillons (E).5. A method of describing a musical file according to any one of claims 1 to 4, characterized in that at least one descriptive vector description coordinate is an average of parameters of the same nature calculated on several samples (E ).
6. Procédé de description d'un fichier musical selon l'une quelconque des revendications 1 à 5, caractérisé en ce qu'au moins une coordonnée de description du vecteur de description est un écart type de paramètres de même nature calculés sur plusieurs échantillons (E). 6. A method of describing a musical file according to any one of claims 1 to 5, characterized in that at least one descriptive vector description coordinate is a standard deviation of parameters of the same nature calculated over several samples ( E).
7. Procédé de description d'un fichier musical selon l'une quelconque des revendications précédentes, caractérisé en ce que chaque échantillon (E) est choisi selon une loi de distribution prédéfinie dans le fichier musical.7. A method of describing a musical file according to any one of the preceding claims, characterized in that each sample (E) is chosen according to a predefined distribution law in the musical file.
8. Procédé de description d'un fichier musical selon l'une quelconque des revendications précédentes, caractérisé en ce que le vecteur de description du fichier musical est incorporé dans un fichier de description associé au fichier musical.8. A method of describing a musical file according to any one of the preceding claims, characterized in that the description vector of the musical file is incorporated into a description file associated with the music file.
9. Procédé de description d'un fichier musical selon l'une quelconque des revendications précédentes, caractérisé en ce que le vecteur de description du fichier musical est comparé avec une table de genres musicaux afin de déterminer un genre musical le plus proche du fichier musical.9. A method of describing a musical file according to any one of the preceding claims, characterized in that the description vector of the musical file is compared with a table of musical genres in order to determine a musical genre closest to the musical file. .
10. Procédé de comparaison de deux fichiers musicaux entre eux, caractérisé en ce que, chaque fichier musical étant décrit selon un procédé de description selon l'une quelconque des revendications 1 à 9, des vecteurs de description des fichiers musicaux sont comparés entre eux afin de déterminer une similarité entre ces fichiers musicaux.10. A method of comparing two music files with each other, characterized in that, each musical file being described according to a description method according to any one of claims 1 to 9, vectors of description of the music files are compared with each other so to determine a similarity between these music files.
11. Procédé de comparaison de deux fichiers musicaux selon la revendication 10, caractérisé en ce qu'une distance euclidienne est calculée entre les vecteurs de description respectifs des deux fichiers musicaux, ces fichiers musicaux étant considérés comme similaires si la distance euclidienne calculée est inférieure à un seuil prédéterminé.11. A method of comparing two music files according to claim 10, characterized in that a Euclidean distance is calculated between the respective description vectors of the two musical files, these music files being considered to be similar if the calculated Euclidean distance is less than a predetermined threshold.
12. Programme d'ordinateur pour la description d'un fichier musical, caractérisé en ce qu'il comporte des instructions logicielles pour la mise en œuvre d'un procédé de description selon l'une quelconque des revendications 1 à 9.12. Computer program for the description of a musical file, characterized in that it comprises software instructions for the implementation of a description method according to any one of claims 1 to 9.
13. Programme d'ordinateur pour la comparaison de deux fichiers musicaux, caractérisé en ce qu'il comporte des instructions logicielles pour la mise en œuvre d'un procédé de comparaison selon la revendication 10 ou 11.13. Computer program for the comparison of two music files, characterized in that it comprises software instructions for the implementation of a comparison method according to claim 10 or 11.
14. Serveur (104) comportant une base de données (112) dans laquelle sont stockés des fichiers musicaux, caractérisé en ce que, chaque fichier musical étant associé à un vecteur de description obtenu par un procédé de description selon l'une quelconque des revendications 1 à 9, le serveur comporte :14. Server (104) comprising a database (112) in which music files are stored, characterized in that, each musical file being associated with a description vector obtained by a description method according to any one of the claims. 1 to 9, the server comprises:
- des moyens (114) de réception d'un vecteur de description,means (114) for receiving a description vector,
- des moyens (116) de comparaison de ce vecteur de description avec les vecteurs de description des fichiers musicaux, etmeans (116) for comparing this description vector with the description vectors of the musical files, and
- des moyens (118) d'envoi d'au moins un fichier choisi parmi un fichier musical dont le vecteur de description est similaire au vecteur de description reçu et un fichier comportant un lien vers un tel fichier musical. means (118) for sending at least one file chosen from a musical file whose description vector is similar to the received description vector and a file containing a link to such a musical file.
15. Terminal (102), caractérisé en ce qu'il comporte :Terminal (102), characterized in that it comprises:
- des moyens de stockage d'un vecteur de description obtenu grâce à un procédé de description selon l'une quelconque des revendications 1 à 9means for storing a description vector obtained by means of a description method according to any one of claims 1 to 9
- des moyens (108) d'envoi du vecteur à un serveur (104) selon la revendication 13, etmeans (108) for sending the vector to a server (104) according to claim 13, and
- des moyens (110) de réception d'au moins un fichier musical envoyé par le serveur (104).means (110) for receiving at least one musical file sent by the server (104).
16. Dispositif de description d'un fichier musical, tel qu'un terminal (102) ou un serveur (105), caractérisé en ce qu'il comporte des moyens de mise en œuvre d'un procédé de description selon l'une quelconque des revendications 1 à 9. 16. Device for describing a musical file, such as a terminal (102) or a server (105), characterized in that it comprises means for implementing a description method according to any one of Claims 1 to 9.
PCT/FR2006/051057 2005-10-20 2006-10-18 Method, program and device for describing a music file, method and program for comparing two music files with one another, and server and terminal for carrying out these methods WO2007045797A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR0510720 2005-10-20
FR0510720 2005-10-20

Publications (1)

Publication Number Publication Date
WO2007045797A1 true WO2007045797A1 (en) 2007-04-26

Family

ID=36283792

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/FR2006/051057 WO2007045797A1 (en) 2005-10-20 2006-10-18 Method, program and device for describing a music file, method and program for comparing two music files with one another, and server and terminal for carrying out these methods

Country Status (1)

Country Link
WO (1) WO2007045797A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7994410B2 (en) * 2008-10-22 2011-08-09 Classical Archives, LLC Music recording comparison engine

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040044525A1 (en) * 2002-08-30 2004-03-04 Vinton Mark Stuart Controlling loudness of speech in signals that contain speech and other types of audio material

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20040044525A1 (en) * 2002-08-30 2004-03-04 Vinton Mark Stuart Controlling loudness of speech in signals that contain speech and other types of audio material

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
RABINER L R ED - FURUI S ET AL: "Applications of speech recognition in the area of telecommunications", AUTOMATIC SPEECH RECOGNITION AND UNDERSTANDING, 1997. PROCEEDINGS., 1997 IEEE WORKSHOP ON SANTA BARBARA, CA, USA 14-17 DEC. 1997, NEW YORK, NY, USA,IEEE, US, 14 December 1997 (1997-12-14), pages 501 - 510, XP010267474, ISBN: 0-7803-3698-4 *
RAJAPAKSE M ET AL: "Generic Audio Classification Using a Hybrid Model Based on GMMs and HMMs", MULTIMEDIA MODELLING CONFERENCE, 2004. MMM 2005. PROCEEDINGS OF THE 11TH INTERNATIONAL HONOLULU, HI, USA 12-14 JAN. 2005, PISCATAWAY, NJ, USA,IEEE, 12 January 2005 (2005-01-12), pages 53 - 58, XP010765571, ISBN: 0-7695-2164-9 *
WELSH M ET AL: "QUERYING LARGE COLLECTIONS OF MUSIC FOR SIMILARITY", UC BERKELEY TECHNICAL REPORT, no. -1096, November 1999 (1999-11-01), XP008027813 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7994410B2 (en) * 2008-10-22 2011-08-09 Classical Archives, LLC Music recording comparison engine

Similar Documents

Publication Publication Date Title
EP2685450B1 (en) Device and method for recognizing content using audio signals
EP2507077B1 (en) Method for detecting the wear of a tyre
EP2817775B1 (en) Audience-measuring method
EP2798575B1 (en) Method for identifying micro-organisms by mass spectrometry and score normalisation
WO2006075077A2 (en) Method and device for individualizing hrtfs by modeling
WO2005101292A2 (en) Method for searching content particularly for extracts common to two computer files
EP3079074A1 (en) Data-processing method for estimating parameters for mixing audio signals, associated mixing method, devices and computer programs
EP2920979B1 (en) Acquisition of spatialised sound data
FR2857122A1 (en) NAVIGATION METHOD IN A SET OF SOUND DOCUMENTS USING A GRAPHICAL INTERFACE, AND RECEIVER FOR NAVIGATION ACCORDING TO THE METHOD
WO2014131984A2 (en) Generation of a signature of a musical audio signal
EP1652180B1 (en) Method for reproducing audio documents with the aid of an interface comprising document groups and associated reproducing device
EP1157261A2 (en) Method and device for analysing a highly dynamic wavefront
WO2007045797A1 (en) Method, program and device for describing a music file, method and program for comparing two music files with one another, and server and terminal for carrying out these methods
EP3556102A1 (en) Method of recording a forthcoming telebroadcast program
FR3078196A1 (en) METHOD AND DEVICE FOR SYNCHRONIZING RECORDINGS COMPRISING AN AUDIO SIGNAL FROM DIFFERENT CO-LOCALIZED ACQUISITION DEVICES
EP2849179B1 (en) Method for detecting symbols carried by at least one signal transmitted in the presence of noise
EP2452293A1 (en) Source location
FR2759231A1 (en) Inserting digital data message in audio carrier signal
WO2017064400A1 (en) Contextual enrichment by audio recognition
EP3900402A1 (en) Calibration of a distributed sound reproduction system
EP2160882A1 (en) Method and device for establishing relation between pairs in a network
FR3088742A1 (en) Method of communication between a portable device comprising a touch surface, and a peripheral device selected by a directional sliding on the touch surface.
FR2815760A1 (en) Method for forming a digital signal representative of an original audio signal and a method for searching for such digital signals within a sound database in a manner analogous to searching for text using a web browser
WO2007068861A2 (en) Phase estimating method for a digital signal sinusoidal simulation
FR2751776A1 (en) METHOD OF EXTRACTING THE BASIC FREQUENCY OF A SPEECH SIGNAL

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 06820313

Country of ref document: EP

Kind code of ref document: A1