WO2006136300A1 - Device and method for determining a point in a film comprising film data applied in chronological order - Google Patents

Device and method for determining a point in a film comprising film data applied in chronological order Download PDF

Info

Publication number
WO2006136300A1
WO2006136300A1 PCT/EP2006/005553 EP2006005553W WO2006136300A1 WO 2006136300 A1 WO2006136300 A1 WO 2006136300A1 EP 2006005553 W EP2006005553 W EP 2006005553W WO 2006136300 A1 WO2006136300 A1 WO 2006136300A1
Authority
WO
WIPO (PCT)
Prior art keywords
film
signal
time
test
fingerprint representation
Prior art date
Application number
PCT/EP2006/005553
Other languages
German (de)
French (fr)
Inventor
Thomas Sporer
Michael Beckinger
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority to EP06754259A priority Critical patent/EP1894199A1/en
Priority to CN2006800249179A priority patent/CN101218648B/en
Priority to JP2008517365A priority patent/JP5137826B2/en
Publication of WO2006136300A1 publication Critical patent/WO2006136300A1/en

Links

Classifications

    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03BAPPARATUS OR ARRANGEMENTS FOR TAKING PHOTOGRAPHS OR FOR PROJECTING OR VIEWING THEM; APPARATUS OR ARRANGEMENTS EMPLOYING ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ACCESSORIES THEREFOR
    • G03B31/00Associated working of cameras or projectors with sound-recording or sound-reproducing means
    • G03B31/04Associated working of cameras or projectors with sound-recording or sound-reproducing means in which sound track is not on, but is synchronised with, a moving-picture film
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel

Definitions

  • the present invention relates to an apparatus and a method for determining a location in a film having film information applied in a temporal sequence to synchronize, for example, film events with image reproduction.
  • Audio-video data is on data carriers, e.g. Film or tape, or transmission channels, e.g. Radio or telephone, stored in a fixed format, which can be extended to include new audio formats or other synchronous additional services, such as Subtitles, not allowed. For example, when new audio formats are introduced, new media or movie copies must be produced that have the new audio formats.
  • data carriers e.g. Film or tape
  • transmission channels e.g. Radio or telephone
  • Fig. 8 shows an exemplary film 110.
  • Film information is applied to the film in spatial sequence, or during playback, respectively, in chronological order, e.g. Video information or images 112, which are also referred to as "frames" in the English language, and audio information or one or a plurality of analog or digital audio tracks 114 which are used in the digital case "audio frames".
  • the film 110 has, by way of example, feed perforations 116 with the aid of which the film is played back.
  • the time code is then used to play audio or additional information synchronously from an external data carrier, for example CD in DTS.
  • DTS Digital Theater System
  • mp3 Digital Theater System
  • the time code is then used to play audio or additional information synchronously from an external data carrier, for example CD in DTS.
  • each additional format requires more space on the disk or transmission channel, which may not be available anymore. In the case of film, these are, for example, the tracks for analogue sound, Dolby Digital, DTS, SDDS (
  • the second method is based on the misuse of analog audio tracks for storing time code as described e.g. in a prototype cinema equipped with an IOSONO system.
  • a disadvantage of this method is that the analog track is present in all systems and is often used as a fallback solution in case of disturbances of other systems, that is, an alienation of the analog track prevents the fallback possibility.
  • the automatic switching to the analogue track which is built into most cinemas, causes the timecode to be played back as an analogue signal if no signal is present on the "more modern" Dolby Digital or DTS tracks in a pure wave field synthesis playback, which will be explained below, the redundant analog playback are turned off manually, because otherwise the time code can be heard on the redundant other speakers.
  • WFS Acoustic Wave Field Synthesis
  • the air vibrations of a real situation which make up the sound, are tried over a whole To recreate space.
  • the wave field synthesis is intended to transmit the entire sound field true to the original to the room. This means that the virtual sound sources can be exactly spatially localized, and possibly even seem to exist in the middle of the sounded room, thus they can be bypassed.
  • Systems with up to 200 loudspeakers in cinema systems and up to 900 loudspeakers in theater sound systems have already been implemented.
  • Wave field synthesis is based on the Huygens principle, which states that any point on a wavefront can be considered as the starting point for an elementary spherical wave. By interference of all elementary waves, a new wavefront arises, which is identical to the original wave.
  • the cinema Ilmenau in which the wave field synthesis is operated in two modes.
  • the cinema is operated as a "real" wave field synthesis system, where the analog track of the 35 mm film stores the time code, as explained above with regard to the second "abusive" method, and the WFS sound of an external medium, eg Hard disk or DVD, is leaked.
  • an external medium eg Hard disk or DVD
  • the sound stored on each 35 mm movie is taken from a Dolby processor, alternatively DTS or SDDS could also be used be read, read and decoded, the Dolby processor may also switch automatically to the analog track, and maps the resulting multi-channel signal via WFS on virtual speakers.
  • a Dolby processor alternatively DTS or SDDS could also be used be read, read and decoded, the Dolby processor may also switch automatically to the analog track, and maps the resulting multi-channel signal via WFS on virtual speakers.
  • a disadvantage of the prior art described above is that the synchronization and timing within the film, as described in the publication, is limited to a search window of, for example, 1 minute. Especially in the initial phase of the film, however, it is difficult to define the right window for a successful synchronization. If the portion read or scanned by the film is not in the portion of the stored movie information used for the synchronization, the synchronization will fail or the synchronization will be erroneous. The cinema audience or movie viewer then hears no or a wrong sound to the film.
  • the object of the present invention is to provide an efficient concept for determining a location in a film.
  • This object is achieved by a device for determining a position in a film according to claim 1, a method for determining a position in a film according to claim 20 and by a computer program according to claim 21.
  • the present invention is based on the finding that each location of a film generally has film information specific to that location, so that in a feature extraction different locations of a film have different, specific characteristics of the features. In other words, different places in a movie have different "fingerprints" on. These fingerprints can in turn be used to find a location in a movie.
  • an apparatus for determining a location in a film having film information applied in a temporal sequence comprising: a memory for storing a reference fingerprint representation (FAD) of the movie information, wherein the fingerprint representation is arranged such that a temporal Characteristics of the fingerprint representation depend on a time course of the film information, wherein a stored reference fingerprint representation is associated with a time scale, means for receiving a portion read from the film, means for extracting a test fingerprint representation from the read portion, and means for comparing the test fingerprint representation the reference fingerprint representation to determine the location in the film based on the comparison and time scale.
  • FAD reference fingerprint representation
  • the device and method for determining a location in a film make it possible to determine anywhere in a film at any time without having to prepare or change the film itself.
  • the relevant time information, the time scale is stored along with a saved version of the movie.
  • the film is stored in the form of a reference fingerprint representation, which corresponds to a feature extraction.
  • Preferred embodiments also have the advantage, with a suitable choice of the fingerprint representation, to enable an unambiguous determination of the position.
  • the device and the method for determining a position in a film can be used, for example, in a device for generating a control signal for a film event system be used that synchronizes movie events with a picture playback.
  • movie events include audio, subtitles, and special effects, with special effects such as air currents, jiggling on the cinema chairs, smells, or light effects on the side and back walls.
  • special effects such as air currents, jiggling on the cinema chairs, smells, or light effects on the side and back walls.
  • Different audio languages, such as simultaneous playback of the original version and translations into other languages, as well as different audio techniques, such as the synchronization of digital surround sound, are possible with regard to the audio event.
  • the invention is not limited to movies for a moviegoer, but generally refers to films or audio-video signals, regardless of whether these are films or other data carriers and storage media, eg Magnetic tapes or hard drives, stored movie information.
  • the invention can also be used for pure sound systems without video or, for example, by means of a video ID also for the synchronization of pure video material, i. without sound, to be used with any events.
  • Fig. 1 is a schematic block diagram of a Favor ⁇ th embodiment of an apparatus for Generating a control signal for a movie event system
  • FIG. 2a shows a basic block diagram of an embodiment of an apparatus for performing a correlation
  • Fig. 2b is a schematic block diagram of a preferred embodiment of a device for performing a correlation
  • Fig. 2c.1 an exemplary portion of a film
  • FIG. 2c.2 shows an exemplary course of a tone signal of the section of the film shown in FIG. 2c.1 at a variable, first playback speed and a constant test sample rate;
  • FIG. 2 c shows an exemplary profile of a sound signal of the section of the film shown in FIG. 2 c 1 at a variable, second playback speed and a constant test sampling rate;
  • FIG. 2c shows an exemplary course of a sound signal of the section of the film shown in FIG. 2c.1 at a variable, third playback speed and a constant test sample rate;
  • Fig. 2d.l two exemplary sections of a film
  • Fig. 2d.2 an exemplary course of a reference sound signal of the film
  • FIG. 2d shows an exemplary course of a test tone signal, based on a first playback speed and a constant test scan rate, for a section of the film
  • FIG. 2d.4 an exemplary first correlation result from the correlation of the reference sound signal according to FIG. 2d.2 and the test sound signal according to FIG. 2d.3;
  • Fig. 2d.5 two exemplary sections of a film according to Fig.2d.l;
  • FIG. 2d.6 shows an exemplary course of a reference sound signal of the film according to FIG. 2d.2;
  • Fig. 2d.7 shows an example of a test tone signal based on a second playback speed and a constant test sample rate for a portion of the film
  • 2d.8 shows an exemplary second correlation result from the correlation of the reference sound signal according to FIG. 2d.6 and the test sound signal according to FIG. 2d.7;
  • 3a is a schematic block diagram of a preferred embodiment of a device for determining a location in a film by means of a fingerprint representation
  • Fig. 3b.1 shows two sections of a film
  • 3b.2 shows an exemplary course of the reference sound signal for the two sections according to FIG. 3b.1;
  • Fig. 4 is a schematic block diagram of a preferred embodiment of a device for detecting a location in a film by means of a coarse and a subsequent fine determination of the location;
  • Fig. 5a is a schematic block diagram of a preferred embodiment of an apparatus for Generating a control signal for a movie event system
  • Fig. 5b.1 two sections of a film
  • 5b.2 shows an exemplary course of a reference sound signal for a first section of the film
  • Fig. 5b.3 shows an exemplary course of a test sound signal for a second portion of the film
  • 6a is a schematic block diagram of an exemplary motion picture display system including an apparatus for generating a control signal for a motion picture event system and a motion picture event system;
  • FIG. 6b is a schematic block diagram of an exemplary motion picture display system including an apparatus for generating a control signal with an exemplary audio movie event system;
  • FIG. 7 shows a schematic illustration of an exemplary assignment of a time scale to a film information
  • Fig. 8 is a schematic representation of an exemplary film with applied film information.
  • the device for generating a control signal comprises a device 120 for storing the film information, means for receiving a portion read from the film 140, means for comparing the read portion with the stored movie information 112, 114, and means 180 for determining the control signal based on the comparison and the time scale.
  • the stored film information 112, 114 includes, for example, the audio or audio signals, the images or
  • the stored audio and / or video signals are present, for example, in digitized form, preferably in compressed form, in order to reduce the memory requirement.
  • One advantage of digitized storage lies in the simple and, above all, error-free duplication of the stored image of the film information.
  • the film remains unchanged as previously described, producing only a stored image of the movie information once, e.g. in the production of the film.
  • the audio signal received on audio track 114 is received by device 140 for reception and conditioned for comparison by device 160, for example, sampled at a given sample rate and passed as a portion of a given length or number of samples.
  • the means 160 is adapted to compare this portion read from the film with the stored film information
  • the means 160 for comparing may be arranged to compare the read portion with the entire stored film information, but preferably the read portion with a portion of the stored ones Film information compares to minimize the computational effort.
  • the comparison can be done, for example, by cross-correlation, but also by calculating the difference, e.g. by calculating a compressed hash sum and searching this in a database.
  • the comparison may consist of the audio signal alone, the video signal alone, a comparison of the audio signal and the video signal and a combination with an evaluation of the aforementioned features.
  • the means 180 determines the control signal 190.
  • a film event system is controlled which, based on the control signal 190, is synchronous with the playing film 110, for example WFS. Sounds or subtitles generated.
  • Time synchronous means that, based on the control signal 190, the movie event system is one of the movies currently being played. played place, which is assigned a time on the time scale in the stored movie information, a time corresponding to the time scale corresponding, simultaneous event is generated.
  • any film player may be used, any film formats, e.g. Silent films (eg, with video-based synchronization), analog or digital soundtrack, one or more parallel soundtracks, or any other storage media, such as cassettes or hard disks whose format is not changed, as an alternative to a movie can or should, for example, to continue to be compatible with the movie player, but at the same time other movie events should be synchronized.
  • any film formats e.g. Silent films (eg, with video-based synchronization), analog or digital soundtrack, one or more parallel soundtracks, or any other storage media, such as an alternative to a movie can or should, for example, to continue to be compatible with the movie player, but at the same time other movie events should be synchronized.
  • the audio signal is used as movie information for synchronization.
  • the portion read from the film is scanned at a given sampling rate, hereinafter referred to as the test sampling rate, to produce a test tone signal and the stored movie information is stored in digital form, the stored film information being hereinafter referred to as the reference signal , and the test tone signal and reference tone signal are compared in the cross-correlation comparing means 160.
  • the test signal sample rate and the reference signal sample rate are fixed, that is, constant.
  • the means 160 for comparison may then be designed, for example, to generate a first correlation result at a first time on the basis of a first test tone signal and a first reference tone signal to determine a first time scale of the time scale, and at a second time a second test tone signal a second reference sound signal a second To generate the correlation result to determine a second time of the time scale, for example, to determine therefrom a time difference or playback speed or to determine a speed difference compared to a desired or reference playback speed.
  • the means 180 for determining the control signal determines the control signal, for example, to synchronize the movie event system.
  • a disadvantage of a constant sampling rate is that at a changing test playback speed, the correlation result deteriorates, and thus the accuracy of the determination of the time or the point in the film is inaccurate and thus the synchronization is worse.
  • This disadvantage can be compensated by varying the sampling rates, ie the test sampling rate and / or the reference sampling rate.
  • FIG. 2a shows a schematic block diagram of a device for carrying out a correlation between a test sound signal that can be played at a variable playback speed and a reference sound signal that is a digitally stored version of the test sound signal
  • the device for carrying out a correlation is a device 210 for determining a measure of a test playing speed, means 230 for varying a test sampling rate or reference sampling rate, and means 250 for comparing.
  • Means 230 is configured to vary a test sampling rate at which the test sound signal 270 is sampled to produce a modified test signal 272 or to vary a reference sampling rate to produce a modified reference sound signal 276 based on a reference sound signal 274.
  • the means 230 for varying is further configured to vary the test sampling rate or reference sampling rate such that a deviation between a test playback speed associated with the test sound signal or a reference playback speed corresponding to the modulated sound rate. or a deviation between a test playback speed associated with the modified test sound signal 272 and a reference playback speed associated with the reference sound signal 274, or a deviation between a test playback speed associated with the modified test sound signal 272 and a reference playback speed associated with a modified reference sound signal 276 is reduced, the term playback speed or the problem of a variable playback speed being explained in more detail below.
  • Test tone signal 270 and the modified reference tone signal 276, or the modified test tone signal 272 and the modified reference tone signal 276 is designed to determine a result 278 of the correlation.
  • the embodiment of the apparatus for performing a correlation shown in FIG. 2a may be used as means 160 for comparison.
  • Fig. 2b shows a schematic block diagram of a preferred embodiment of a device for performing a correlation between a test sound signal and a reference sound signal.
  • FIG. 2b shows means 280 for storing a reference sound signal 274 which is a digital version of the test sound signal 270, the reference sound signal 274 having been generated once based on a given memory reference playback speed and a memory reference sampling rate.
  • the test tone signal is played back at a variable test playback speed and sampled at a test sample rate to produce the test tone signal 270.
  • the test-play-speed measurement means 210 of the test sound signal 270 controls the means 230 for varying on the basis of the test-playback-speed measurement.
  • the means 230 for varying in turn controls a reference rate converter 232 and a variable sampler 234, wherein the sample rate converter 232 is configured to convert from the reference audio signal based on the memory reference playback speed and a memory reference sampling rate into a modified reference sound signal 276 which corresponds to a reference sound signal based on a different memory reference playback speed and / or memory reference sampling rate, and wherein the variable sampler 234 is adapted to sample the test sound signal at a varied sample rate different from the standard or basic sample rate to generate modified test tone signal 272.
  • the device for performing a correlation can also be designed in such a way that the test sound signal 270 is always supplied via the variable scanner 234 to the device 250 for comparison, wherein the variable sampler 234 is then designed such that one of the variables Test sampling rate of the standard or basic sampling rate, and further be formed that the reference sound signal 274 is always supplied via the Referenzabastratenkonverter 232 of the means 250 for comparison, wherein the Referenzabtastratenkonverter 232 is designed such that it is driven by the device 230 passes the reference tone signal 274 unmodified to the means 250 for comparison.
  • the illustration selected in FIG. 2b of the separate supply of the test tone signal 270 relative to the modified test tone signal 272 and the reference tone signal relative to the modified reference tone signal 276 to the means 250 for comparison serves to be able to represent the alternative design possibilities or realization possibilities.
  • the means 250 for comparing is adapted to compare the modified test sound signal 272 with the unmodified reference sound signal 274, no reference sampling rate converter 232 is necessary or the apparatus for performing a correlation according to FIG 2b does not include a reference sample rate converter 232.
  • a comparing means 250 configured to compare the unmodified test sound signal 270 with the modified reference sound signal 246 does not include a variable sampler 234.
  • the means 280 for storing is a means for storing a movie information, wherein the stored movie information is associated with a time scale, and the test sound signal 270 is, for example, a movie sound signal.
  • Performing a correlation according to FIG. 2b can then be used, for example, as a means for comparing 160 according to FIG.
  • Fig. 2c.1 shows a portion of an exemplary film 110 having a soundtrack 114 as previously described in Fig. 1.
  • two locations of the film 110 are shown, a first location, hereinafter referred to as location Li, and a second location, hereinafter referred to as location L 2 .
  • Fig. 2c.2 shows an exemplary course of the test sound signal, which is assigned to the section between the point Li and L 2 described in Fig.
  • time Ti time at which the point Li of the film is played
  • time T 2 time at which point L 2 of the movie is played
  • T 2 - Ti (L 2 - L 1 ) / v.
  • the film segment between Li and L 2 or Ti and T 2 is subdivided into n time segments or represented by n + 1 sample values, for example:
  • the number of sampling periods or samples for a given film section ⁇ L is proportional to the sampling rate f, or antiproportional to the sampling period ⁇ t and antiproportion to the playback speed v.
  • the quotient "f / v" or the product " ⁇ t • v ⁇ must be constant if n or the number of samples n + 1 is to be constant.”
  • the first sample equal, then the individual samples are the same under the condition mentioned above.
  • Figs. 2c.2 to 2c.4 show exemplary scans or storages of the film portion between the location Li and the location L 2 for a constant sampling rate f and a variable sampling rate ⁇ t and a variable playback speed, respectively.
  • 2.c2 an exemplary sampling or storage for a first playback speed Vi
  • Fig. 2c.3 sampling or storage of the same film portion at a second playback speed v 2
  • Fig. 2c.4 a sample of the same film portion for a third scan speed V 3 shows.
  • an increase in the playback speed v corresponds to a temporal compression of the audio signal, ie a doubling of the playback speed vi from FIG. 2c.2 results, as in FIG. 2c.3 shown to halve T 2 -Ti and n, and to reduce the Game speed v at a temporal extension of the audio signal, ie halving the playback speed vi of Fig. 2c.2 leads as shown in Fig. 2c.4 to a doubling of T 2 ⁇ Ti and n.
  • FIGS. 2d.l and 2d.2 essentially correspond to FIGS. 2c.1 and 2c.2.
  • FIG. 2d shows two additional locations which define a search section or a search window with respect to the film and the film information applied thereon, wherein a first location of the search window is denoted by L 0 , and one second location of the search window is denoted by L 3 , wherein the portion between the location Lo and the location L 3 is greater than the portion which is defined by the locations Li and L 2 , or ⁇ L fen s te r > ⁇ L with
  • T 0 defines, for example, the time on the time scale, which is assigned to the point Lo
  • the time Ti defines the time on the time scale that defines the point Li
  • the time T 2 defines the time on the time scale
  • the point L 2 defines the time on the time scale associated with the point L 3 on the film.
  • Fig. 2d.3 corresponds to Fig. 2c.2.
  • FIG. 2d.3 represents a currently read film information or test tone signal 270 applied to the film
  • FIG. 2d.2 represents a stored film information or a reference sound signal
  • the memory playback speed and the memory scan rate at which the reference sound signal was generated coincided with the playback speed of the test sound signal and the sampling rate of the test sound signal, and the quotient of memory sampling rate f memory and memory playback speed as previously shown v Spe i ch it with the quotient of the sampling rate f for the test tone signal and the playback speed of the test tone signal v match.
  • the reference sound signal or a portion of the reference sound signal defined by Ti and T 2 , may exactly match the test sound signal representing the portion between Ti and T 2 , more specifically the sample value sequences thereof, and a clear local one by correlation Maximum or a correlation peak are obtained, as shown by way of example in Fig. 2d.4.
  • the position of the peak in turn indicates the time shift of the test sound signal relative to the reference sound signal or the search window. Based on this, the current time with respect to the stored time scale can then be determined.
  • FIGS. 2d.5 to 2d.8, in contrast to FIGS. 2d.l to 2d.4, show an example in which the playback speed of the test sound signal shown in FIG. 2d.7 is compared with the playback speed of the test sound signal, as shown in FIG Fig. 2d.2 is shown is reduced.
  • Fig. 2d.5 corresponds to Fig. 2d.l.
  • Fig. 2d.6 corresponds to Fig. 2d.2, that is, Fig. 2d.6 represents an exemplary represents a progression of a reference sound signal, which is based on a memory sampling rate f Sp ei c forth and a memory playback speed v S peich e r.
  • Fig. 2d.7 shows an exemplary course or exemplary sampling of the test sound signal, based on a comparison with 2d.3 or
  • Fig. 2d.6 unchanged test sample rate f, however, a changed, reduced playback speed v 'of the test sound signal.
  • this means that in the same time segment ⁇ T at a reduced speed v 'only a smaller portion or a portion of lesser length ⁇ l / is played back from the film according to ⁇ l / v' • ⁇ T - gen on the currently playing film after the period .DELTA.T only one point L ' 2 , which lies in front of the point L 2 is reached, as shown in Fig. 2d.5. Relative to the reference sound signal and the time scale associated therewith, the point L '2 is assigned the time T' 2 of the time scale, as shown in FIG. 2d.7.
  • the playback speed of the test tone signal will not only vary between different movie players, but may vary during a movie. Accurate tracking is essential to ensure synchrony throughout an entire movie.
  • the means for performing a correlation varies the sampling rate of the test sound signal or the sampling rate of the reference sound signal to detect the adverse effect of a variable sampling rate of the test sound signal as described above according to the above-described condition that the quotient of sampling rate and playback speed of the Test sound signal and the reference sound signal must be equal to minimize, to represent the same film section with the same samples.
  • the change in playback speed is effected by sample rate conversion, where the stored reference sound signal 274 is appropriately interpolated, for example, to obtain a reference rate. to generate the renztonsignal at the sample rate corresponding to the changed playback speed.
  • FIG 2d.l -. 2d.8 illustrate simplified examples in which the clarity sake was assumed that the memory playback speed v Spe Icher a normal or usual playback speed of a playback device corresponding to generate a test tone signal.
  • the quotient of sample rate f and playback speed v is the magnitude that must be the same for the reference sound signal and the test sound signal to represent the same portion of the film with the same samples as previously indicated.
  • a double playback speed can also be used if the sampling rate is doubled at the same time.
  • the means 210 for determining may determine a measure of a test playing speed based on the result 278 of the correlation.
  • One possibility is to use a single correlation result for the determination of a measure of the playback speed, for example, by comparing an amplitude of a peak with a predetermined threshold to determine whether a deviation between a playback speed of a test sound signal and a reference sound signal in a given Area is located.
  • At least two different reference sound signals are compared to the test sound signal to compare the results of the correlation, for example by means of a quality assessment, which will be explained in more detail with reference to FIG from these a most similar reference sound signal and thus based on the known sampling rate and the known memory playback speed to determine a measure of the playback speed of the test sound signal.
  • the different reference sound signals can be formed one after the other and compared with the test sound signal or simultaneously formed and compared.
  • Apparatus for performing a correlation produces three reference tone signals based on different reference sample rates, the reference tone signal of the middle of the three sample rates being based on the reference sample rate of the reference tone signal having the best quality or maximum match with the test tone signal in a previous comparison, and the two other reference sound signals each have a reference sampling rate higher or lower than the reference sampling rate of the mean reference sound signal and reference sampling rate, respectively.
  • This is controlled by the means 230 for varying on the basis of an output of the means 210 for determining the measure of the test playing speed. This ensures that the reference sampling rate or the reference playback speed of the reference sound signal is matched to the playback speed or reference sampling rate of the test tone signal.
  • Fig. 3a shows an exemplary film as shown in Fig. 8 and a principal block diagram of a device for detecting a location in the film.
  • the embodiment of the device for detecting a position in a film shown in FIG. 3a can be used, for example, in a device for generating a control signal for a film event system, as shown for example in FIG. 1, as device 180 for determining the control signal.
  • the device for determining a position in a film has a memory 320 for storing a reference fingerprint representation of the film information, wherein the fingerprint representation is designed so that a time course of the fingerprint representation depends on a temporal course of the film information, and wherein a stored reference fingerprint representation is a Time scale, having means 340 for receiving a portion read from the film, means 350 for extracting a test fingerprint representation from the read portion, and means 34 for comparing the test fingerprint representation with the reference fingerprint representation, on the basis of the comparison and the time scale to determine the location in the movie.
  • the fingerprint representation comprises a representation in the form of a spectral flatness, wherein a time profile of the fingerprint representation comprises a temporal profile of the spectral flatness.
  • Fig. 3b.1 shows an exemplary film 110 as shown in Fig. 8.
  • a position of the film when playing the film at a given playback speed corresponds to the time Tioo of the time scale, the point L 103 to the time T 103 of the time scale, the point L 113 , the time Tn 3 of the time scale and the Place L1 1 6 the time Tue the time scale.
  • a fingerprint is determined for particular spatial and temporal portions of the film.
  • FIG. 3b.2 shows a first section comprising the section from the point L ⁇ O o to Ln 3 and Ti 00 to Ti 13 , respectively, and a second section comprising the section of FIG the point L ⁇ O 3 up to the point Lu 3 or from the time T ⁇ o3 to the time Tn 6 includes. Based on these sections, a fingerprint associated with this section is created based on, for example, spectral analysis, Fourier transformation, or other feature extraction methods.
  • the fingerprint comprises the spectral flatness ⁇ x 2 , which is calculated from the course of the power density spectrum, so that the value of the spectral flatness is determined for each section, and depending on the time course of the film information, for example Sound signal, a sequence of spectral flatness, which are stored in the memory 320 with the associated time scale.
  • Sampling rate, length or duration of the section, or the distance between two consecutive sections are determined according to the requirements for, for example, uniqueness or accuracy of determining the location in the film.
  • Sections the higher the memory requirement for the reference signal or the request for the processing power in the signal processing.
  • a significant advantage of the fingerprint representation in the form of the spectral flatness is its small memory requirement compared to, for example, a complete storage of the power density spectrum for a same section.
  • a trace of spectral flatness is used as a fingerprint for a portion.
  • Figure 4a shows an exemplary film 110, as shown in Figure 8, and a device for detecting a location in a film having film information applied in a temporal sequence.
  • the embodiment of the device for detecting a position in a film shown in FIG. 4a can be used, for example, in a device for generating a control signal for a film event system, as shown for example in FIG. 1, as device 180 for determining the control signal.
  • the means for determining a location includes a memory 420 for storing film information deposited on a film in sequence, with a time scale associated with the stored movie information, means 440 for receiving a portion read from the film, and synchronization means 460 configured to compare a sequence of samples of the read portion underlying a first sampling rate and a first search window of the stored film information to obtain a coarse result, and a sequence of samples of the read portion; which is based on a second sampling rate and a second search window of the stored film information to obtain a fine result indicative of the location of the film, wherein a position of the second search window in the stored film information depends on the coarse result, and wherein the first Search window time l I is longer than the second search window, and further wherein the first sample rate is lower than the second sample rate.
  • FIG. 5a shows an exemplary film 110, as shown in FIG. 8, as well as a preferred embodiment of a device for generating a control signal for a movie event system that is formed based on an analog soundtrack applied to the film the film read portion of the audio signal or test tone signal and a stored digital version of the test sound signal, hereinafter referred to as reference sound signal, which is associated with a time scale to determine the control signal by comparing the test sound signal and the reference sound signal by means of the time scale.
  • reference sound signal a stored digital version of the test sound signal
  • An input of the first means 562 for correlation, an input of a second means 564 for correlation, and an input of the third means 566 for correlation are coupled to an output of a sample rate converter 232, referred to as a sample rate converter (SRC). connected.
  • SRC sample rate converter
  • An output of the first means 562 for correlation, an output of the second means 564 for correlation and an output of the third means 566 for correlation are connected to an input of a first means 568 for quality assessment.
  • the quality assessment device 568 in turn is coupled to the sample rate converter 232 and to a sampler selection means 570, an output of the sampler selection means 570 being connected to an input of a timer 582.
  • the timer 582 in turn is stored with the An audio track device 522 is connected to an input of the sample rate converter 232 for storing the audio track.
  • An output of the first feature extractor 552 is connected to an input of a feature comparison device 554 having, for example, a feature classifier and a database of features, an output of the feature comparison device 554 having an input of the timer 582 is connected.
  • a feature comparison device 554 having, for example, a feature classifier and a database of features
  • An output of the timer 582 is coupled to an input of a time code generation means 584 having a time code database or coupled to a time code database, and an output of the time code generation means 584 is connected to an input of a time code slicer 586, the means 586 is adapted to output a time code 592, and wherein an output of the time code smoothing means 586 is connected to an input of a word clock generator 588, which in turn is adapted to output a word clock signal 594.
  • the apparatus for generating a control signal for a film event system optionally further comprises a second film sound sampler 542 'connected to a second A / D converter 544', the second A / D converter 544 'having a second feature extractor 552', with a fourth means 562 'for correlation with a fourth reference sound signal based on the first sampling rate, with a fifth means 564' for correlation with a fifth reference sound signal based on the second sampling rate, and with a sixth means 566 'for a correlation with a sixth reference sound signal connected at the third sampling rate.
  • An output of the fourth means 562 'for correlation, an output of the fifth means 564' for a correlation and an output of the sixth means 566 'for a correlation are connected to an input of a second means 568' for quality evaluation, wherein an output of the second Further, means 568 'for quality evaluation is connected to an offset compensation 569 and another output is connected to an input of the sample rate converter 232, and further wherein the means for offset compensation 569 is connected to the sample selection 570.
  • the first film tone sampler 542 also referred to as the main sampler, is positioned so that there is enough time for the device to generate a control signal to lock up.
  • the first film tone sampler 542 thus provides a pre-delayed signal.
  • the correlation window width or width of the portion of the test tone signal is added to the synchronization time. Based on the perforations on the film roll, the time difference for the pre-delay can be set exactly. As a first clue, three seconds is recommended.
  • the first film sound sampler 542 reads the sound signal from the soundtrack of the film and samples the sound signal from the soundtrack of the film, and passes this signal on to the first A / D converter 544, the first A / D converter 544 being extended. is formed to generate a digital audio signal or test tone signal based on the sampling rate of the first film sound sampler 542 and the playback speed of the film from which the soundtrack or movie information is read.
  • test fingerprint representation On the basis of the test sound signal 270, one or a plurality of features is extracted or a test fingerprint representation is formed. For example, the spectral flatness is used as a characteristic or fingerprint for the feature extraction or fingerprint representation.
  • the test fingerprint representation is then compared by the feature comparison device 554 with a reference fingerprint representation, as previously noted, wherein the fingerprint representation is such that a time history of the fingerprint representation depends on a temporal history of the movie information, and where a A reference fingerprint representation stored in feature 554 is associated with a time scale, and means 554 for comparing is adapted to determine a location in the film based on the comparison of the test fingerprint representation with the reference fingerprint representation and the time scale respectively a time code signal 554Z produce.
  • the sample rate converter based on the stored reference tone signal 274, generates the same signal at slightly different sample rates, i. modified reference tone signals for the correlations to be calculated in parallel.
  • modified reference tone signals for the correlations to be calculated in parallel.
  • the sampling rate converter 232 generates three reference sound signals 276 or modified reference sound signals. Signals 276, wherein a first reference sound signal based on a first sampling rate and the first means 562 for correlation is supplied, wherein a second reference sound signal 276 based on a second sampling rate and the second means 564 for correlation is supplied, and a third reference sound signal 276 on based on a third sampling rate and supplied to a third means 566 for correlation. Sample rate converter 232 provides low-level, sample rate-different signals to the correlation
  • Means 562, 564, 566 for correlation wherein the sampling rate is always set in response to the previous measured maximum peak-to-noise value from the correlation.
  • a correlation gets a modified reference tone signal with this sampling rate
  • another correlation gets a slightly lower, one level lower, and another correlation gets a slightly higher graduated sampling rate. This ensures that the sample rate converter can, for example, tune or synchronize to a change in the speed of the analog audio signal.
  • the means 522 for storing the soundtrack and the sampling rate converter 232 are preferably designed to use a window width of 2 n, in order to calculate low-cost large correlation windows by means of the fast Fourier transformation (FFT). In parallel, more than three correlations can be calculated to compensate for sudden jumps in the soundtrack.
  • the correlation window is chosen to be large in order to obtain a clear correlation peak. In order to obtain the recognition accuracy of the correlation peak under a sample or a sampling period, oversampling of the input signal or test tone signal can be performed.
  • the means 522 for storing the sound track are in response to the supplied time code signal 582Z of the time bers 582 the reference sound signal in the length of the correlation window, wherein the correlation window is the search window in which the test sound signal is searched.
  • the first means 568 for quality assessment is designed to perform a maximum value search in the cross-correlated signals or the amounts of the signals and to weight the quality of the cross-correlated, depending on the height of the correlation peak compared to other peaks in the cross-correlated or to determine the quality of each individual correlation on the basis of the peak-to-noise distance.
  • the best quality reference tone is determined and the displacement of the peak from the search window is determined based on the position of the peak of the best quality reference tone, for example as a time code difference between the measured and currently valid time code or relative time code issued.
  • the first quality assessment device 568 sends a control signal 568A to the sampling rate converter 232, which for example distinguishes only the three signal values "0", “+1” and "-1", for example "0".
  • the sampling rates of the last sample rate conversion or correlation are maintained, since the correlation result from the modified reference tone signal with the average sampling rate has been determined to be the highest quality, at "+1” the sampling rates are increased by one more level than the last sample rate conversion or correlation because the correlation result from the modified reference tone signal having the highest sampling rate was determined to be the highest quality, and at -1 the sample rates are reduced from the previous sample rate conversion by one step, since the correlation is from the test tone signal and the modified reference sound signal with the lowest reference sample rate had the best correlation result or peak-to-noise ratio.
  • the sample rate converter will be e.g. is increased or decreased by one sample rate delta value, or so driven that it does not sample rate conversion.
  • the correlation serves to address two important aspects. First, determining the location in the film or determining the point in time in the film on the basis of the time code difference from the correlation. Second, determining the measure of the playback speed to determine the optimum reference sample rate or sample rate conversion of the reference sample rate, respectively.
  • the adaptation of the sampling rates or the recapture of adapted playback speeds in turn enables better correlation results and thus in turn improves the timing or determination of the location in the film and thus in turn improves the synchronization and the prediction.
  • a preferred exemplary embodiment according to FIG. 5 is designed, by means of a signal analysis, to detect signal parts with specific characteristics in order to then hide them during synchronization and thus to prevent false detections or synchronizations or to avoid random fluctuations of the time axis.
  • Such characteristics may be, for example, the loudness of the signal part or the "problem" of a signal and the signal analysis or detection of problematic parts on the basis of SNR (signal-to-noise ratio), PNR (peak-to-noise), spectral power or power density spectrum, spectral flatness or averaging a time ⁇ union based sequence.
  • SNR signal-to-noise ratio
  • PNR peak-to-noise
  • spectral power or power density spectrum spectral flatness or averaging a time ⁇ union based sequence.
  • the quality of correlations with quiet signal parts is lower than with correlations with loud signals because of the higher quantization noise in the digital sampling, therefore quiet signal parts are suppressed by means of threshold values or adaptively, to avoid random fluctuations of the time axis.
  • the signal energy can be another quality feature.
  • Another example is the hiding of problematic, because recurrent signal parts in order to avoid ambiguity and thus, for example, incorrect synchronization.
  • Problematic signal parts or sections can also be signaled as metadata, for example, in order to hide these signal parts, regardless of the quality of the current correlation.
  • the time code generation means 584 is designed to convert based on the time code signal 582Z of the timer 582, which may for example be based on an internal or proprietary time code, into a standardized time code or a time code signal based on a standardized time code, for example.
  • the timer 582 is controlled by an internal clock
  • a coarse audio ID fingerprint or fingerprint representation for example, the time code signal 554Z from the feature determination tion or fingerprint representation
  • the determined correlation difference for example, the time-code difference signal 570Z determined from the correlation of the device 570 for picker selection.
  • the timer must prioritize correlation signal (highest priority), time code from feature determination, and internal clock (lowest priority).
  • the time code smoothing means 586 is arranged to smooth the time code signal 584Z so as to avoid, for example, a hopping time code or, if there are time codes from the correlation, to find meaningful intermediate values, e.g. Compensate for pauses in the analog tone.
  • the time code signal 592 generated by the time code slicer 586 is preferably a standard time code with which the movie event system is synchronized. However, the time code signal 592 can also be used to generate a corresponding sample clock or sample clock via a very slowly regulating phase-locked loop (PLL) if the enclosed audio reproduction system is of a digital type. Such phase locked loops are available as finished devices and are not the subject of this patent.
  • PLL phase-locked loop
  • more than one telecine with time varying offset from the projection lens may be used to improve the robustness of film damage or portions that are poorly tuned for synchronization.
  • a second film tone sampler 542 ' may then be used, for example, since the second film tone sampler 542' is already present in conventional cinema systems. Breaks in the analogue tone can hereby be bridged by the film tone samplers 542, 542 'attached at different locations on the motion picture film, since the probability increases with short pauses in the film tone, the at least one scanner, the first film sound scanner 542 or the second film sound scanner 542', provides enough signal for a correlation and the associated synchronization.
  • different scanners e.g. for analogue sound, Dolby Digital sound (including decoder), DTS digital sound (including DTS decoder) or another sound and a combination of the above may be used as the reference soundtrack and / or test soundtrack.
  • Dolby Digital sound including decoder
  • DTS digital sound including DTS decoder
  • another sound and a combination of the above may be used as the reference soundtrack and / or test soundtrack.
  • individual tracks can be used for comparison using averaging, majority decision or prioritization, automatically or via metadata, the time information generated therefrom, as well as a downmix to mono.
  • different scanners may be used for different audio formats and / or different film scanners with different timing offsets.
  • Using a downmix on mono has the advantage that when the monaural track is used as a stored audio track, it saves less than storing five channels, for example.
  • the storage of different, that is, more than one soundtrack, ie no downmix means that all channels are stored independently of each other and then, for example, as explained above, corresponding comparisons or majority decisions are performed, then the synchronization using a particular channel, the actual soundtrack and a corresponding channel of the stored soundtrack.
  • the initialization phase or the first synchronization and the resynchronization after a recording pause form two critical phases during a film projection or a synchronization of a film event system.
  • Preferred embodiments therefore initially calculate more than three parallel correlations, since no synchronization has yet occurred, that is, more than three reference tone signals of different sampling rates are compared with the test tone signal in order to obtain the correct sampling rate or playback speed of the test tone signal as quickly as possible determine. It is also possible to try different sampling rates in succession until one of the correlations has the best signal-to-noise ratio.
  • the first feature extractor 552 and the feature classifier 554 provide a coarse absolute in conjunction with the database
  • a preferred embodiment is therefore designed, in a first step, to determine a rough determination of a location in a film by displaying a longer section of the film by means of a reference sampling signal with a lower sampling rate, and also a test tone signal by sampling. obtained at a lower sampling rate. Based on the coarse location in the film, in a second step, a higher sample rate reference tone signal and a higher sample rate test tone signal are used to finely determine the location in the film.
  • the window length is adjusted when correlated.
  • time-long windows but a reduced sampling rate of the signals are used, if a time should be approximately found and only tracked, short windows may even be used with oversampling of the signals to achieve a higher temporal accuracy.
  • a "compatible reproduction” of the "old" audio format can take place until the exact position is determined.
  • a "compatible" playback of the "old” audio format can be done if the synchronization has been lost significantly until the exact position is determined again.
  • the scanner selection means 570 and the offset compensation means 569 are necessary only in embodiments with more than one film sound scanner.
  • the scanner selection means 570 decides whether the result or time code difference of the first quality judging means 568 (568Z) or the result or time code difference 568Z 'of the second quality judging means 568' is sent to the job setting determiner 582 in the movie or a time code 582Z. Since the second film tone sampler 542 'scans the test tone signal at another location on the film, the offset between the location where the first film tone sampler 542 scans the film to where the second film tone sampler 542' scans the film by means 569 for offset compensation. so that the timer 582 obtains the correct time code difference 570Z regardless of whether the time code difference 568Z or the time code difference 568Z 'is selected with respect to the most recently stored or last stored location of the movie stored in the timer.
  • the different reference sound signals of different reference sampling rates can also be generated one after the other and compared with the test sound signal in order to determine the measure of the playback speed of the test sound signal or the optimum reference sampling rate.
  • more than three modified reference sound signals may be compared to the test sound signal, in parallel or serially, to allow not only early synchronization fast sync but also during movie screening, the film event system for large cracks in the film, e.g. caused by cuts or in the film missing sections, faster to resynchronize to the current location in the film.
  • a synchronization of a film event system can also take place on the basis of the images applied to the film, both for an evaluation of features or fingerprints and for a correlation of a test image signal with one or a plurality of references - picture signals.
  • the correlation of audio and / or video signals for determining the temporal location in an audio and / or video stream can be used, and a synchronous playback can be controlled on the basis of this timing determination.
  • an audio and / or video signature from the raw material in the form of an audio ID / Video ID Identification
  • ID Identification
  • the basic idea of the invention is, for example, to digitally store the already existing analog tone, in order to then synchronize it with the analog audio track on the motion picture film by means of correlation and other feature determination.
  • the output signal or control signal of the device for generating a control signal or of the synchronizing device can be any time code format.
  • a data set for the device for generating a control signal or for the synchronization device must be created during production.
  • the data carrier includes the digitized analog audio track, e.g. in dolby stereo format as found on the roll of film, feature data about the soundtrack and matching timecodes.
  • FIG. 5b.1 shows an exemplary film 110 with a sound track 114, as already described in FIG. 8.
  • a reference sound signal 274 is read from the device 522 for storing a sound track and a modified reference sound signal according to FIG. 5b.2 is generated by the device for sample rate conversion 232, which contains a film section from the point L 0 up to the point L 3 or the point of time To assigned to the point L 0 or a corresponding representing the time code T and the time L 3 associated with the point L 3 or time code.
  • FIG. 5b.4 shows the result of the correlation of the modified reference sound signal according to FIG. 5b.2 and the section of the test sound signal FIG. 5b.3.
  • Time code difference or the relative time code is formed.
  • the timer 582 knows the last absolute time or absolute time code and only requires the time code difference 570Z to obtain the updated absolute time or time code to determine.
  • the difference can be represented, for example, from the position of the peak with respect to the time of the beginning of the search window.
  • the peak is, for example, the fourth sample, ie the test signal from FIG. 5b.3 is shifted by "3 • ⁇ t" relative to the reference sound signal from FIG. 5b.2, where ⁇ t is the Ab ⁇ corresponding to the modified sampling rate is the tasting period.
  • the advantage of the adapted to the variable playback speed of the test sound signal sampling rate or playback speed of the reference tone signal advantageous to wear, since the .DELTA.t is adapted to the playback speed, a more accurate determination of the location in the film or displacement relative to the search window is possible than at a fixed sampling rate of the reference sound signal, since then only multiples of this sampling rate are generated for a determination of the location in the film.
  • the time To of the search window or reference sound signal can be equal to the Ti of the previous correlation, since the film is played only forward.
  • FIG. 6a shows an embodiment of a film system in which a device 100 for generating a control signal 190 is coupled to a movie event system 600, thereby generating the device 100 for generating a control signal based on the film 110, as shown in FIG that the control signal 190, for example a time code, is synchronized with the movie event system 600.
  • FIG. 6b shows a film system comprising a device 100 for generating a control signal 100 and a wave field synthesis system 610 as an exemplary film event system, the exemplary embodiment of the wave field synthesis system 610 comprising a device 620 for controlling the wave field synthesis system, a digital memory 622 for the wave field synthesis audio signals and a plurality of loud speakers 624 for the wave field synthesis system.
  • the control signal generating device 100 Based on the film 110 or, for example, an analog movie soundtrack 114, the control signal generating device 100 generates the control signal 190 to lip-sync a wave analog audio audio experience to an originally analog-converted movie.
  • other audio systems for example digital audio systems or digital surround audio systems, can of course also be synchronized lip-synchronously by means of the device 100 for generating a control signal.
  • FIG. 7 shows an exemplary film as shown in FIG. 8, an exemplary digitally stored reference sound signal 720, and an assignment of a time scale.
  • the analog audio signal is sampled at a given playback speed and rate, for example, 44.1 kHz, and audio portions of, for example, 10 ms are stored as a so-called audio frame, that is, the digital reference sound signal is present on the memory as a result of audio frames.
  • the assigned time of a time scale can then be, for example, to number the audio frames from 0 or 1 in ascending order as time code or time scale, time code TCl corresponds to audio frame AFI in FIG. 7, or, for example, the start time or end time of one To find audio frames as time code, such as for the first audio frame either 0 ms or 10 ms if an audio frame has a duration of 10 ms.
  • Time codes usually have formats such as hour: minute: second: frame, whereby the frame usually refers to video frames with, for example, 24 frames per second (cinema film).
  • a time scale or time code can therefore, for example, assign a plurality of audio frames to a video frame or define an audio frame as the smallest time scale unit. Accordingly, the time code or the time scale can then for example assign 4 audio frames to a time code, see TCl 'in FIG. 7, which comprises four audio frames AFI -AF4, or assign a single Audi frame to a time code, see TCl in Fig. 7, which is associated with an audio frame AFI.
  • the audio Frames also represent temporally overlapping sections of the audio signal.
  • the control signal 190 may be formed, for example, as a time code, but also as a sequence of pulses, where, for example, each pulse corresponds to a time scale unit and, similar to a relative time code, the film event system accumulates the pulses to synchronize with the film.
  • a further exemplary embodiment in order, furthermore, to have available, for example, an analog audio signal as a fallback, but at the same time also to realize a time code for synchronous additional services, offers the approach of embedding a watermark in the audio and / or video signal.
  • Advantage of this solution is that even with "difficult" audio signals, such as very quiet passages or even similar "monotonous" noises, a clean clock recovery is possible.
  • the complete set of the relevant Watermark claims in particular in the field of searching for the correct clock rate or the readjustment of the sampling rate, makes sense.
  • the decisive disadvantage of this approach is that the actual film has to be changed or a new version or copy of the film has to be created in order to be able to embed the watermarks in the audio and / or video signal.
  • the method according to the invention can be implemented in hardware or in software.
  • the implementation may be on a digital storage medium, in particular a floppy disk or CD with electronically readable control signals, which may interact with a programmable computer system such that the method is performed.
  • the inventions thus fertil in a computer program product with a program stored on a machine-readable carrier, the program code for performing the inventive procedural ⁇ Rens, when the computer program product on a computer expires.
  • the invention can thus be realized as a computer program with a program code for carrying out the method when the computer program runs on a computer.

Abstract

Disclosed is a device for determining a point in a film (110) comprising film data (112, 114) applied in chronological order. Said device encompasses a memory (320) for storing a reference fingerprint representation of the film data (112, 114). The fingerprint representation is configured such that a history of the fingerprint representation depends on a history of the film data while a time scale is assigned to a stored reference fingerprint representation. The inventive device further encompasses an apparatus (340) for receiving a section read by the film (110), an apparatus (350) for extracting a test fingerprint representation from the read section, and an apparatus (360) for comparing the test fingerprint representation to the reference fingerprint representation in order to determine the point in the film (110) based on the comparison and the time scale.

Description

Vorrichtung und Verfahren zum Ermitteln einer Stelle in einem Film, der in einer zeitlichen Folge aufgebrachte Filminformationen aufweistApparatus and method for determining a location in a film having film information applied in a temporal sequence
Beschreibungdescription
Die vorliegende Erfindung bezieht sich auf eine Vorrichtung und ein Verfahren zum Ermitteln einer Stelle in einem Film, der in einer zeitlichen Folge aufgebrachte Filminformationen aufweist, um beispielsweise Filmereignisse mit einer Bildwiedergabe zu synchronisieren.The present invention relates to an apparatus and a method for determining a location in a film having film information applied in a temporal sequence to synchronize, for example, film events with image reproduction.
Audio-Video-Daten sind auf Datenträgern, z.B. Film oder Band, oder Übertragungskanälen, z.B. Rundfunk oder Telefon, in einem festen Format gespeichert, welches eine Erweiterung um neuartige Audioformate oder andere synchrone bzw. bildsynchrone Zusatzdienste, wie z.B. Untertitel, nicht zu- lässt. Bei der Einführung beispielsweise neuer Audioformate müssen daher neue Datenträger bzw. Filmkopien produziert werden, die die neuen Audioformate aufweisen.Audio-video data is on data carriers, e.g. Film or tape, or transmission channels, e.g. Radio or telephone, stored in a fixed format, which can be extended to include new audio formats or other synchronous additional services, such as Subtitles, not allowed. For example, when new audio formats are introduced, new media or movie copies must be produced that have the new audio formats.
Fig. 8 zeigt einen beispielhaften Film 110. Auf dem Film sind in räumlicher Folge, bzw. während des Abspielens entsprechend in zeitlicher Folge, Filminformationen aufgebracht, z.B. Videoinformation bzw. Bilder 112, die im Englischen auch als „Frames" bzw. „Video-Frames" bezeichnet werden, und Audio-Informationen bzw. eine oder eine Mehrzahl von analogen oder digitalen Tonspuren 114, die im digitalen Fall „Audio-Frames" aufweisen. Des weiteren weist der Film 110 beispielhaft Vorschubperforationen 116 auf, mit deren Hilfe der Film abgespielt wird.Fig. 8 shows an exemplary film 110. Film information is applied to the film in spatial sequence, or during playback, respectively, in chronological order, e.g. Video information or images 112, which are also referred to as "frames" in the English language, and audio information or one or a plurality of analog or digital audio tracks 114 which are used in the digital case "audio frames". Furthermore, the film 110 has, by way of example, feed perforations 116 with the aid of which the film is played back.
Zur Synchronisation von Zusätzen sind prinzipiell zwei Methoden bekannt.For the synchronization of additives, two methods are known in principle.
Die erste Methode beinhaltet das Speichern eines Timecodes auf dem Datenträger, wie z.B. bei DTS (DTS = Digital Theat- re System) für Kinoton, bzw. in einem Zusatzkanal, der mit dem Audiosignal verbunden ist. Beispiele hierfür sind an- xilliary data by DAB und mp3. Der Timecode wird dann verwendet, um Ton- bzw. Zusatzinformationen synchron von einem externen Datenträger, bei DTS z.B. CD, abzuspielen. Nachteilig an dieser Methode ist jedoch, dass jedes zusätzliche Format weiteren Platz auf dem Datenträger bzw. Übertragungskanal benötigt, der unter Umständen aber nicht mehr verfügbar ist. Beim Film sind dies z.B. die Spuren für Ana- log-Ton, Dolby-Digital, DTS, SDDS (SDDS = Sony Dynamic Di- gital Sound) . Proprietäre Formate verhindern jedoch dieThe first method involves the storage of a time code on the data carrier, such as for DTS (DTS = Digital Theater System) for Kinoton, or in an additional channel with the audio signal is connected. Examples of this are an- xiliary data by DAB and mp3. The time code is then used to play audio or additional information synchronously from an external data carrier, for example CD in DTS. The disadvantage of this method, however, is that each additional format requires more space on the disk or transmission channel, which may not be available anymore. In the case of film, these are, for example, the tracks for analogue sound, Dolby Digital, DTS, SDDS (SDDS = Sony Dynamic Digital Sound). Proprietary formats, however, prevent the
Nutzung des Timecodes einer Erweiterung durch andere Erweiterungen. Gegenseitige Störungen der Erweiterungen sind nicht immer zu verhindern, ein Beispiel hierfür ist die Nutzung von anxilliary data in mp3 für Zusatzinformationen und Bandbreitenerweiterung verschiedener Hersteller.Use of the timecode of an extension by other extensions. Mutual disturbances of the extensions are not always preventable, an example of this is the use of anxilliary data in mp3 for additional information and bandwidth extension of various manufacturers.
Die zweite Methode basiert auf der missbräuchlichen Benutzung von Analog-Ton-Spuren zur Speicherung von Timecode, wie sie z.B. in einem Prototypenkino, das mit einem IOSONO- System ausgestattet ist, verwendet wird. Nachteilig an dieser Methode ist jedoch, dass die Analogspur in allen Systemen vorhanden ist und oft als Fallback-Lösung bei Störungen der anderen Systeme verwendet wird, das heißt, eine Zweckentfremdung der Analogspur verhindert die Fallback- Möglichkeit. Die automatische Umschaltung auf die Analogspur, die in die meisten Kinos eingebaut ist, führt dazu, dass der Timecode als Analogsignal abgespielt wird, wenn auf den „moderneren" Spuren für Dolby-Digital bzw. DTS kein Signal vorhanden ist. In dem Prototypenkino muss daher bei einer reinen Wellenfeldsynthese-Wiedergabe, die im folgenden noch erläutert wird, die redundante Analogwiedergabe manuell abgeschaltet werden, weil sonst der Timecode über die redundanten weiteren Lautsprecher zu hören ist.The second method is based on the misuse of analog audio tracks for storing time code as described e.g. in a prototype cinema equipped with an IOSONO system. A disadvantage of this method, however, is that the analog track is present in all systems and is often used as a fallback solution in case of disturbances of other systems, that is, an alienation of the analog track prevents the fallback possibility. The automatic switching to the analogue track, which is built into most cinemas, causes the timecode to be played back as an analogue signal if no signal is present on the "more modern" Dolby Digital or DTS tracks in a pure wave field synthesis playback, which will be explained below, the redundant analog playback are turned off manually, because otherwise the time code can be heard on the redundant other speakers.
Die akustische Wellenfeldsynthese, kurz WFS, geht über die Surround-Ansätze der Formate Dolby, SDDS oder DTS hinaus. Bei der WFS wird versucht, die Luftschwingungen einer realen Situation, die den Schall ausmachen, über einen ganzen Raum nachzubilden. Im Gegensatz zur herkömmlichen Wiedergabe über zwei oder mehr Lautsprecher, bei der die Abbildung der Position der originären Schallquellen sich auf eine Linie zwischen den Lautsprechern beschränkt, soll die Wellen- feldsynthese das gesamte Schallfeld originalgetreu auf den Raum übertragen. Das bedeutet, dass die virtuellen Schallquellen exakt räumlich lokalisierbar sind, und gegebenenfalls sogar mitten im beschallten Raum zu existieren scheinen, somit umgehbar werden. Systeme mit bis zu 200 Laut- Sprechern in Kinosystemen und bis zu 900 Lautsprechern in Theaterbeschallungssystemen sind derzeit schon realisiert worden.Acoustic Wave Field Synthesis, WFS for short, goes beyond the surround approaches of the Dolby, SDDS or DTS formats. In the WFS, the air vibrations of a real situation, which make up the sound, are tried over a whole To recreate space. In contrast to conventional playback using two or more loudspeakers, in which the image of the position of the original sound sources is limited to a line between the loudspeakers, the wave field synthesis is intended to transmit the entire sound field true to the original to the room. This means that the virtual sound sources can be exactly spatially localized, and possibly even seem to exist in the middle of the sounded room, thus they can be bypassed. Systems with up to 200 loudspeakers in cinema systems and up to 900 loudspeakers in theater sound systems have already been implemented.
Die Wellenfeldsynthese basiert auf dem Huygensschen Prin- zip, das besagt, dass jeder Punkt auf einer Wellenfront als Ausgangspunkt für eine elementare sphärische Welle angesehen werden kann. Durch Interferenz aller Elementarwellen entsteht eine neue Wellenfront, die mit der ursprünglichen Welle identisch ist.Wave field synthesis is based on the Huygens principle, which states that any point on a wavefront can be considered as the starting point for an elementary spherical wave. By interference of all elementary waves, a new wavefront arises, which is identical to the original wave.
Ein derartiges Klangsystem ist vom Fraunhofer-Institut für Digitale Medientechnologie unter dem Namen IOSONO entwickelt worden und im Kino Ilmenau im Einsatz.Such a sound system has been developed by the Fraunhofer Institute for Digital Media Technology under the name IOSONO and is used in the cinema Ilmenau.
Als Beispiel aus der Praxis sei daher das Kino Ilmenau genannt, bei dem die Wellenfeldsynthese in zwei Modi betrieben wird.As an example from practice, the cinema Ilmenau called, in which the wave field synthesis is operated in two modes.
Im ersten Modus wird das Kino als „echtes" Wellenfeldsyn- these-System betrieben, wobei hier auf der Analogspur des 35 mm Films der Timecode gespeichert ist, wie dies bezüglich der zweiten „missbräuchlichen" Methode zuvor erläutert wurde, und der WFS-Ton von einem externen Medium, z.B. Festplatte oder DVD, zugespielt wird.In the first mode, the cinema is operated as a "real" wave field synthesis system, where the analog track of the 35 mm film stores the time code, as explained above with regard to the second "abusive" method, and the WFS sound of an external medium, eg Hard disk or DVD, is leaked.
In dem zweiten Modus, der „kompatiblen Wiedergabe", wird der auf jedem 35 mm Film gespeicherte Ton von einem Dolby- Prozessor, alternativ könnte auch DTS bzw. SDDS eingesetzt werden, ausgelesen und decodiert, wobei der Dolby-Prozessor ggf. auch automatisch auf die Analogspur umschaltet, und das entstehende Multikanalsignal via WFS auf virtuelle Lautsprecher abbildet.In the second mode, "Compatible Playback", the sound stored on each 35 mm movie is taken from a Dolby processor, alternatively DTS or SDDS could also be used be read, read and decoded, the Dolby processor may also switch automatically to the analog track, and maps the resulting multi-channel signal via WFS on virtual speakers.
Da für beide Modi unterschiedliche Signalpfade notwendig sind, ist eine Teilung des Signals, das vom Lesekopf für das Analogsignal kommt, notwendig, was zusätzlichen technischen Aufwand zur Folge hat.Since different signal paths are necessary for both modes, a division of the signal coming from the read head for the analog signal is necessary, resulting in additional technical complexity.
Zusammenfassend kann daher gesagt werden, dass auf den heutigen Kinofilmrollen kein Platz mehr ist, um eine weitere Synchronisationsspur für beispielsweise externe Tonsysteme oder Untertitelsysteme anzubringen. Alle bisher erhältli- chen Kinotonsysteme, analog und digital, erhalten ihre Tonspur entweder direkt über eine oder eine Mehrzahl von Tonspuren auf der Filmrolle oder durch ein herstellerspezifisches Zeitcodesignal auf der Filmrolle. Dies bedeutet, dass für beide bekannten Ansätze, wie zuvor erläutert, neue Ko- pien der Filme zu meist erheblichen Kosten erstellt werden müssen. Dabei ermöglichen Audioformate wie Dolby Digital und SDDS zwar moderne Audioerlebnisse, weisen jedoch immer noch keine Timecodes für die Synchronisation von beispielsweise Untertiteln oder anderssprachigen Versionen der FiIm- Vertonung auf.In summary, it can therefore be said that there is no longer any room on today's cinematographic rolls to provide a further synchronization track for, for example, external sound systems or subtitling systems. All previously available cinema sound systems, analog and digital, receive their soundtrack either directly via one or a plurality of sound tracks on the film reel or through a manufacturer-specific time code signal on the film reel. This means that for both known approaches, as explained above, new copies of the films must be produced at mostly considerable costs. Although audio formats such as Dolby Digital and SDDS allow for modern audio experiences, they still do not have timecodes for the synchronization of, for example, subtitles or other language versions of the FiIm soundtrack.
Frank Jordan und Jesper Dannow schlagen daher in ihrer Veröffentlichung „Generating Timecode Information from Analog Sources", 118. Convention, Audio Engineering Society vom 28. bis 31. Mai 2005, in Barcelona, Spanien, Convention Paper 6473, vor, einen Timecode auf der Basis der analogen Tonspur zu erzeugen. Die Veröffentlichung beschreibt ein System mit der Bezeichnung „Soundtitles", das an die analoge Tonspur des Projektors angeschlossen wird. Basierend auf einer bearbeiteten, digitalen Kopie der Tonspur und dem a- nalogen Signal des Filmprojektors wird eine Zeitinformation bzw. ein Timecode durch Kreuzkorrelation bestimmt. Das System „Soundtitles" besteht aus drei Komponenten. Das Kernmo- dul „Sync Tracker erzeugt das Zeitcodesignal. Das zweite Modul, der „Sync Player" erzeugt Untertitel, die mit beispielsweise einem Beamer projiziert werden. Das dritte Modul, der „Clip Player" spielt synchronisierte Audio-Clips ab, die über kabellose Kopfhörer an den Kinobesucher übertragen werden.Frank Jordan and Jesper Dannow, therefore, propose a timecode at the "Generating Timecode Information from Analogue Sources", 118th Convention, Audio Engineering Society, May 28-31, 2005 in Barcelona, Spain, Convention Paper 6473 The basis of the analogue soundtrack The publication describes a system called "Soundtitles", which is connected to the analog soundtrack of the projector. Based on a processed, digital copy of the soundtrack and the analogue signal of the film projector, a time information or a time code is determined by cross-correlation. The system "Soundtitles" consists of three components. dul "Sync Tracker generates the time code signal. The second module, the "Sync Player", creates subtitles that are projected onto a projector, for example, while the third module, the "Clip Player", plays synchronized audio clips that are transmitted via wireless headphones to the moviegoer.
Nachteilig an dem zuvor beschriebenen Stand der Technik ist, dass die Synchronisation und Zeitpunktbestimmung in- nerhalb des Films, wie in der Veröffentlichung beschrieben, auf ein Suchfenster von beispielsweise einer 1 Minute begrenzt ist. Gerade in der Anfangsphase des Films ist es jedoch schwierig, das richtige Fenster für eine erfolgreiche Synchronisation zu definieren bzw. zu bestimmen. Liegt der vom Film gelesene bzw. abgetastete Abschnitt nicht in dem Abschnitt der gespeicherten Filminformation, der für die Synchronisation verwendet wird, bleibt die Synchronisation erfolglos oder es erfolgt eine falsche Synchronisation. Der Kinobesucher bzw. Filmzuschauer hört dann keinen oder einen falschen Ton zum Film.A disadvantage of the prior art described above is that the synchronization and timing within the film, as described in the publication, is limited to a search window of, for example, 1 minute. Especially in the initial phase of the film, however, it is difficult to define the right window for a successful synchronization. If the portion read or scanned by the film is not in the portion of the stored movie information used for the synchronization, the synchronization will fail or the synchronization will be erroneous. The cinema audience or movie viewer then hears no or a wrong sound to the film.
Die Aufgabe der vorliegenden Erfindung besteht darin, ein effizientes Konzept zu schaffen, um eine Stelle in einem Film zu ermitteln.The object of the present invention is to provide an efficient concept for determining a location in a film.
Diese Aufgabe wird durch eine Vorrichtung zum Ermitteln einer Stelle in einem Film gemäß Anspruch 1, einem Verfahren zum Ermitteln einer Stelle in einem Film gemäß Anspruch 20 und durch ein Computerprogramm gemäß Patentanspruch 21 ge- löst.This object is achieved by a device for determining a position in a film according to claim 1, a method for determining a position in a film according to claim 20 and by a computer program according to claim 21.
Der vorliegenden Erfindung liegt die Erkenntnis zugrunde, dass jede Stelle eines Films im allgemeinen für diese Stelle spezifische Filminformationen aufweist, so dass bei ei- ner Merkmalsextraktion unterschiedliche Stellen eines Films unterschiedliche, spezifische Ausprägungen der Merkmale aufweisen. Damit weisen in anderen Worten unterschiedliche Stellen in einem Film unterschiedliche „Fingerabdrücke" auf. Diese Fingerabdrucke können wiederum genutzt werden, um eine Stelle in einem Film zu ermitteln.The present invention is based on the finding that each location of a film generally has film information specific to that location, so that in a feature extraction different locations of a film have different, specific characteristics of the features. In other words, different places in a movie have different "fingerprints" on. These fingerprints can in turn be used to find a location in a movie.
Erfindungsgemäß wird daher eine Vorrichtung zum Ermitteln einer Stelle in einem Film, der in einer zeitlichen Folge aufgebrachte Filminformationen aufweist, geschaffen, mit folgenden Merkmalen: einem Speicher zum Speichern einer Referenzfingerabdruckdarstellung (FAD) der Filminformationen, wobei die Fingerabdruckdarstellung so ausgebildet ist, dass ein zeitlicher Verlauf der Fingerabdruckdarstellung von einem zeitlichen Verlauf der Filminformation abhängt, wobei einer gespeicherten Referenzfingerabdruckdarstellung eine Zeitskala zugeordnet ist, eine Einrichtung zum Empfangen eines von dem Film gelesenen Abschnitts, einer Einrichtung zum Extrahieren einer Testfingerabdruckdarstellung aus dem eingelesenen Abschnitt, und eine Einrichtung zum Vergleichen der Testfingerabdruckdarstellung mit der Referenzfingerabdruckdarstellung, um auf der Basis des Vergleichs und der Zeitskala die Stelle in dem Film zu ermitteln.According to the invention there is therefore provided an apparatus for determining a location in a film having film information applied in a temporal sequence, comprising: a memory for storing a reference fingerprint representation (FAD) of the movie information, wherein the fingerprint representation is arranged such that a temporal Characteristics of the fingerprint representation depend on a time course of the film information, wherein a stored reference fingerprint representation is associated with a time scale, means for receiving a portion read from the film, means for extracting a test fingerprint representation from the read portion, and means for comparing the test fingerprint representation the reference fingerprint representation to determine the location in the film based on the comparison and time scale.
Die Vorrichtung und das Verfahren zum Ermitteln einer Stelle in einem Film ermöglichen es, zu einem beliebigen Zeitpunkt eine beliebige Stelle in einem Film zu bestimmen, ohne den Film selbst präparieren oder ändern zu müssen. Die relevante Zeitinformation, die Zeitskala, wird zusammen mit einer gespeicherten Version des Films gespeichert. Dabei wird der Film in Form einer Referenzfingerabdruckdarstellung gespeichert, was einer Merkmalsextraktion entspricht. Damit kann der benötigte Speicherplatz und auch die Rechen- leistung und/oder die Dauer zum Ermitteln der Stelle reduziert werden. Bevorzugte Ausführungsbeispiele haben weiterhin den Vorteil, bei geeigneter Wahl der Fingerabdruckdarstellung, eine eindeutige Ermittlung der Stelle zu ermöglichen.The device and method for determining a location in a film make it possible to determine anywhere in a film at any time without having to prepare or change the film itself. The relevant time information, the time scale, is stored along with a saved version of the movie. The film is stored in the form of a reference fingerprint representation, which corresponds to a feature extraction. Thus, the required storage space and also the computing power and / or the duration for determining the location can be reduced. Preferred embodiments also have the advantage, with a suitable choice of the fingerprint representation, to enable an unambiguous determination of the position.
Die Vorrichtung und das Verfahren zum Ermitteln einer Stelle in einem Film kann beispielsweise in einer Vorrichtung zum Erzeugen eines Steuersignals für ein Filmereignissystem eingesetzt werden, dass Filmereignisse mit einer Bildwiedergabe synchronisiert. Beispiele für Filmereignisse sind der Audio-Ton, Untertitel und Spezialeffekte, wobei Spezi- aleffekte z.B. Luftströmungen, Wackeln an den Kinostühlen, Gerüche oder Lichteffekte an Seiten- und Rückwand umfassen können. Dabei sind bezüglich des Audio-Ereignisses sowohl unterschiedliche Sprachen, wie z.B. gleichzeitiges Abspielen der Originalversion und von Übersetzungen in andere Sprachen, als auch verschiedene Audio-Techniken möglich, wie z.B. die Synchronisierung von digitalen Surround-The device and the method for determining a position in a film can be used, for example, in a device for generating a control signal for a film event system be used that synchronizes movie events with a picture playback. Examples of movie events include audio, subtitles, and special effects, with special effects such as air currents, jiggling on the cinema chairs, smells, or light effects on the side and back walls. Different audio languages, such as simultaneous playback of the original version and translations into other languages, as well as different audio techniques, such as the synchronization of digital surround sound, are possible with regard to the audio event.
Systemen wie der Wellenfeldsynthese. Dabei dienen die Vorrichtung oder das Verfahren zum Ermitteln einer Stelle insbesondere zur Synchronisation in einer Anfangsphase des Films, bewirken jedoch auch eine höhere Toleranz gegenüber beispielsweise Sprüngen mitten im Film, um so selbst unter widrigen Umständen eine optimale Synchronisation bzw. Bestimmung einer Stelle in einem Film zu gewährleisten.Systems such as wave field synthesis. The device or the method for determining a location, in particular for synchronization in an initial phase of the film, but also cause a higher tolerance to jumps in the middle of the film, so even under adverse circumstances optimal synchronization or determination of a point in a movie to ensure.
Auch wenn die zuvor beschriebenen und noch folgenden Bei- spiele von einem Kinobesucher oder einem Film sprechen, so beschränkt sich die Erfindung nicht nur auf Kinofilme für einen Kinobesucher, sondern bezieht sich allgemein auf Filme bzw. Audio-Video-Signale, unabhängig davon, ob es sich dabei um auf Filmen oder anderen Datenträgern und Speicher- medien, z.B. Magnetbänder oder Festplatten, gespeicherte Filminformationen handelt. Darüber hinaus kann die Erfindung auch für reine Tonsysteme ohne Video eingesetzt werden oder beispielsweise mittels einer Video-ID auch zur Synchronisation von reinem Videomaterial, d.h. ohne Ton, mit beliebigen Ereignissen verwendet werden.Although the examples described above and still speak of a moviegoer or a movie, the invention is not limited to movies for a moviegoer, but generally refers to films or audio-video signals, regardless of whether these are films or other data carriers and storage media, eg Magnetic tapes or hard drives, stored movie information. Moreover, the invention can also be used for pure sound systems without video or, for example, by means of a video ID also for the synchronization of pure video material, i. without sound, to be used with any events.
Bevorzugte Ausführungsbeispiele der vorliegenden Erfindung werden nachfolgend Bezug nehmend auf die beiliegenden Zeichnungen detailliert erläutert. Es zeigen:Preferred embodiments of the present invention will be explained below in detail with reference to the accompanying drawings. Show it:
Fig. 1 ein prinzipielles Blockschaltbild eines bevorzug¬ ten Ausführungsbeispiels einer Vorrichtung zum Erzeugen eines Steuersignals für ein Filmereignissystem;Fig. 1 is a schematic block diagram of a Favor ¬ th embodiment of an apparatus for Generating a control signal for a movie event system;
Fig. 2a ein prinzipielles Blockschaltbild eines Ausfüh- rungsbeispiels einer Vorrichtung zum Durchführen einer Korrelation;FIG. 2a shows a basic block diagram of an embodiment of an apparatus for performing a correlation; FIG.
Fig. 2b ein prinzipielles Blockschaltbild eines bevorzugten Ausführungsbeispiels einer Vorrichtung zum Durchführen einer Korrelation;Fig. 2b is a schematic block diagram of a preferred embodiment of a device for performing a correlation;
Fig. 2c.1 einen beispielhaften Abschnitt eines FilmsFig. 2c.1 an exemplary portion of a film
Fig. 2c.2 einen beispielhaften Verlauf eines Tonsignals des in Fig. 2c.1 dargestellten Abschnitts des Films bei einer variablen, ersten Abspielgeschwindigkeit und einer konstanten Testabtastrate;FIG. 2c.2 shows an exemplary course of a tone signal of the section of the film shown in FIG. 2c.1 at a variable, first playback speed and a constant test sample rate;
Fig. 2c.3 einen beispielhaften Verlauf eines Tonsignals des in Fig. 2c.1 dargestellten Abschnitts des Films bei einer variablen, zweiten Abspielgeschwindigkeit und einer konstanten Testabtastrate;FIG. 2 c shows an exemplary profile of a sound signal of the section of the film shown in FIG. 2 c 1 at a variable, second playback speed and a constant test sampling rate;
Fig. 2c.4 einen beispielhaften Verlauf eines Tonsignals des in Fig. 2c.1 dargestellten Abschnitts des Films bei einer variablen, dritten Abspielgeschwindigkeit und einer konstanten Testabtastrate;FIG. 2c shows an exemplary course of a sound signal of the section of the film shown in FIG. 2c.1 at a variable, third playback speed and a constant test sample rate;
Fig. 2d.l zwei beispielhafte Abschnitte eines Films;Fig. 2d.l two exemplary sections of a film;
Fig. 2d.2 einen beispielhaften Verlauf eines Referenztonsignals des Films;Fig. 2d.2 an exemplary course of a reference sound signal of the film;
Fig. 2d.3 einen beispielhaften Verlauf eines Testtonsig- nals, basierend auf einer ersten Abspielgeschwindigkeit und einer konstanten Testabtastrate, für einen Abschnitt des Films; Fig. 2d.4 ein beispielhaftes erstes Korrelationsergebnis aus der Korrelation des Referenztonsignals gemäß Fig. 2d.2 und des Testtonsignals gemäß Fig. 2d.3;FIG. 2d shows an exemplary course of a test tone signal, based on a first playback speed and a constant test scan rate, for a section of the film; FIG. 2d.4 an exemplary first correlation result from the correlation of the reference sound signal according to FIG. 2d.2 and the test sound signal according to FIG. 2d.3;
Fig. 2d.5 zwei beispielhafte Abschnitte eines Films gemäß Fig.2d.l;Fig. 2d.5 two exemplary sections of a film according to Fig.2d.l;
Fig. 2d.6 einen beispielhaften Verlauf eines Referenztonsignals des Films gemäß Fig. 2d.2;FIG. 2d.6 shows an exemplary course of a reference sound signal of the film according to FIG. 2d.2;
Fig. 2d.7 einen beispielhaften Verlauf eines Testtonsignals, basierend auf einer zweiten Abspielgeschwindigkeit und einer konstanten Testabtastrate, für einen Abschnitt des Films;Fig. 2d.7 shows an example of a test tone signal based on a second playback speed and a constant test sample rate for a portion of the film;
Fig. 2d.8 ein beispielhaftes zweites Korrelationsergebnis aus der Korrelation des Referenztonsignals gemäß Fig. 2d.6 und des Testtonsignals gemäß Fig. 2d.7;2d.8 shows an exemplary second correlation result from the correlation of the reference sound signal according to FIG. 2d.6 and the test sound signal according to FIG. 2d.7;
Fig. 3a ein prinzipielles Blockschaltbild eines bevorzugten Ausführungsbeispiels einer Vorrichtung zum Ermitteln einer Stelle in einem Film mittels einer Fingerabdruckdarstellung;3a is a schematic block diagram of a preferred embodiment of a device for determining a location in a film by means of a fingerprint representation;
Fig. 3b.1 zwei Abschnitte eines Films;Fig. 3b.1 shows two sections of a film;
Fig. 3b.2 einen beispielhaften Verlauf des Referenztonsignals für die zwei Abschnitte gemäß Fig. 3b.1;3b.2 shows an exemplary course of the reference sound signal for the two sections according to FIG. 3b.1;
Fig. 4 ein prinzipielles Blockschaltbild eines bevorzugten Ausführungsbeispiels einer Vorrichtung zum Ermitteln einer Stelle in einem Film mittels einer groben und einer nachfolgenden feinen Bestimmung der Stelle;Fig. 4 is a schematic block diagram of a preferred embodiment of a device for detecting a location in a film by means of a coarse and a subsequent fine determination of the location;
Fig. 5a ein prinzipielles Blockschaltbild eines bevorzugten Ausführungsbeispiels einer Vorrichtung zum Erzeugen eines Steuersignals für ein Filmereignissystem;Fig. 5a is a schematic block diagram of a preferred embodiment of an apparatus for Generating a control signal for a movie event system;
Fig. 5b.1 zwei Abschnitte eines Films;Fig. 5b.1 two sections of a film;
Fig. 5b.2 einen beispielhaften Verlauf eines Referenztonsignals für einen ersten Abschnitt des Films;5b.2 shows an exemplary course of a reference sound signal for a first section of the film;
Fig. 5b.3 einen beispielhaften Verlauf eines Testtonsignals für einen zweiten Abschnitt des Films;Fig. 5b.3 shows an exemplary course of a test sound signal for a second portion of the film;
Fig. 5b.4 ein beispielhaftes Korrelationsergebnis aus der Korrelation des Referenztonsignals gemäß Fig. 5b.2 und des Testtonsignals gemäß Fig. 5b.3;5b.4 an exemplary correlation result from the correlation of the reference sound signal according to FIG. 5b.2 and the test sound signal according to FIG. 5b.3;
Fig. 6a ein prinzipielles Blockschaltbild eines beispielhaften Filmvorführsystems mit einer Vorrichtung zum Erzeugen eines Steuersignals für ein Filmereignissystem und einem Filmereignissystem;6a is a schematic block diagram of an exemplary motion picture display system including an apparatus for generating a control signal for a motion picture event system and a motion picture event system;
Fig. 6b ein prinzipielles Blockschaltbild eines beispielhaften Filmvorführsystems mit einer Vorrichtung zum Erzeugen eines Steuersignals mit einem beispielhaften Audio-FilmereignisSystem;FIG. 6b is a schematic block diagram of an exemplary motion picture display system including an apparatus for generating a control signal with an exemplary audio movie event system; FIG.
Fig. 7 eine schematische Darstellung einer beispielhaften Zuordnung einer Zeitskala zu einer Filminformation;7 shows a schematic illustration of an exemplary assignment of a time scale to a film information;
Fig. 8 eine schematische Darstellung eines beispielhaften Films mit aufgebrachten Filminformationen.Fig. 8 is a schematic representation of an exemplary film with applied film information.
In der nachfolgenden Beschreibung der Erfindung bzw. der bevorzugten Ausführungsbeispiele werden für gleiche oder gleich wirkende Elemente gleiche Bezugszeichen verwendet. Im Folgenden wird die Erfindung anhand von Ausführungsbeispielen näher erläutert, die als Filminformation das Tonsignal, das auf dem Film aufgebracht ist, nutzen. Dies soll jedoch die Erfindung nicht einschränken, sondern dient al- lein der Veranschaulichung.In the following description of the invention and the preferred embodiments, the same reference numerals are used for the same or equivalent elements. In the following the invention will be explained in more detail by means of exemplary embodiments, which use as a film information the sound signal which is applied to the film. However, this is not intended to limit the invention, but serves only to illustrate it.
Fig. 1 zeigt ein prinzipielles Blockschaltbild einer Vorrichtung zum Erzeugen eines Steuersignals für ein Filmereignissystem und einen beispielhaften Film 110, wie er zu- vor bzgl. Fig. 8 erläutert wurde, wobei die Vorrichtung zum Erzeugen eines Steuersignals eine Einrichtung zum Speichern 120 der Filminformation, eine Einrichtung zum Empfangen eines von dem Film gelesenen Abschnitts 140, eine Einrichtung 160 zum Vergleichen des gelesenen Abschnitts mit der ge- speicherten Filminformation 112, 114 und eine Einrichtung 180 zum Ermitteln des Steuersignals, basierend auf dem Vergleich und der Zeitskala aufweist.1 shows a basic block diagram of a device for generating a control signal for a film event system and an exemplary film 110, as has been explained above with reference to FIG. 8, wherein the device for generating a control signal comprises a device 120 for storing the film information, means for receiving a portion read from the film 140, means for comparing the read portion with the stored movie information 112, 114, and means 180 for determining the control signal based on the comparison and the time scale.
Die gespeicherte Filminformation 112, 114 umfasst bei- spielsweise die Ton- bzw. Audio-Signale, die Bilder bzw.The stored film information 112, 114 includes, for example, the audio or audio signals, the images or
Video-Signale oder auch Marken, die schon heute auf Filmen zu finden sind, und z.B. festlegen, wo die Blende aufgeht bzw. ab wann Ton gespielt wird, bzw. wann der Film anhält. Die gespeicherten Audio- und/oder Videosignale liegen bei- spielsweise in digitalisierter Form vor, vorzugsweise in komprimierter Form, um den Speicherbedarf zu reduzieren.Video signals or even brands that can already be found on films, and e.g. determine where the shutter will open or when the sound will be played or when the movie will stop. The stored audio and / or video signals are present, for example, in digitized form, preferably in compressed form, in order to reduce the memory requirement.
Ein Vorteil der digitalisierten Speicherung liegt in der einfachen und vor allem fehlerfreien Vervielfältigbarkeit des gespeicherten Abbildes der Filminformationen.One advantage of digitized storage lies in the simple and, above all, error-free duplication of the stored image of the film information.
Im Gegensatz zu herkömmlichen Systemen, bleibt der Film wie zuvor beschrieben unverändert, es wird lediglich einmal ein gespeichertes Abbild der Filminformationen erzeugt, z.B. bei der Herstellung des Films.Unlike conventional systems, the film remains unchanged as previously described, producing only a stored image of the movie information once, e.g. in the production of the film.
Bei dem Abspielen des Films mittels eines Filmabspielgerätes, beispielsweise eines Filmprojektors, wird beispiels- weise das auf der Tonspur 114 enthaltende Tonsignal von der Einrichtung 140 zum Empfangen empfangen und für die Einrichtung 160 zum Vergleichen aufbereitet, beispielsweise mit einer gegebenen Abtastrate abgetastet und als Abschnitt einer gegebenen Länge bzw. einer gegebenen Anzahl von Abtastwerten weitergegeben.When playing the film by means of a film player, for example a film projector, The audio signal received on audio track 114 is received by device 140 for reception and conditioned for comparison by device 160, for example, sampled at a given sample rate and passed as a portion of a given length or number of samples.
Die Einrichtung 160 ist ausgebildet, diesen von dem Film gelesenen Abschnitt mit der gespeicherten Filminformation zu vergleichen, wobei die Einrichtung 160 zum Vergleichen ausgebildet sein kann, den gelesenen Abschnitt mit der gesamten gespeicherten Filminformation zu vergleichen, vorzugsweise jedoch den gelesenen Abschnitt mit einem Abschnitt der gespeicherten Filminformation vergleicht, um den Rechenaufwand zu minimieren. Der Vergleich kann beispielsweise mittels Kreuzkorrelation, aber auch mittels Berechnen des Unterschieds, z.B. durch Berechnung einer komprimierten Hash-Summe und Suche dieser in einer Datenbank erfolgen. Der Vergleich kann auf dem Tonsignal allein, dem Video-Signal allein, einem Vergleich des Ton-Signals und des Video-Signals sowie einer Kombination mit einer Auswertung der zuvor genannten Merkmale bestehen. Basierend auf dem Ergebnis des Vergleichs der Einrichtung zum Vergleichen 160 und der Zeitskala ermittelt die Einrichtung 180 zum Er- mittein das Steuersignal 190. Mittels des Steuersignals 190 wird ein Filmereignissystem gesteuert, das basierend auf dem Steuersignal 190 zeitsynchron zu dem abgespielten Film 110 beispielsweise WFS-Tonsignale oder Untertitel erzeugt. Dabei kann die Vorrichtung zum Erzeugen eines Steuersignals oder im Speziellen die Einrichtung zum Ermitteln des Steuersignals 180 so ausgebildet sein, dass das Steuersignal ein beliebiges Zeitcodeformat ist, proprietär oder standardisiert wie z.B. das nach SMPTE (Society of Motion Picture and Television Engineers) standardisierte LTC- Zeitcodeformat (LTC = Longitudinal Time Code) .The means 160 is adapted to compare this portion read from the film with the stored film information, the means 160 for comparing may be arranged to compare the read portion with the entire stored film information, but preferably the read portion with a portion of the stored ones Film information compares to minimize the computational effort. The comparison can be done, for example, by cross-correlation, but also by calculating the difference, e.g. by calculating a compressed hash sum and searching this in a database. The comparison may consist of the audio signal alone, the video signal alone, a comparison of the audio signal and the video signal and a combination with an evaluation of the aforementioned features. Based on the result of the comparison of the means 160 for comparison and the time scale, the means 180 determines the control signal 190. By means of the control signal 190, a film event system is controlled which, based on the control signal 190, is synchronous with the playing film 110, for example WFS. Sounds or subtitles generated. In this case, the device for generating a control signal or in particular the device for determining the control signal 180 may be designed so that the control signal is an arbitrary time code format, proprietary or standardized, such as e.g. the SMPTE (Society of Motion Picture and Television Engineers) standardized LTC time code format (LTC = Longitudinal Time Code).
Zeitsynchron bedeutet, dass basierend auf dem Steuersignal 190 das Filmereignissystem einer der gerade vom Film abge- spielten Stelle, der in der gespeicherten Filminformationen ein Zeitpunkt auf der Zeitskala zugeordnet ist, einem diesem Zeitpunkt der Zeitskala entsprechendes, gleichzeitiges Ereignis erzeugt wird.Time synchronous means that, based on the control signal 190, the movie event system is one of the movies currently being played. played place, which is assigned a time on the time scale in the stored movie information, a time corresponding to the time scale corresponding, simultaneous event is generated.
Dabei kann abweichend von dem erläuterten Ausführungsbeispiel statt des Filmprojektors ein beliebiges Filmabspielgerät verwendet werden, beliebige Filmformate, z.B. Stummfilme (z.B. mit Synchronisation auf Basis von Videoinforma- tionen) , Filme mit analoger oder digitaler Tonspur, einer Tonspur oder mehreren parallelen Tonspuren verwendet werden, oder alternativ zu einem Film beliebige andere Speichermedien verwendet werden, beispielsweise Kassetten oder Festplatten, deren Format nicht geändert werden kann oder soll, um beispielsweise weiterhin mit dem Filmabspielgerät kompatibel zu sein, zu denen jedoch gleichzeitig andere Filmereignisse synchronisiert werden sollen.In this case, unlike the illustrated embodiment, instead of the film projector, any film player may be used, any film formats, e.g. Silent films (eg, with video-based synchronization), analog or digital soundtrack, one or more parallel soundtracks, or any other storage media, such as cassettes or hard disks whose format is not changed, as an alternative to a movie can or should, for example, to continue to be compatible with the movie player, but at the same time other movie events should be synchronized.
In einem bevorzugten Ausführungsbeispiel wird das Tonsignal als Filminformation für die Synchronisation verwendet. Dabei wird der von dem Film gelesene Abschnitt mit einer gegebenen Abtastrate, die im Folgenden als Testabtastrate bezeichnet wird, abgetastet, um ein Testtonsignal zu erzeugen, und die gespeicherte Filminformation in digitaler Form gespeichert, wobei die gespeicherte Filminformation im Folgenden als Referenz-Signal bezeichnet wird, und das Testtonsignal und Referenztonsignal in der Einrichtung 160 zum Vergleichen mittels Kreuz-Korrelation verglichen werden.In a preferred embodiment, the audio signal is used as movie information for synchronization. At this time, the portion read from the film is scanned at a given sampling rate, hereinafter referred to as the test sampling rate, to produce a test tone signal and the stored movie information is stored in digital form, the stored film information being hereinafter referred to as the reference signal , and the test tone signal and reference tone signal are compared in the cross-correlation comparing means 160.
In einem Ausführungsbeispiel sind die Testsignal-Abtastrate und die Referenzsignal-Abtastrate unveränderlich, das heißt konstant. Die Einrichtung 160 zum Vergleichen kann dann beispielsweise ausgebildet sein, um zu einem ersten Zeitpunkt auf der Basis eines ersten Testtonsignals und einem ersten Referenztonsignal ein erstes Korrelationsergebnis zu erzeugen, um einen ersten Zeitpunkt der Zeitskala zu bestimmen, und zu einem zweiten Zeitpunkt ein zweites Testtonsignal und einem zweiten Referenztonsignal ein zweites Korrelationsergebnis zu erzeugen, um einen zweiten Zeitpunkt der Zeitskala zu bestimmen, um daraus beispielsweise eine Zeitdifferenz bzw. Abspielgeschwindigkeit zu bestimmen oder im Vergleich zu einer Soll- oder Referenzabspielge- schwindigkeit eine Geschwindigkeitsdifferenz zu bestimmen. Auf dieser Basis bestimmt die Einrichtung 180 zum Ermitteln des Steuersignals das Steuersignal, um beispielsweise das Filmereignissystem zu synchronisieren.In one embodiment, the test signal sample rate and the reference signal sample rate are fixed, that is, constant. The means 160 for comparison may then be designed, for example, to generate a first correlation result at a first time on the basis of a first test tone signal and a first reference tone signal to determine a first time scale of the time scale, and at a second time a second test tone signal a second reference sound signal a second To generate the correlation result to determine a second time of the time scale, for example, to determine therefrom a time difference or playback speed or to determine a speed difference compared to a desired or reference playback speed. On this basis, the means 180 for determining the control signal determines the control signal, for example, to synchronize the movie event system.
Nachteilig an einer konstanten Abtastrate ist jedoch, dass sich bei einer sich verändernden Testabspielgeschwindigkeit das Korrelationsergebnis verschlechtert, und damit auch die Genauigkeit der Bestimmung des Zeitpunktes bzw. der Stelle im Film ungenauer wird und damit die Synchronisation schlechter wird. Dieser Nachteil kann durch Variation der Abtastraten, also der Testabtastrate und/oder der Referenzabtastrate, kompensiert werden.A disadvantage of a constant sampling rate, however, is that at a changing test playback speed, the correlation result deteriorates, and thus the accuracy of the determination of the time or the point in the film is inaccurate and thus the synchronization is worse. This disadvantage can be compensated by varying the sampling rates, ie the test sampling rate and / or the reference sampling rate.
Fig. 2a zeigt ein prinzipielles Blockschaltbild einer Vor- richtung zum Durchführen einer Korrelation zwischen einem Testtonsignal, das mit einer variablen Abspielgeschwindigkeit abspielbar ist und einem Referenztonsignal, das eine digital gespeicherte Version des Testtonsignals ist, wobei die Vorrichtung zum Durchführen einer Korrelati- on eine Einrichtung 210 zum Ermitteln eines Maßes für eine Testabspielgeschwindigkeit, eine Einrichtung 230 zum Variieren einer Testabtastrate oder einer Referenzabtastrate und eine Einrichtung 250 zum Vergleichen aufweist. Die Einrichtung 230 ist ausgebildet, um eine Testabtastrate, mit der das Testtonsignal 270 abgetastet wird, zu variieren, um ein modifiziertes Testsignal 272 zu erzeugen, oder um eine Referenzabtastrate zu variieren, um auf der Basis eines Referenztonsignals 274 ein modifiziertes Referenztonsignal 276 zu erzeugen. Die Einrichtung 230 zum Variieren ist fer- ner ausgebildet, die Testabtastrate oder Referenzabtastrate so zu variieren, dass eine Abweichung zwischen einer Testabspielgeschwindigkeit, die dem Testtonsignal zugeordnet ist, oder einer Referenzabspielgeschwindigkeit, die dem mo- difizierten Referenztonsignal 276 zugeordnet ist, reduziert ist, oder dass eine Abweichung zwischen einer Testabspielgeschwindigkeit, die dem modifizierten Testtonsignal 272 zugeordnet ist und einer Referenzabspielgeschwindigkeit, die dem Referenztonsignal 274 zugeordnet ist, oder dass eine Abweichung zwischen einer Testabspielgeschwindigkeit, die dem modifizierten Testtonsignal 272 zugeordnet ist und einer Referenzabspielgeschwindigkeit, die einem modifizierten Referenztonsignal 276 zugeordnet ist, reduziert ist, wobei der Begriff Abspielgeschwindigkeit bzw. die Problematik einer variablen Abspielgeschwindigkeit im Folgenden noch näher erläutert wird.2a shows a schematic block diagram of a device for carrying out a correlation between a test sound signal that can be played at a variable playback speed and a reference sound signal that is a digitally stored version of the test sound signal, wherein the device for carrying out a correlation is a device 210 for determining a measure of a test playing speed, means 230 for varying a test sampling rate or reference sampling rate, and means 250 for comparing. Means 230 is configured to vary a test sampling rate at which the test sound signal 270 is sampled to produce a modified test signal 272 or to vary a reference sampling rate to produce a modified reference sound signal 276 based on a reference sound signal 274. The means 230 for varying is further configured to vary the test sampling rate or reference sampling rate such that a deviation between a test playback speed associated with the test sound signal or a reference playback speed corresponding to the modulated sound rate. or a deviation between a test playback speed associated with the modified test sound signal 272 and a reference playback speed associated with the reference sound signal 274, or a deviation between a test playback speed associated with the modified test sound signal 272 and a reference playback speed associated with a modified reference sound signal 276 is reduced, the term playback speed or the problem of a variable playback speed being explained in more detail below.
Die Einrichtung 250 zum Vergleichen des modifizierten Test- tonsignals 272 und des Referenztonsignals 274, oder desThe device 250 for comparing the modified test tone signal 272 and the reference sound signal 274, or the
Testtonsignals 270 und des modifizierten Referenztonsignals 276, oder des modifizierten Testtonsignals 272 und des modifizierten Referenztonsignals 276 ist ausgebildet, um ein Ergebnis 278 der Korrelation zu ermitteln.Test tone signal 270 and the modified reference tone signal 276, or the modified test tone signal 272 and the modified reference tone signal 276 is designed to determine a result 278 of the correlation.
Das in Fig. 2a gezeigte Ausführungsbeispiel der Vorrichtung zum Durchführen einer Korrelation kann beispielsweise in einer Vorrichtung zum Erzeugen eines Steuersignals für ein Filmereignissystem, wie es beispielsweise in Fig. 1 gezeigt ist, als Einrichtung 160 zum Vergleichen eingesetzt werden.For example, in an apparatus for generating a control signal for a film event system, such as shown in FIG. 1, the embodiment of the apparatus for performing a correlation shown in FIG. 2a may be used as means 160 for comparison.
Fig. 2b zeigt ein prinzipielles Blockschaltbild eines bevorzugten Ausführungsbeispiels einer Vorrichtung zum Durchführen einer Korrelation zwischen einem Testtonsignal und einem Referenztonsignal.Fig. 2b shows a schematic block diagram of a preferred embodiment of a device for performing a correlation between a test sound signal and a reference sound signal.
Fig. 2b zeigt eine Einrichtung 280 zum Speichern eines Referenztonsignals 274, das eine digitale Version des Testtonsignals 270 ist, wobei das Referenztonsignal 274 einmal basierend auf einer gegebenen Speicherreferenzabspielge- schwindigkeit und einer Speicherreferenzabtastrate erzeugt wurde . Das Testtonsignal wird mit einer variablen Testabspielgeschwindigkeit abgespielt und mit einer Testabtastrate abgetastet, um das Testtonsignal 270 zu erzeugen.2b shows means 280 for storing a reference sound signal 274 which is a digital version of the test sound signal 270, the reference sound signal 274 having been generated once based on a given memory reference playback speed and a memory reference sampling rate. The test tone signal is played back at a variable test playback speed and sampled at a test sample rate to produce the test tone signal 270.
Die Einrichtung 210 zum Ermitteln des Maßes für die Testabspielgeschwindigkeit des Testtonsignals 270 steuert auf der Basis des Maßes für die Testabspielgeschwindigkeit die Einrichtung 230 zum Variieren. Die Einrichtung 230 zum Variieren wiederum steuert einen Referenz- bzw. Abtastratenkon- verter 232 und einen variablen Abtaster 234, wobei der Abtastratenkonverter 232 ausgebildet ist, aus dem Referenztonsignal, das auf der Speicherreferenzabspielgeschwindig- keit und einer Speicherreferenzabtastrate basiert, in ein modifiziertes Referenztonsignal 276 umzuwandeln, das einem Referenztonsignal entspricht, das auf einer anderen Spei- cherreferenzabspielgeschwindigkeit und/oder Speicherreferenzabtastrate basiert, und wobei der variable Abtaster 234 ausgebildet ist, das Testtonsignal mit einer variierten, also von der Standard- oder Grundabtastrate unterschiedli- chen, Abtastrate abzutasten, um ein modifiziertes Testtonsignal 272 zu erzeugen.The test-play-speed measurement means 210 of the test sound signal 270 controls the means 230 for varying on the basis of the test-playback-speed measurement. The means 230 for varying in turn controls a reference rate converter 232 and a variable sampler 234, wherein the sample rate converter 232 is configured to convert from the reference audio signal based on the memory reference playback speed and a memory reference sampling rate into a modified reference sound signal 276 which corresponds to a reference sound signal based on a different memory reference playback speed and / or memory reference sampling rate, and wherein the variable sampler 234 is adapted to sample the test sound signal at a varied sample rate different from the standard or basic sample rate to generate modified test tone signal 272.
Abweichend von Fig. 2b kann die Vorrichtung zum Durchführen einer Korrelation auch derart ausgebildet sein, dass das Testtonsignal 270 immer über den variablen Abtaster 234 der Einrichtung 250 zum Vergleichen zugeführt wird, wobei der variable Abtaster 234, dann derart ausgebildet ist, dass eine der variablen Testabtastraten der Standard- oder Grund-Abtastrate entspricht, und ferner ausgebildet sein, dass das Referenztonsignal 274 immer über den Referenzab- tastratenkonverter 232 der Einrichtung 250 zum Vergleichen zugeführt wird, wobei der Referenzabtastratenkonverter 232 derart ausgebildet ist, dass er bei entsprechender Ansteuerung durch die Einrichtung 230 zum Variieren das Referenz- tonsignal 274 unmodifiziert an die Einrichtung 250 zum Vergleichen weitergibt. Die in Fig. 2b gewählte Darstellung der getrennten Zuführung des Testtonsignals 270 gegenüber dem modifizierten Testtonsignals 272 und dem Referenztonsignal gegenüber dem modifizierten Referenztonsignals 276 zu der Einrichtung 250 zum Vergleichen, dient dazu, die alternativen Ausführungsmöglichkeiten bzw. Realisierungsmöglichkeiten darstellen zu können.In contrast to FIG. 2 b, the device for performing a correlation can also be designed in such a way that the test sound signal 270 is always supplied via the variable scanner 234 to the device 250 for comparison, wherein the variable sampler 234 is then designed such that one of the variables Test sampling rate of the standard or basic sampling rate, and further be formed that the reference sound signal 274 is always supplied via the Referenzabastratenkonverter 232 of the means 250 for comparison, wherein the Referenzabtastratenkonverter 232 is designed such that it is driven by the device 230 passes the reference tone signal 274 unmodified to the means 250 for comparison. The illustration selected in FIG. 2b of the separate supply of the test tone signal 270 relative to the modified test tone signal 272 and the reference tone signal relative to the modified reference tone signal 276 to the means 250 for comparison serves to be able to represent the alternative design possibilities or realization possibilities.
So ist beispielsweise in einem Ausführungsbeispiel, bei dem die Einrichtung 250 zum Vergleichen ausgebildet ist, das modifizierte Testtonsignal 272 mit dem nicht-modifizierten Referenzton-Signal 274 zu vergleichen, kein Referenzabtast- ratenkonverter 232 notwendig bzw. weist die Vorrichtung zum Durchführen einer Korrelation gemäß Fig. 2b keinen Refe- renzabtastratenkonverter 232 auf. Ebenso, weist eine Einrichtung 250 zum Vergleichen, die ausgebildet ist, das nicht-modifizierte Testtonsignal 270 mit dem modifizierten Referenztonsignal 246 zu vergleichen, keinen variablen Abtaster 234 auf.For example, in an embodiment in which the means 250 for comparing is adapted to compare the modified test sound signal 272 with the unmodified reference sound signal 274, no reference sampling rate converter 232 is necessary or the apparatus for performing a correlation according to FIG 2b does not include a reference sample rate converter 232. Likewise, a comparing means 250 configured to compare the unmodified test sound signal 270 with the modified reference sound signal 246 does not include a variable sampler 234.
In einem weiteren Ausführungsbeispiel ist die Einrichtung 280 zum Speichern eine Einrichtung zum Speichern einer Filminformation, wobei der gespeicherten Filminformation eine Zeitskala zugeordnet ist, und das Testtonsignal 270 beispielsweise ein Film-Tonsignal. Die Vorrichtung zumIn another embodiment, the means 280 for storing is a means for storing a movie information, wherein the stored movie information is associated with a time scale, and the test sound signal 270 is, for example, a movie sound signal. The device for
Durchführen einer Korrelation gemäß Fig. 2b kann dann beispielsweise als Einrichtung zum Vergleichen 160 gemäß Fig. 1 eingesetzt werden.Performing a correlation according to FIG. 2b can then be used, for example, as a means for comparing 160 according to FIG.
Fig. 2c.1 zeigt einen Abschnitt eines beispielhaften Films 110 mit einer Tonspur 114, wie in Fig. 1 zuvor beschrieben. In Fig. 2c.1 sind zwei Stellen des Films 110 eingezeichnet, eine erste Stelle, im Weiteren als Stelle Li bezeichnet, und eine zweite Stelle, im Weiteren als Stelle L2 bezeich- net. Die zwei Stellen Li und L2 definieren einen Abschnitt auf dem Film 110, der eine Länge von ΔL = Li - L2 aufweist. Fig. 2c.2 zeigt einen beispielhaften Verlauf des Testtonsignals, das dem in Fig. 2c.1 beschriebenen Abschnitt zwischen der Stelle Li und L2 zugeordnet ist, wobei ferner der Zeitpunkt zu dem die Stelle Li des Films abgespielt wird, als Zeitpunkt Ti bezeichnet wird, und der Zeitpunkt, zu dem die Stelle L2 des Films abgespielt wird, als Zeitpunkt T2 bezeichnet wird. Die Zeitdauer ΔT = Ti - T2 ist abhängig von der Länge des betreffenden Abschnitts und der Abspielgeschwindigkeit v des Films, es gilt:Fig. 2c.1 shows a portion of an exemplary film 110 having a soundtrack 114 as previously described in Fig. 1. In FIG. 2c.1, two locations of the film 110 are shown, a first location, hereinafter referred to as location Li, and a second location, hereinafter referred to as location L 2 . The two locations Li and L 2 define a portion on the film 110 that has a length of ΔL = Li-L 2 . Fig. 2c.2 shows an exemplary course of the test sound signal, which is assigned to the section between the point Li and L 2 described in Fig. 2c.1, further wherein the time at which the point Li of the film is played, referred to as time Ti and the time at which point L 2 of the movie is played is referred to as time T 2 . The time duration ΔT = Ti - T 2 is dependent on the length of the relevant section and the playback speed v of the film, it applies:
ΔT = ΔL / v bzw.ΔT = ΔL / v or
T2 - Ti = (L2 - L1) / v.T 2 - Ti = (L 2 - L 1 ) / v.
Bei Abtastung des Testtonsignals mit der Abtastrate f = 1 / Δt, wobei Δt die Abtastperiode ist und ΔT = n • Δt gilt, kann das Testtonsignal als Folge von n + 1 Abtastwerten, wie beispielhaft in Fig. 2c.2 mit n = 10 gezeigt, dargestellt werden.When sampling the test tone signal at the sampling rate f = 1 / Δt, where Δt is the sampling period and ΔT = n • Δt, the test tone signal may be shown as a result of n + 1 samples, as exemplified in Fig. 2c.2 with n = 10 , being represented.
Beim Abspielen des Films mit einer Abspielgeschwindigkeit v und einer Abtastrate f = 1 / Δt wird der Filmabschnitt zwischen Li und L2 bzw. Ti und T2 beispielsweise in n Zeitabschnitte unterteilt bzw. durch n + 1 Abtastwerte dargestellt, wobei gilt:When the film is played back at a playback speed v and a sampling rate f = 1 / Δt, the film segment between Li and L 2 or Ti and T 2 is subdivided into n time segments or represented by n + 1 sample values, for example:
n = ΔL / (Δt • v) bzw. n = ΔL • f / v,n = ΔL / (Δt • v) or n = ΔL • f / v,
das heißt, die Anzahl der Abtastperioden bzw. Abtastwerte für einen gegebenen Filmabschnitt ΔL ist proportional zur Abtastrate f bzw. antiproportional zur Abtastperiode Δt und antiproportional zur Abspielgeschwindigkeit v. Anders ausgedrückt, bei einem Abschnitt konstanter Länge ΔL muss der Quotient „f / v" bzw. das Produkt „Δt • vλλ konstant sein, wenn n oder die Anzahl der Abtastwerte n+1 konstant sein soll. Ist in diesem Fall der erste Abtastwert gleich, so sind unter der zuvor genannten Bedingung auch die einzelnen Abtastwerte gleich. Entsprechend wird beim Erzeugen der gespeicherten Filminformation bzw. des Referenztonsignals bei einer Speicherabtastrate fspeicher und einer Speicherabspielgeschwindigkeit Vspeicher der gespeicherte Abschnitt der Filminformation bzw. des Testtonsignals beispielsweise durch nSpeicher + 1 Referenzabtastwerte dargestellt und gespeichert.that is, the number of sampling periods or samples for a given film section ΔL is proportional to the sampling rate f, or antiproportional to the sampling period Δt and antiproportion to the playback speed v. In other words, for a section of constant length ΔL, the quotient "f / v" or the product "Δt • v λλ must be constant if n or the number of samples n + 1 is to be constant." In this case, the first sample equal, then the individual samples are the same under the condition mentioned above. Accordingly, in generating the stored film information or the reference sound signal at a memory sampling fspeich r e and a memory playback speed Vspei c h he the stored portion of the film information and the test tone signal represented for example by N S p Eicher + 1 reference samples and stored.
Zur Veranschaulichung des Sachverhalts, zeigen die Fig. 2c.2 bis 2c.4 beispielhafte Abtastungen oder Speicherungen des Filmabschnitts zwischen der Stelle Li und der Stelle L2 für eine konstante Abtastrate f bzw. eine konstante Abtastperiode Δt und einer variablen Abspielgeschwindigkeit, wobei Fig. 2.c2 eine beispielhafte Abtastung oder Speicherung für eine erste Abspielgeschwindigkeit Vi zeigt, Fig. 2c.3 eine Abtastung oder Speicherung desselben Filmabschnitts bei einer zweiten Abspielgeschwindigkeit v2 zeigt, und Fig. 2c.4 eine Abtastung desselben Filmabschnitts für eine dritte Abtastgeschwindigkeit v3 zeigt. Dabei ist in diesem Bei- spiel vi halb so gross wie v2 und doppelt so gross wie V3: Vi = V2 / 2 und vi = 2 V3.To illustrate the situation, Figs. 2c.2 to 2c.4 show exemplary scans or storages of the film portion between the location Li and the location L 2 for a constant sampling rate f and a variable sampling rate Δt and a variable playback speed, respectively. 2.c2 an exemplary sampling or storage for a first playback speed Vi, Fig. 2c.3 sampling or storage of the same film portion at a second playback speed v 2, and Fig. 2c.4 a sample of the same film portion for a third scan speed V 3 shows. It is in this game accession vi half the size of v 2 and twice as large as V 3: V = V 2/2 and vi = 2 V3.
Alle drei in den Fig. 2c.2 bis 2c.4 dargestellten Tonsignale weisen denselben ersten Abtastwert an der Stelle L1 bzw. zum entsprechenden Zeitpunkt Ti auf. Daher wird entsprechend, wie in den Fig. 2c.2 bis 2c.4 beispielhaft dargestellt, die gespeicherte Bildinformation bzw. das Referenztonsignal in Fig. 2c.2 durch ru + 1 = 11 Abtastwerte dargestellt, in Fig. 2c.3 derselbe Filmabschnitt mit n2 + 1 = 6 Abtastwerten dargestellt, und in Fig. 2c.4 derselbe Filmabschnitt mit n3 + 1 = 21 Abtastwerten dargestellt.All three audio signals shown in FIGS. 2c.2 to 2c.4 have the same first sample at the point L 1 or at the corresponding time Ti. Therefore, as shown by way of example in FIGS. 2c.2 to 2c.4, the stored image information or the reference sound signal in FIG. 2c.2 is represented by ru + 1 = 11 sampling values, in FIG. 2c.3 the same film segment is shown n 2 + 1 = 6 samples, and in Fig. 2c.4 the same movie section is shown with n 3 + 1 = 21 samples.
Wie aus den Fig. 2c.2 bis 2c.4 ersichtlich ist, entspricht bei konstanter Abtastrate, eine Erhöhung der Abspielge- schwindigkeit v einer zeitlichen Stauchung des Tonsignals, d.h. eine Verdopplung der Abspielgeschwindigkeit vi aus Fig. 2c.2 führt wie in Fig. 2c.3 dargestellt zu einer Halbierung von T2 - Ti und n, und eine Reduzierung der Ab- Spielgeschwindigkeit v zu einer zeitlichen Streckung des Tonsignals, d.h. eine Halbierung der Abspielgeschwindigkeit vi aus Fig. 2c.2 führt wie in Fig. 2c.4 dargestellt zu einer Verdopplung von T2 ~ Ti und n.As can be seen from FIGS. 2c.2 to 2c.4, at a constant sampling rate, an increase in the playback speed v corresponds to a temporal compression of the audio signal, ie a doubling of the playback speed vi from FIG. 2c.2 results, as in FIG. 2c.3 shown to halve T 2 -Ti and n, and to reduce the Game speed v at a temporal extension of the audio signal, ie halving the playback speed vi of Fig. 2c.2 leads as shown in Fig. 2c.4 to a doubling of T 2 ~ Ti and n.
Die Fig. 2d.l und 2d.2 entsprechen im Wesentlichen den Fig. 2c.1 und 2c.2. Im Vergleich zu Fig. 2c.1 zeigt Fig. 2d.l zwei zusätzliche Stellen, die einen Suchabschnitt oder ein Suchfenster bezüglich des Films und der darauf aufgebrach- ten Filminformationen definieren, wobei eine erste Stelle des Suchfensters mit L0 bezeichnet wird, und eine zweite Stelle des Suchfensters mit L3 bezeichnet wird, wobei der Abschnitt zwischen der Stelle Lo und der Stelle L3 größer ist als der Abschnitt, der durch die Stellen Li und L2 de- finiert wird, bzw. es gilt ΔLFenster > ΔL mitFIGS. 2d.l and 2d.2 essentially correspond to FIGS. 2c.1 and 2c.2. Compared to FIG. 2c.1, FIG. 2d shows two additional locations which define a search section or a search window with respect to the film and the film information applied thereon, wherein a first location of the search window is denoted by L 0 , and one second location of the search window is denoted by L 3 , wherein the portion between the location Lo and the location L 3 is greater than the portion which is defined by the locations Li and L 2 , or ΔL fen s te r > ΔL with
ΔLFenster = L3 - L0 und ΔL = L2 - Li. Entsprechend wurde in Fig. 2d.2 zusätzlich zu Fig. 2c.2 der Zeitpunkt T0, der basierend auf einer gegebenen Abspielgeschwindigkeit den der Stelle Lo zugeordneten Zeitpunkt darstellt und der Zeit- punkt T3, der basierend auf einer gegebenen Abspielgeschwindigkeit den der Stelle L3 zugeordneten Zeitpunkt darstellt, hinzugefügt.Accordingly, in Fig. 2d.2, in addition to Fig. 2c.2, the time T 0 , which represents the time associated with the location Lo based on a given playback speed, has been determined to be ΔL window r = L 3 -L 0 and ΔL = L 2 and the time T 3 , which represents the time associated with the location L 3 based on a given playback speed.
Auf die Erzeugung der gespeicherten Filminformationen bzw. des Referenztonsignals und der zusätzlich gespeichertenOn the generation of the stored movie information or the reference sound signal and the additionally stored
Zeitskala übertragen, bedeutet dies, dass T0 beispielsweise den Zeitpunkt auf der Zeitskala definiert, der der Stelle Lo zugeordnet ist, der Zeitpunkt Ti den Zeitpunkt auf der Zeitskala definiert, der der Stelle Li, der Zeitpunkt T2 den Zeitpunkt auf der Zeitskala definiert, der der Stelle L2 und der Zeitpunkt T3 den Zeitpunkt auf der Zeitskala definiert, der der Stelle L3 auf dem Film zugeordnet ist.Transmit time scale, this means that T 0 defines, for example, the time on the time scale, which is assigned to the point Lo, the time Ti defines the time on the time scale that defines the point Li, the time T 2, the time on the time scale, the point L 2 and the time T 3 defines the time on the time scale associated with the point L 3 on the film.
Fig. 2d.3 entspricht der Fig. 2c.2.Fig. 2d.3 corresponds to Fig. 2c.2.
Im Folgenden soll anhand der Fig. 2d.2 bis 2d.4 ein prinzipieller Verlauf eines Vergleichs zweier Signale mittels Korrelation bzw. die Problematik einer variablen Abspielge- schwindigkeit bei einem Vergleich zweier Signale beispielhaft dargestellt und erläutert werden.In the following, based on FIGS. 2d.2 to 2d.4, a basic course of a comparison of two signals by means of correlation or the problem of a variable playback system will be explained. speed when comparing two signals are exemplified and explained.
Dabei stellt Fig. 2d.3 eine aktuell abgelesene einer auf den Film aufgebrachten Filminformation bzw. das Testtonsignal 270 dar und Fig. 2d.2 eine gespeicherte Filminformation bzw. ein Referenztonsignal dar, wobei in einem optimalen Fall, der hier durch die Fig. 2d.2 und Fig. 2d.3 darstellt ist, die Speicherabspielgeschwindigkeit und die Speicherab- tastrate, mit der das Referenztonsignal erzeugt wurde, mit der Äbspielgeschwindigkeit des Testtonsignals und der Abtastrate des Testtonsignals übereinstimmen bzw. wie zuvor gezeigt, der Quotient aus Speicherabtastrate fSpeicher und Speicherabspielgeschwindigkeit vSpeicher mit dem Quotient aus der Abtastrate für das Testtonsignal f und der Abspielgeschwindigkeit des Testtonsignals v übereinstimmen. In diesem Fall kann das Referenztonsignal bzw. ein Abschnitt des Referenztonsignals, der durch Ti und T2 definiert ist, mit dem Testtonsignal, das den Abschnitt zwischen Ti und T2 darstellt, genauer gesagt deren Abtastwertefolgen, exakt übereinstimmen, und mittels Korrelation ein klares lokales Maximum bzw. ein Korrelations-Peak gewonnen werden, wie dies beispielhaft in Fig. 2d.4 gezeigt ist.2d.3 represents a currently read film information or test tone signal 270 applied to the film, and FIG. 2d.2 represents a stored film information or a reference sound signal, wherein in an optimal case, shown here by FIGS 2 and 2d.3, the memory playback speed and the memory scan rate at which the reference sound signal was generated coincided with the playback speed of the test sound signal and the sampling rate of the test sound signal, and the quotient of memory sampling rate f memory and memory playback speed as previously shown v Spe i ch it with the quotient of the sampling rate f for the test tone signal and the playback speed of the test tone signal v match. In this case, the reference sound signal, or a portion of the reference sound signal defined by Ti and T 2 , may exactly match the test sound signal representing the portion between Ti and T 2 , more specifically the sample value sequences thereof, and a clear local one by correlation Maximum or a correlation peak are obtained, as shown by way of example in Fig. 2d.4.
Die Position des Peaks wiederum gibt die zeitliche Verschiebung des Testtonsignals gegenüber dem Referenztonsignal bzw. dem Suchfenster an. Darauf basierend kann dann der aktuelle Zeitpunkt bezüglich der gespeicherten Zeitskala bestimmt werden.The position of the peak in turn indicates the time shift of the test sound signal relative to the reference sound signal or the search window. Based on this, the current time with respect to the stored time scale can then be determined.
Die Fig. 2d.5 bis 2d.8 zeigen im Unterschied zu den Fig. 2d.l zu 2d.4 ein Beispiel, bei dem die Abspielgeschwindigkeit des Testtonsignals, dargestellt in Fig. 2d.7 gegenüber der Abspielgeschwindigkeit des Testtonsignals, wie es in Fig. 2d.2 gezeigt wird, verringert ist.FIGS. 2d.5 to 2d.8, in contrast to FIGS. 2d.l to 2d.4, show an example in which the playback speed of the test sound signal shown in FIG. 2d.7 is compared with the playback speed of the test sound signal, as shown in FIG Fig. 2d.2 is shown is reduced.
Fig. 2d.5 entspricht der Fig. 2d.l. Fig. 2d.6 entspricht der Fig. 2d.2, das heißt, Fig. 2d.6 stellt einen beispiel- haften Verlauf eines Referenztonsignals dar, das auf einer Speicherabtastrate fSpeicher und einer Speicherabspielgeschwindigkeit vSpeicher basiert. Fig. 2d.7 zeigt einen beispielhaften Verlauf bzw. eine beispielhafte Abtastung des Testtonsignals, basierend auf einer gegenüber 2d.3 bzw.Fig. 2d.5 corresponds to Fig. 2d.l. Fig. 2d.6 corresponds to Fig. 2d.2, that is, Fig. 2d.6 represents an exemplary represents a progression of a reference sound signal, which is based on a memory sampling rate f Sp ei c forth and a memory playback speed v S peich e r. Fig. 2d.7 shows an exemplary course or exemplary sampling of the test sound signal, based on a comparison with 2d.3 or
Fig. 2d.6 unveränderten Testabtastrate f jedoch einer veränderten, reduzierten Abspielgeschwindigkeit v' des Testtonsignals.Fig. 2d.6 unchanged test sample rate f, however, a changed, reduced playback speed v 'of the test sound signal.
Bezogen auf einen betrachteten Zeitabschnitt ΔT bedeutet dies, dass in dem gleichen Zeitabschnitt ΔT bei einer reduzierten Geschwindigkeit v' nur ein geringerer Abschnitt bzw. ein Abschnitt geringerer Länge Δl/ gemäß Δl/ = v' ΔT von dem Film abgespielt wird, so dass bezo- gen auf den gerade abgespielten Film nach dem Zeitabschnitt ΔT nur eine Stelle L' 2, die vor der Stelle L2 liegt, erreicht wird, wie dies in Fig. 2d.5 dargestellt ist. Bezogen auf das Referenztonsignal und der diesem zugeordneten Zeitskala ist der Stelle L' 2 der Zeitpunkt T' 2 der Zeitskala zugeordnet, wie dies in Fig. 2d.7 gezeigt wird.Based on a considered period of time ΔT, this means that in the same time segment ΔT at a reduced speed v 'only a smaller portion or a portion of lesser length Δl / is played back from the film according to Δl / = v' ΔT - gen on the currently playing film after the period .DELTA.T only one point L ' 2 , which lies in front of the point L 2 is reached, as shown in Fig. 2d.5. Relative to the reference sound signal and the time scale associated therewith, the point L '2 is assigned the time T' 2 of the time scale, as shown in FIG. 2d.7.
Bezogen auf die einzelnen Abtastwerte des Testtonsignals bedeutet dies, dass der durch die Tonspur des Films vorgegebene „räumliche" Verlauf des Testtonsignals unveränder- lieh ist, so dass bei einer geringeren Abspielgeschwindigkeit v' eine Abtastperiode Δt bzw. ein entsprechender räumlicher Abtastabschnitt Δl' entspricht, der kleiner ist als Δl, so dass, wie dies in Fig. 2d.7 gegenüber Fig. 2d.6 dargestellt ist, die Abtastwerte des Testtonsignals bezüglich des „räumlichen" Signalverlaufs nach links „wandern".With reference to the individual samples of the test sound signal, this means that the "spatial" course of the test sound signal given by the soundtrack of the film is unchangeable, so that at a lower playback speed v 'a sampling period Δt or a corresponding spatial sampling section Δl' corresponds. which is smaller than Δl, so that, as shown in Fig. 2d.7 compared to Fig. 2d.6, the samples of the test sound signal with respect to the "spatial" waveform to the left "wander".
In dem entgegengesetzten Fall, dass die veränderte Abspielgeschwindigkeit v' größer ist als die Speicherabspielgeschwindigkeit vspeicher/ ergibt sich der umgekehrte Fall, im gleichen Zeitabschnitt Δt wird ein größerer räumlicher Ab¬ schnitt Δl abgespielt, so dass die Abtastwerte des Testtonsignals auf dem „räumlichen" Verlauf des Testtonsignals nach „rechts" auf dem Signalverlauf „wandern". Bei einer veränderten Abspielgeschwindigkeit, unabhängig davon, ob sie höher oder niedriger als die Speicherabspielgeschwindigkeit ist, verschlechtert sich damit das Ergebnis des Vergleichs, da selbst unter sonst optimalen Bedingungen, das Testtonsignal und das Referenztonsignal zwei verschiedene räumliche Abschnitte des Films wiedergeben. Das Ergebnis des Vergleichs wird umso schlechter, je .größer die Abweichung der Speicherabspielgeschwindigkeit von der Test- abspielgeschwindigkeit abweicht. Bei einem Vergleich mittels Korrelation nimmt dabei der Betrag des lokalen Maximums bzw. Peaks ab und das Maximum selbst wird dadurch beispielsweise breiter und flacher, so dass die Zeitpunktbestimmung bezüglich der Zeitskala immer ungenauer wird, bis sie nicht mehr möglich ist.In the opposite case that the changed playback speed v 'is greater than the memory playback speed vsp e i cher / the opposite case occurs, in the same time interval Δt a larger spatial Ab ¬ cut Δl is played, so that the samples of the test sound signal on the " spatial "course of the test sound signal to" right "on the waveform" wander ". At a modified playback speed, whether higher or lower than the memory playback speed, the result of the comparison will be degraded, since, even under otherwise optimal conditions, the test sound signal and the reference sound signal represent two different spatial sections of the film. The greater the deviation of the memory playback speed from the test playback speed, the worse the result of the comparison. In the case of a comparison by means of correlation, the magnitude of the local maximum or peak decreases and the maximum itself becomes wider and flatter, for example, so that the time determination with respect to the time scale becomes increasingly inaccurate until it is no longer possible.
Unter realen Bedingungen variiert die Abspielgeschwindigkeit des Testtonsignals beispielsweise nicht nur zwischen verschiedenen Filmabspielgeräten, sondern kann auch während eines Films variieren. Eine exakte Nachsteuerung ist daher unerlässlich, um während eines gesamten Films Synchronität zu gewährleisten.For example, under real-world conditions, the playback speed of the test tone signal will not only vary between different movie players, but may vary during a movie. Accurate tracking is essential to ensure synchrony throughout an entire movie.
Die Vorrichtung zum Durchführen einer Korrelation variiert daher die Abtastrate des Testtonsignals oder die Abtastrate des Referenztonsignals, um den nachteiligen Effekt einer variablen Ablaufgeschwindigkeit des Testtonsignals, wie er zuvor beschrieben wurde, gemäß der zuvor beschriebenen Bedingung, dass der Quotient aus Abtastrate und Abspielge- schwindigkeit des Testtonsignals und des Referenztonsignals gleich groß sein müssen, um den gleichen Filmabschnitt mit den gleichen Abtastwerten darzustellen, zu minimieren.Therefore, the means for performing a correlation varies the sampling rate of the test sound signal or the sampling rate of the reference sound signal to detect the adverse effect of a variable sampling rate of the test sound signal as described above according to the above-described condition that the quotient of sampling rate and playback speed of the Test sound signal and the reference sound signal must be equal to minimize, to represent the same film section with the same samples.
Bei einem digitalen Referenztonsignal, das zuvor mit einer Speicherabtastrate erzeugt wurde, wird die Änderung der Abspielgeschwindigkeit durch eine Abtastratenkonversion bewirkt, wobei das gespeicherte Referenztonsignal 274 beispielsweise entsprechend interpoliert wird, um ein Refe- renztonsignal mit der Abtastrate zu erzeugen, das der geänderten Abspielgeschwindigkeit entspricht.For a reference digital audio signal previously generated at a memory sampling rate, the change in playback speed is effected by sample rate conversion, where the stored reference sound signal 274 is appropriately interpolated, for example, to obtain a reference rate. to generate the renztonsignal at the sample rate corresponding to the changed playback speed.
Die Fig. 2d.l - 2d.8 stellen vereinfachte Beispiele dar, bei denen der Anschaulichkeit halber davon ausgegangen wurde, dass die Speicherabspielgeschwindigkeit vSpeicher einer normalen bzw. üblichen Abspielgeschwindigkeit eines Abspielgerätes zum Erzeugen eines Testtonsignals entspricht. Wie zuvor erläutert, ist jedoch der Quotient aus Abtastrate f und der Abspielgeschwindigkeit v die Größe, die für das Referenztonsignal und das Testtonsignal gleich sein müssen, um wie zuvor dargestellt, denselben Abschnitt des Films mit denselben Abtastwerten darstellen zu können. Beispielsweise kann bei dem Erzeugen des Referenztonsignals auch eine dop- pelte Abspielgeschwindigkeit genutzt werden, wenn gleichzeitig die Abtastrate verdoppelt wird.FIG 2d.l -. 2d.8 illustrate simplified examples in which the clarity sake was assumed that the memory playback speed v Spe Icher a normal or usual playback speed of a playback device corresponding to generate a test tone signal. As previously discussed, however, the quotient of sample rate f and playback speed v is the magnitude that must be the same for the reference sound signal and the test sound signal to represent the same portion of the film with the same samples as previously indicated. For example, when generating the reference sound signal, a double playback speed can also be used if the sampling rate is doubled at the same time.
In einem Ausführungsbeispiel gemäß Fig. 2b, kann die Einrichtung 210 zum Ermitteln, basierend auf dem Ergebnis 278 der Korrelation ein Maß für eine Testabspielgeschwindigkeit ermitteln.In one embodiment of FIG. 2b, the means 210 for determining may determine a measure of a test playing speed based on the result 278 of the correlation.
Eine Möglichkeit besteht darin, ein einzelnes Korrelationsergebnis für die Bestimmung eines Maßes der Abspielge- schwindigkeit heranzuziehen, indem beispielsweise eine Amplitude eines Peaks mit einem vorgegebenen Schwellwert verglichen wird, um zu ermitteln, ob eine Abweichung zwischen einer Abspielgeschwindigkeit eines Testtonsignals und eines Referenztonsignals in einem vorgegeben Bereich liegt.One possibility is to use a single correlation result for the determination of a measure of the playback speed, for example, by comparing an amplitude of a peak with a predetermined threshold to determine whether a deviation between a playback speed of a test sound signal and a reference sound signal in a given Area is located.
Bei einem bevorzugten Ausführungsbeispiel werden mindestens zwei verschiedene Referenztonsignale, die auf verschiedenen Referenzabtastraten basieren bzw. verschiedenen Referenzabspielgeschwindigkeiten entsprechen, mit dem Testtonsignal verglichen, um die Ergebnisse der Korrelation beispielsweise mittels einer Qualitätsbeurteilung, die bezüglich Fig. 5 noch näher erläutert wird, zu vergleichen, um aus diesen ein ähnlichstes Referenztonsignal und damit basierend auf der bekannten Abtastrate und der bekannten Speicherabspielgeschwindigkeit ein Maß für die Abspielgeschwindigkeit des Testtonsignals zu bestimmen. Dabei können die verschiedenen Referenztonsignale nacheinander gebildet und mit dem Test- tonsignal verglichen werden oder gleichzeitig gebildet und verglichen werden.In a preferred embodiment, at least two different reference sound signals, based on different reference sampling rates and corresponding to different reference playback speeds, are compared to the test sound signal to compare the results of the correlation, for example by means of a quality assessment, which will be explained in more detail with reference to FIG from these a most similar reference sound signal and thus based on the known sampling rate and the known memory playback speed to determine a measure of the playback speed of the test sound signal. In this case, the different reference sound signals can be formed one after the other and compared with the test sound signal or simultaneously formed and compared.
Ein besonders bevorzugtes Ausführungsbeispiel der. Vorrichtung zum Durchführen einer Korrelation erzeugt drei Refe- renztonsignale, die auf verschiedenen Referenzabtastraten basieren, wobei das Referenztonsignal der mittleren der drei Abtastraten auf der Referenzabtastrate des Referenztonsignals basiert, das in einem vorhergehenden Vergleich die beste Qualität bzw. maximale Übereinstimmung mit dem Testtonsignal aufwies, und die zwei anderen Referenztonsignale jeweils eine Referenzabtastrate die höher oder niedriger als die Referenzabtastrate des mittleren Referenztonsignals bzw. Referenzabtastrate ist, aufweisen. Dies wird von der Einrichtung 230 zum Variieren auf der Basis eines Ausgangssignals der Einrichtung 210 zum Ermitteln des Maßes für die Testabspielgeschwindigkeit gesteuert. So ist gewährleistet, dass die Referenzabtastrate bzw. die Referenzabspielgeschwindigkeit des Referenztonsignals an die Abspielgeschwindigkeit bzw. Referenzabtastrate des Testton- Signals angepasst wird.A particularly preferred embodiment of. Apparatus for performing a correlation produces three reference tone signals based on different reference sample rates, the reference tone signal of the middle of the three sample rates being based on the reference sample rate of the reference tone signal having the best quality or maximum match with the test tone signal in a previous comparison, and the two other reference sound signals each have a reference sampling rate higher or lower than the reference sampling rate of the mean reference sound signal and reference sampling rate, respectively. This is controlled by the means 230 for varying on the basis of an output of the means 210 for determining the measure of the test playing speed. This ensures that the reference sampling rate or the reference playback speed of the reference sound signal is matched to the playback speed or reference sampling rate of the test tone signal.
Fig. 3a zeigt einen beispielhaften Film, wie in Fig. 8 dargestellt, und ein prinzipielles Blockschaltbild einer Vorrichtung zum Ermitteln einer Stelle in dem Film.Fig. 3a shows an exemplary film as shown in Fig. 8 and a principal block diagram of a device for detecting a location in the film.
Das in Fig. 3a gezeigte Ausführungsbeispiel der Vorrichtung zum Ermittlen einer Stelle in einem Film kann beispielsweise in einer Vorrichtung zum Erzeugen eines Steuersignals für ein Filmereignissystem, wie es beispielsweise in Fig. 1 gezeigt ist, als Einrichtung 180 zum Ermitteln des Steuersignals eingesetzt werden. Die Vorrichtung zum Ermitteln einer Stelle in einem Film weist einen Speicher 320 zum Speichern einer Referenzfingerabdruckdarstellung der Filminformation auf, wobei die Fingerabdruckdarstellung so ausgebildet ist, dass ein zeit- licher Verlauf der Fingerabdruckdarstellung von einem zeitlichen Verlauf der Filminformation abhängt, und wobei einer gespeicherten Referenzfingerabdruckdarstellung eine Zeitskala zugeordnet ist, eine Einrichtung 340 zum Empfangen eines von dem Film gelesenen Abschnitts aufweist, eine Ein- richtung 350 zum Extrahieren einer Testfingerabdruckdarstellung aus dem eingelesenen Abschnitt und eine Einrichtung 360 zum Vergleichen der Testfingerabdruckdarstellung mit der Referenzfingerabdruckdarstellung aufweist, um auf der Basis des Vergleichs und der Zeitskala die Stelle in dem Film zu ermitteln.The embodiment of the device for detecting a position in a film shown in FIG. 3a can be used, for example, in a device for generating a control signal for a film event system, as shown for example in FIG. 1, as device 180 for determining the control signal. The device for determining a position in a film has a memory 320 for storing a reference fingerprint representation of the film information, wherein the fingerprint representation is designed so that a time course of the fingerprint representation depends on a temporal course of the film information, and wherein a stored reference fingerprint representation is a Time scale, having means 340 for receiving a portion read from the film, means 350 for extracting a test fingerprint representation from the read portion, and means 34 for comparing the test fingerprint representation with the reference fingerprint representation, on the basis of the comparison and the time scale to determine the location in the movie.
Bei einem bevorzugten Ausführungsbeispiel umfasst die Fingerabdruckdarstellung eine Darstellung in Form einer spektralen Flachheit, wobei ein zeitlicher Verlauf der Fingerab- druckdarstellung einen zeitlichen Verlauf der spektralen Flachheit umfasst.In a preferred embodiment, the fingerprint representation comprises a representation in the form of a spectral flatness, wherein a time profile of the fingerprint representation comprises a temporal profile of the spectral flatness.
Fig. 3b.1 zeigt einen beispielhaften Film 110, wie in Fig. 8 dargestellt. Dabei entsprechen beispielsweise einer Stel- Ie Lioo des Films bei einem Abspielen des Films mit einer gegebenen Abspielgeschwindigkeit der Zeitpunkt Tioo der Zeitskala, der Stelle L103 der Zeitpunkt T103 der Zeitskala, der Stelle L113, die der Zeitpunkt Tn3 der Zeitskala und der Stelle L116 der dem Zeitpunkt Tue der Zeitskala.Fig. 3b.1 shows an exemplary film 110 as shown in Fig. 8. In this case, for example, a position of the film when playing the film at a given playback speed corresponds to the time Tioo of the time scale, the point L 103 to the time T 103 of the time scale, the point L 113 , the time Tn 3 of the time scale and the Place L1 1 6 the time Tue the time scale.
Bei dem Schritt des Erzeugens der Referenzfingerabdruckdarstellung der Filminformation wird in einem Ausführungsbeispiel für bestimmte räumliche bzw. zeitliche Abschnitte des Films ein Fingerabdruck bestimmt.In the step of generating the reference fingerprint representation of the movie information, in one embodiment, a fingerprint is determined for particular spatial and temporal portions of the film.
Fig. 3b.2 zeigt beispielsweise einen ersten Abschnitt, der den Abschnitt von der Stelle LχOo bis Ln3 bzw. Ti00 bis Ti13 umfasst, und einen zweiten Abschnitt, der den Abschnitt von der Stelle LχO3 bis zu der Stelle Lu3 bzw. von dem Zeitpunkt Tχo3 bis zu dem Zeitpunkt Tn6 umfasst. Basierend auf diesen Abschnitten wird auf der Basis von beispielsweise einer Spektralanalyse, Fourier-Transformation oder anderen Metho- den der Merkmalsextraktion ein diesem Abschnitt zugeordneter Fingerabdruck erstellt. In einem besonders bevorzugten Ausführungsbeispiel umfasst der Fingerabdruck die spektrale Flachheit γx 2, die aus dem Verlauf des Leistungsdichtespektrums berechnet wird, so dass für jeden Abschnitt der Wert der spektralen Flachheit bestimmt wird, und sich in Abhängigkeit von dem zeitlichen Verlauf der Filminformationen, beispielsweise des Tonsignals, eine Folge von spektralen Flachheiten ergibt, die in dem Speicher 320 mit der zugeordneten Zeitskala gespeichert werden.For example, FIG. 3b.2 shows a first section comprising the section from the point Lχ O o to Ln 3 and Ti 00 to Ti 13 , respectively, and a second section comprising the section of FIG the point Lχ O 3 up to the point Lu 3 or from the time Tχo3 to the time Tn 6 includes. Based on these sections, a fingerprint associated with this section is created based on, for example, spectral analysis, Fourier transformation, or other feature extraction methods. In a particularly preferred embodiment, the fingerprint comprises the spectral flatness γ x 2 , which is calculated from the course of the power density spectrum, so that the value of the spectral flatness is determined for each section, and depending on the time course of the film information, for example Sound signal, a sequence of spectral flatness, which are stored in the memory 320 with the associated time scale.
Abtastrate, Länge bzw. Dauer des Abschnitts oder der Abstand zwischen zwei aufeinander folgenden Abschnitten werden entsprechend der Anforderungen beispielsweise bzgl. Eindeutigkeit oder Genauigkeit der Bestimmung der Stelle in dem Film bestimmt. Je länger der Abschnitt desto eindeutiger ist die Ausprägung des Merkmals im allgemeinen, je höher die Abtastrate und/oder je geringer der Abstand zwischen zwei Abschnitten, desto genauer kann die Stelle im Film bestimmt werden. Je höher die Abtastrate, je länger die Abschnitte und je geringer die Abstände zwischen denSampling rate, length or duration of the section, or the distance between two consecutive sections are determined according to the requirements for, for example, uniqueness or accuracy of determining the location in the film. The longer the section, the clearer the feature's feature in general, the higher the sampling rate and / or the smaller the distance between two sections, the more accurately the location in the movie can be determined. The higher the sampling rate, the longer the sections and the smaller the distances between them
Abschnitten, desto höher ist der Speicherbedarf für das Referenzsignal bzw. die Anforderung an die Rechenleistung bei der Signalverarbeitung.Sections, the higher the memory requirement for the reference signal or the request for the processing power in the signal processing.
Ein wesentlicher Vorteil der Fingerabdruckdarstellung in Form der spektralen Flachheit ist ihr geringer Speicherbedarf gegenüber beispielsweise einer kompletten Speicherung des Leistungsdichtespektrums für einen gleichen Abschnitt. Bevorzugt wird ein Verlauf bzw. eine Folge von spektralen Flachheiten als Fingerabdruck für einen Abschnitt verwendet. Fig. 4a zeigt einen beispielhaften Film 110, wie in Fig. 8 dargestellt, sowie eine Vorrichtung zum Ermitteln einer Stelle in einem Film, der in einer zeitlichen Folge aufgebrachte Filminformationen aufweist.A significant advantage of the fingerprint representation in the form of the spectral flatness is its small memory requirement compared to, for example, a complete storage of the power density spectrum for a same section. Preferably, a trace of spectral flatness is used as a fingerprint for a portion. Figure 4a shows an exemplary film 110, as shown in Figure 8, and a device for detecting a location in a film having film information applied in a temporal sequence.
Das in Fig. 4a gezeigte Ausführungsbeispiel der Vorrichtung zum Ermittlen einer Stelle in einem Film kann beispielsweise in einer Vorrichtung zum Erzeugen eines Steuersignals für ein Filmereignissystem, wie es beispielsweise in Fig. 1 gezeigt ist, als Einrichtung 180 zum Ermitteln des Steuersignals eingesetzt werden.The embodiment of the device for detecting a position in a film shown in FIG. 4a can be used, for example, in a device for generating a control signal for a film event system, as shown for example in FIG. 1, as device 180 for determining the control signal.
Die Vorrichtung zum Ermitteln einer Stelle weist einen Speicher 420 zum Speichern von Filminformationen, die auf einem Film in zeitlicher Folge aufgebracht sind, auf, wobei den gespeicherten Filminformationen eine Zeitskala zugeordnet ist, eine Einrichtung 440 zum Empfangen eines von dem Film gelesenen Abschnitts und eine Synchronisationseinrichtung 460 auf, die ausgebildet ist, eine Folge von Abtast- werten des gelesenen Abschnitts, denen eine erste Abtastrate zugrunde liegt, und ein erstes Suchfenster der gespeicherten Filminformationen zu vergleichen, um ein Grobergebnis zu erhalten, und um eine Folge von Abtastwerten des gelesenen Abschnitts, dem eine zweite Abtastrate zugrunde liegt, und ein zweites Suchfenster der gespeicherten Filminformationen zu vergleichen, um ein Feinergebnis zu erhalten, das auf die Stelle des Films hinweist, wobei eine Position des zweiten Suchfensters in der gespeicherten Filminformation von dem Grobergebnis abhängt, und wobei das erste Suchfenster zeitlich länger als das zweite Suchfenster ist und wobei ferner die erste Abtastrate niedriger als die zweite Abtastrate ist.The means for determining a location includes a memory 420 for storing film information deposited on a film in sequence, with a time scale associated with the stored movie information, means 440 for receiving a portion read from the film, and synchronization means 460 configured to compare a sequence of samples of the read portion underlying a first sampling rate and a first search window of the stored film information to obtain a coarse result, and a sequence of samples of the read portion; which is based on a second sampling rate and a second search window of the stored film information to obtain a fine result indicative of the location of the film, wherein a position of the second search window in the stored film information depends on the coarse result, and wherein the first Search window time l I is longer than the second search window, and further wherein the first sample rate is lower than the second sample rate.
Fig. 5a zeigt einen beispielhaften Film 110, wie in Fig. 8 dargestellt, sowie eine bevorzugtes Ausführungsbeispiel einer Vorrichtung zum Erzeugen eines Steuersignals für ein Filmereignissystem, das ausgebildet ist, auf der Basis einer auf dem Film aufgebrachten analogen Tonspur einen von dem Film gelesenen Abschnitt des Audiosignals bzw. Testtonsignals und einer gespeicherten, digitalen Version des Testtonsignals, im weiteren als Referenztonsignal bezeichnet, dem eine Zeitskala zugeordnet ist, durch Vergleichen des Testtonsignals und des Referenztonsignals mittels der Zeitskala das Steuersignal zu ermitteln.FIG. 5a shows an exemplary film 110, as shown in FIG. 8, as well as a preferred embodiment of a device for generating a control signal for a movie event system that is formed based on an analog soundtrack applied to the film the film read portion of the audio signal or test tone signal and a stored digital version of the test sound signal, hereinafter referred to as reference sound signal, which is associated with a time scale to determine the control signal by comparing the test sound signal and the reference sound signal by means of the time scale.
Fig. 5a zeigt ein bevorzugtes Ausführungsbeispiel einer Vorrichtung zum Erzeugen eines Steuersignals für ein FiIm- ereignissystem, das einen ersten Filmtonabtaster 542 aufweist, der mit einem ersten A/D-Wandler 544 verbunden ist (A/D = Analog/Digital), wobei der erste A/D-Wandler 544 mit einem ersten Merkmals-Extraktor 552, mit einer ersten Einrichtung 562 für eine Korrelation mit einem ersten Refe- renztonsignal, das auf einer ersten Abtastrate basiert, mit einer zweiten Einrichtung 564 für eine Korrelation mit einem zweiten Referenztonsignal, das auf einer zweiten Abtastrate basiert, und mit einer dritten Einrichtung 566 für eine Korrelation mit einem dritten Referenztonsignal, das auf einer dritten Abtastrate basiert, verbunden ist, wobei die Abtastrate im Englischen auch als sample rate bezeichnet wird. Ein Eingang der ersten Einrichtung 562 für eine Korrelation, ein Eingang einer zweiten Einrichtung 564 für eine Korrelation und ein Eingang der dritten Einrichtung 566 für eine Korrelation sind mit einem Ausgang eines Abtastratenkonverters 232, der im Englischen als sample rate Converter (SRC) bezeichnet wird, verbunden.5a shows a preferred embodiment of an apparatus for generating a control signal for a motion event system, comprising a first film sound sampler 542 connected to a first A / D converter 544 (A / D = analogue / digital), wherein the first A / D converter 544 having a first feature extractor 552, first means 562 for correlation with a first reference tone signal based on a first sampling rate, second means 564 for correlation with a second reference tone signal, which is based on a second sampling rate and connected to a third means 566 for correlation with a third reference sound signal based on a third sampling rate, the sampling rate also being called a sample rate. An input of the first means 562 for correlation, an input of a second means 564 for correlation, and an input of the third means 566 for correlation are coupled to an output of a sample rate converter 232, referred to as a sample rate converter (SRC). connected.
Ein Ausgang der ersten Einrichtung 562 für eine Korrelati- on, ein Ausgang der zweiten Einrichtung 564 für eine Korrelation und ein Ausgang der dritten Einrichtung 566 für eine Korrelation sind mit einem Eingang einer ersten Einrichtung 568 zur Qualitätsbeurteilung verbunden. Die Einrichtung 568 zur Qualitätsbeurteilung wiederum ist mit dem Abtastraten- konverter 232 und einer Einrichtung 570 zur Abtasterwahl gekoppelt, wobei ein Ausgang der Einrichtung 570 zur Abtasterwahl mit einem Eingang eines Zeitgebers 582 verbunden ist. Der Zeitgeber 582 wiederum ist mit der gespeicherten Tonspur bzw. einer Einrichtung 522 zum Speichern der Tonspur verbunden, wobei ein Ausgang der Einrichtung 522 zum Speichern der Tonspur mit einem Eingang des Abtastratenkonverters 232 verbunden ist.An output of the first means 562 for correlation, an output of the second means 564 for correlation and an output of the third means 566 for correlation are connected to an input of a first means 568 for quality assessment. The quality assessment device 568 in turn is coupled to the sample rate converter 232 and to a sampler selection means 570, an output of the sampler selection means 570 being connected to an input of a timer 582. The timer 582 in turn is stored with the An audio track device 522 is connected to an input of the sample rate converter 232 for storing the audio track.
Ein Ausgang des ersten Merkmals-Extraktors 552 ist mit einem Eingang einer Einrichtung 554 zum Vergleichen eines Merkmals, die beispielsweise einen Merkmals-Klassifikator und eine Datenbank von Merkmalen aufweist, verbunden, wobei ein Ausgang der Einrichtung 554 zum Vergleichen eines Merkmals mit einem Eingang des Zeitgebers 582 verbunden ist.An output of the first feature extractor 552 is connected to an input of a feature comparison device 554 having, for example, a feature classifier and a database of features, an output of the feature comparison device 554 having an input of the timer 582 is connected.
Ein Ausgang des Zeitgebers 582 ist mit einem Eingang einer Einrichtung 584 zur Zeitcodeerzeugung gekoppelt, die eine Zeitcodedatenbank aufweist oder mit einer Zeitcodedatenbank gekoppelt ist, wobei ferner ein Ausgang der Einrichtung 584 zur Zeitcodeerzeugung mit einem Eingang einer Einrichtung 586 zum Zeitcodeglätten verbunden ist, wobei die Einrichtung 586 zum Zeitcodeglätten ausgebildet ist, einen Zeitco- de 592 auszugeben, und wobei ferner ein Ausgang der Einrichtung 586 zum Zeitcodeglätten mit einem Eingang eines Wordclock-Generators 588 verbunden ist, der wiederum ausgebildet ist, ein Wordclock-Signal 594 auszugeben.An output of the timer 582 is coupled to an input of a time code generation means 584 having a time code database or coupled to a time code database, and an output of the time code generation means 584 is connected to an input of a time code slicer 586, the means 586 is adapted to output a time code 592, and wherein an output of the time code smoothing means 586 is connected to an input of a word clock generator 588, which in turn is adapted to output a word clock signal 594.
Die Vorrichtung zum Erzeugen eines Steuersignals für ein Filmereignissystem weist optional ferner einen zweiten Filmtonabtaster 542' auf, der mit einem zweiten A/D-Wandler 544' verbunden ist, wobei der zweite A/D-Wandler 544' mit einem zweiten Merkmalsextraktor 552' , mit einer vierten Einrichtung 562' für eine Korrelation mit einem vierten Referenztonsignal, das auf der ersten Abtastrate basiert, mit einer fünften Einrichtung 564' für eine Korrelation mit einem fünften Referenztonsignal, das auf der zweiten Abtastrate basiert, und mit einer sechsten Einrichtung 566' für eine Korrelation mit einem sechsten Referenztonsignal, das auf der dritten Abtastrate verbunden ist. Ein Ausgang der vierten Einrichtung 562' für eine Korrelation, ein Ausgang der fünften Einrichtung 564' für eine Korrelation und ein Ausgang der sechsten Einrichtung 566' für eine Korrelation sind mit einem Eingang einer zweiten Einrichtung 568' zur Qualitätsbeurteilung verbunden, wobei ein Ausgang der zweiten Einrichtung 568' zur Qualitätsbeurteilung mit einem Offset-Ausgleich 569 und ein weiterer Ausgang mit einem Eingang des Abtastratenkonverters 232 verbunden ist, und wobei ferner der die Einrichtung zum Offset-Ausgleich 569 mit der Abtasterwahl 570 verbunden ist.The apparatus for generating a control signal for a film event system optionally further comprises a second film sound sampler 542 'connected to a second A / D converter 544', the second A / D converter 544 'having a second feature extractor 552', with a fourth means 562 'for correlation with a fourth reference sound signal based on the first sampling rate, with a fifth means 564' for correlation with a fifth reference sound signal based on the second sampling rate, and with a sixth means 566 'for a correlation with a sixth reference sound signal connected at the third sampling rate. An output of the fourth means 562 'for correlation, an output of the fifth means 564' for a correlation and an output of the sixth means 566 'for a correlation are connected to an input of a second means 568' for quality evaluation, wherein an output of the second Further, means 568 'for quality evaluation is connected to an offset compensation 569 and another output is connected to an input of the sample rate converter 232, and further wherein the means for offset compensation 569 is connected to the sample selection 570.
Dabei wird der erste Filmtonabtaster 542, der auch als Hauptabtaster bezeichnet wird, so positioniert, dass der Vorrichtung zum Erzeugen eines Steuersignals genug Zeit bleibt, sich aufzusynchronisieren. Der erste Filmtonabtaster 542 liefert also ein vorverzögertes Signal. Zur Aufsynchronisationszeit addiert sich noch die Korrelationsfensterbreite bzw. Breite des Abschnitts des Testtonsig- nals. Anhand der Perforationen auf der Filmrolle lässt sich die Zeitdifferenz für die Vorverzögerung genau einstellen. Als erster Anhaltspunkt wird drei Sekunden empfohlen.In doing so, the first film tone sampler 542, also referred to as the main sampler, is positioned so that there is enough time for the device to generate a control signal to lock up. The first film tone sampler 542 thus provides a pre-delayed signal. The correlation window width or width of the portion of the test tone signal is added to the synchronization time. Based on the perforations on the film roll, the time difference for the pre-delay can be set exactly. As a first clue, three seconds is recommended.
Im Folgenden wird die Funktionsweise des Ausführungsbei- spiels der Vorrichtung zum Erzeugen eines Steuersignals für ein Filmereignissystem näher erläutert, wobei das Prinzip anhand des durch den ersten Filmtonabtaster 542 erzeugten Testtonsignals bzw. dessen Signalverarbeitungskette erläutert wird, da die zweite, optionale Signalverarbeitungsket- te bzw. Signalverarbeitung des durch den zweiten Filmtonabtaster 542' erzeugten Testtonsignals dem ersten entspricht, es wird daher lediglich auf die Einrichtung 569 zum Offset- Ausgleich spezifisch eingegangen.The operation of the exemplary embodiment of the device for generating a control signal for a film event system is explained in more detail below, the principle being explained on the basis of the test sound signal or its signal processing chain generated by the first film sound scanner 542, since the second, optional signal processing chain or Signal processing of the test tone signal generated by the second film tone sampler 542 'corresponds to the first, so it will be discussed only on the means 569 for offset compensation specifically.
Der erste Filmtonabtaster 542 liest von der Tonspur des Films das Tonsignal bzw. tastet von der Tonspur des Films das Tonsignal ab, und gibt dieses Signal an den ersten A/D- Wandler 544 weiter, wobei der erste A/D-Wandler 544 ausge- bildet ist, um basierend auf der Abtastrate des ersten Filmtonabtasters 542 und der Abspielgeschwindigkeit des Films, von dem die Tonspur bzw. die Filminformation gelesen wird, ein digitales Audiosignal oder Testtonsignal zu er- zeugen.The first film sound sampler 542 reads the sound signal from the soundtrack of the film and samples the sound signal from the soundtrack of the film, and passes this signal on to the first A / D converter 544, the first A / D converter 544 being extended. is formed to generate a digital audio signal or test tone signal based on the sampling rate of the first film sound sampler 542 and the playback speed of the film from which the soundtrack or movie information is read.
Auf der Basis des Testtonsignals 270 wird ein oder eine Mehrzahl von Merkmalen extrahiert bzw. eine Testfingerabdruckdarstellung gebildet. Für die Merkmalsextraktion bzw. Fingerabdruckdarstellung wird beispielsweise die spektrale Flachheit als Merkmal bzw. Fingerabdruck eingesetzt. Die Testfingerabdruckdarstellung wird dann von der Einrichtung 554 zum Vergleichen eines Merkmals bzw. einer Fingerabdruckdarstellung mit einer Referenzfingerabdruckdarstellung verglichen, wobei wie zuvor dargelegt, die Fingerabdruckdarstellung so ausgebildet ist, dass ein zeitlicher Verlauf der Fingerabdruckdarstellung von einem zeitlichen Verlauf der Filminformationen abhängt, und wobei einer in der Einrichtung 554 zum Vergleichen eines Merkmals gespeicherten Referenzfingerabdruckdarstellung eine Zeitskala zugeordnet ist, und die Einrichtung 554 zum Vergleichen ausgebildet ist, um auf der Basis des Vergleichs der Testfingerabdruckdarstellung mit der Referenzfingerabdruckdarstellung und der Zeitskala eine Stelle in dem Film zu ermitteln bzw. ein Zeitcodesignal 554Z zu erzeugen.On the basis of the test sound signal 270, one or a plurality of features is extracted or a test fingerprint representation is formed. For example, the spectral flatness is used as a characteristic or fingerprint for the feature extraction or fingerprint representation. The test fingerprint representation is then compared by the feature comparison device 554 with a reference fingerprint representation, as previously noted, wherein the fingerprint representation is such that a time history of the fingerprint representation depends on a temporal history of the movie information, and where a A reference fingerprint representation stored in feature 554 is associated with a time scale, and means 554 for comparing is adapted to determine a location in the film based on the comparison of the test fingerprint representation with the reference fingerprint representation and the time scale respectively a time code signal 554Z produce.
Der Abtastratenkonverter erzeugt auf der Basis des gespeicherten Referenztonsignals 274 dasselbe Signal mit leicht unterschiedlichen Abtastraten, d.h. modifizierte Referenz- tonsignale, für die parallel zu berechnenden Korrelationen. Dabei ist der Fall, dass ein modifiziertes Referenztonsignal die gleiche Abtastrate wie das ursprüngliche Referenztonsignal aufweist hierin inbegriffen, so dass für die Diskussion der Fig. 5 im weiteren allgemein der Begriff Refe- renztonsignale verwendet wird.The sample rate converter, based on the stored reference tone signal 274, generates the same signal at slightly different sample rates, i. modified reference tone signals for the correlations to be calculated in parallel. Here, the case that a modified reference sound signal has the same sampling rate as the original reference sound signal is included herein, so that in the discussion of Fig. 5 in the following generally the term reference tone signals is used.
Anders ausgedrückt, der Abtastratenkonverter 232 erzeugt drei Referenztonsignale 276 bzw. modifizierte Referenzton- Signale 276, wobei ein erstes Referenztonsignal auf einer ersten Abtastrate basiert und der ersten Einrichtung 562 für eine Korrelation zugeführt wird, wobei ein zweites Referenztonsignal 276 auf einer zweiten Abtastrate basiert und der zweiten Einrichtung 564 für eine Korrelation zugeführt wird, und ein drittes Referenztonsignal 276 auf einer dritten Abtastrate basiert und einer dritten Einrichtung 566 für eine Korrelation zugeführt wird. Der Abtastratenwandler 232 liefert niedrig abgestufte, in der Abtastrate unterschiedliche Signale an die Korrelation bzw. an dieIn other words, the sampling rate converter 232 generates three reference sound signals 276 or modified reference sound signals. Signals 276, wherein a first reference sound signal based on a first sampling rate and the first means 562 for correlation is supplied, wherein a second reference sound signal 276 based on a second sampling rate and the second means 564 for correlation is supplied, and a third reference sound signal 276 on based on a third sampling rate and supplied to a third means 566 for correlation. Sample rate converter 232 provides low-level, sample rate-different signals to the correlation
Einrichtungen 562, 564, 566 für eine Korrelation, wobei die Abtastrate immer in Abhängigkeit zum vorherigen gemessenen maximalen Peak-to-Noise-Wert aus der Korrelation eingestellt wird. Jeweils eine Korrelation bekommt ein modifi- ziertes Referenztonsignal mit dieser Abtastrate, eine weitere Korrelation bekommt eine etwas geringere, eine Stufe niedrigere, und eine weitere Korrelation bekommt eine etwas höher gestufte Abtastrate. Dadurch wird sichergestellt, dass sich der Abtastratenwandler beispielsweise auf eine Geschwindigkeitsänderung des Analog-Tonsignals abstimmen bzw. aufsynchronisieren kann.Means 562, 564, 566 for correlation, wherein the sampling rate is always set in response to the previous measured maximum peak-to-noise value from the correlation. In each case a correlation gets a modified reference tone signal with this sampling rate, another correlation gets a slightly lower, one level lower, and another correlation gets a slightly higher graduated sampling rate. This ensures that the sample rate converter can, for example, tune or synchronize to a change in the speed of the analog audio signal.
Die Einrichtung 522 zum Speichern der Tonspur und der Abtastratenkonverter 232 sind vorzugsweise ausgebildet, eine Fensterbreite von 2n zu verwenden, um aufwandsgünstig große Korrelationsfenster mittels der schnellen Fourier- Transformation (FFT = Fast Fourier transformation) zu berechnen. Es können parallel auch mehr als drei Korrelationen berechnet werden, um schlagartige Sprünge in der Ton- spur zu kompensieren. Das Korrelationsfenster wird groß gewählt, um einen deutlichen Korrelationspeak zu erhalten. Um die Erkennungsgenauigkeit des Korrelations-Peaks unter einem Sample bzw. einer Abtastperiode zu erhalten, kann mit Überabtastung des Eingangssignals bzw. Testtonsignals gear- beitet werden.The means 522 for storing the soundtrack and the sampling rate converter 232 are preferably designed to use a window width of 2 n, in order to calculate low-cost large correlation windows by means of the fast Fourier transformation (FFT). In parallel, more than three correlations can be calculated to compensate for sudden jumps in the soundtrack. The correlation window is chosen to be large in order to obtain a clear correlation peak. In order to obtain the recognition accuracy of the correlation peak under a sample or a sampling period, oversampling of the input signal or test tone signal can be performed.
Die Einrichtung 522 zum Speichern der Tonspur gibt in Abhängigkeit vom zugeführten Zeitcodesignal 582Z des Zeitge- bers 582 das Referenztonsignal in der Länge des Korrelationsfensters aus, wobei das Korrelationsfenster das Suchfenster ist, in dem das Testtonsignal gesucht wird.The means 522 for storing the sound track are in response to the supplied time code signal 582Z of the time bers 582 the reference sound signal in the length of the correlation window, wherein the correlation window is the search window in which the test sound signal is searched.
Die erste Einrichtung 568 zur Qualitätsbeurteilung ist ausgebildet, eine Maximalwertsuche in der Kreuzkorrelierten der Signale bzw. der Beträge der Signale durchzuführen und die Güte der Kreuzkorrelierten, je nach Höhe des Korrelati- ons-Peaks im Vergleich zu anderen Spitzen in der Kreuzkor- relierten zu gewichten, bzw. anhand des Peak-to-Noise- Abstands die Qualität jeder einzelnen Korrelation zu bestimmen.The first means 568 for quality assessment is designed to perform a maximum value search in the cross-correlated signals or the amounts of the signals and to weight the quality of the cross-correlated, depending on the height of the correlation peak compared to other peaks in the cross-correlated or to determine the quality of each individual correlation on the basis of the peak-to-noise distance.
Anhand der Qualitätsbeurteilung wird das Referenztonsignal mit der besten Güte bzw. Qualität bestimmt und anhand der Position des Peaks des Referenztonsignals mit der besten Qualität bzw. Güte die Verschiebung des Peaks gegenüber dem Suchfenster bestimmt, und beispielsweise als Zeitcodedifferenz zwischen gemessenem und derzeit gültigem Zeitcode oder als relativer Zeitcode ausgegeben.On the basis of the quality assessment, the best quality reference tone is determined and the displacement of the peak from the search window is determined based on the position of the peak of the best quality reference tone, for example as a time code difference between the measured and currently valid time code or relative time code issued.
Abhängig von dem Ergebnis der Qualitätsbeurteilung sendet die erste Einrichtung 568 zur Qualitätsbeurteilung ein Steuersignal 568A an den Abtastratenkonverter 232, das bei- spielsweise nur die drei Signalwerte "0", "+1" und "-1" unterscheidet, wobei beispielsweise bei "0" die Abtastraten der letzten Abtastraten-Konvertierung bzw. Korrelation beibehalten werden, weil das Korrelationsergebnis aus dem modifizierten Referenztonsignal mit der mittleren Abtastrate als das qualitativ hochwertigste bestimmt wurde, bei "+1" die Abtastraten gegenüber der letzten Abtastratenkonversion bzw. Korrelation um eine Stufe erhöht werden, weil das Korrelationsergebnis aus dem modifizierten Referenztonsignal mit der höchsten Abtastrate als das qualitativ hochwertigs- te bestimmt wurde, und bei "-1" die Abtastraten gegenüber der vorhergehenden Abtastratenkonversion bzw. Korrelation um eine Stufe reduziert werden, da die Korrelation aus dem Testtonsignal und dem modifizierten Referenztonsignal mit der niedrigsten Referenzabtastrate das beste Korrelationsergebnis bzw. den besten Peak-to-Noise-Abstand aufwies.Depending on the result of the quality assessment, the first quality assessment device 568 sends a control signal 568A to the sampling rate converter 232, which for example distinguishes only the three signal values "0", "+1" and "-1", for example "0". the sampling rates of the last sample rate conversion or correlation are maintained, since the correlation result from the modified reference tone signal with the average sampling rate has been determined to be the highest quality, at "+1" the sampling rates are increased by one more level than the last sample rate conversion or correlation because the correlation result from the modified reference tone signal having the highest sampling rate was determined to be the highest quality, and at -1 the sample rates are reduced from the previous sample rate conversion by one step, since the correlation is from the test tone signal and the modified reference sound signal with the lowest reference sample rate had the best correlation result or peak-to-noise ratio.
In anderen Worten, abhängig davon, mit welcher Abtastrate (erste, zweite oder dritte) der beste Korrelationspeak erhalten worden ist, wird der Abtastratenkonverter z.B. um ein Abtastraten-Deltawert erhöht oder erniedrigt, oder so angesteuert, dass er keine Abtastratenkonversion durchführt.In other words, depending on which sampling rate (first, second or third) the best correlation peak has been obtained, the sample rate converter will be e.g. is increased or decreased by one sample rate delta value, or so driven that it does not sample rate conversion.
Dabei dient die Korrelation zur Adressierung von zwei wesentlichen Aspekten. Erstens, der Bestimmung der Stelle im Film bzw. Bestimmung des Zeitpunktes im Film auf Basis der Zeitcodedifferenz aus der Korrelation. Zweitens, der Be- Stimmung des Maßes für die Abspielgeschwindigkeit, um die optimale Referenzabtastrate bzw. optimale Abtastratenkonversion der Referenzabtastrate zu ermitteln. Wobei die Anpassung der Abtastraten bzw. das Nachempfinden angepasster Abspielgeschwindigkeiten wiederum bessere Korrelationsergebnisse ermöglicht und damit wiederum die Zeitpunktbestimmung bzw. Bestimmung der Stelle in dem Film verbessert und somit wiederum die Synchronisation und die Prädiktion verbessert.The correlation serves to address two important aspects. First, determining the location in the film or determining the point in time in the film on the basis of the time code difference from the correlation. Second, determining the measure of the playback speed to determine the optimum reference sample rate or sample rate conversion of the reference sample rate, respectively. The adaptation of the sampling rates or the recapture of adapted playback speeds in turn enables better correlation results and thus in turn improves the timing or determination of the location in the film and thus in turn improves the synchronization and the prediction.
Ein bevorzugtes Ausführungsbeispiel gemäß Fig. 5 ist ausgebildet, mittels einer Signalanalyse, um Signalteile mit bestimmten Charakteristika zu detektieren, um diese dann bei der Synchronisation auszublenden und damit falsche Detekti- onen bzw. Synchronisationen zu unterbinden oder zufällige Schwankungen der Zeitachse zu vermeiden.A preferred exemplary embodiment according to FIG. 5 is designed, by means of a signal analysis, to detect signal parts with specific characteristics in order to then hide them during synchronization and thus to prevent false detections or synchronizations or to avoid random fluctuations of the time axis.
Solche Charakteristika können beispielsweise die Lautheit des Signalteils oder die „Problemheit" eines Signals sein und die Signalanalyse bzw. Detektion problematischer Teile auf der Basis von SNR (Signal-to-Noise-Ratio) , PNR (Peak- to-Noise) , Spectral power oder Leitungsdichtespektrum, spektraler Flachheit oder der Mittelwertbildung einer zeit¬ lichen Abfolge basieren. Beispielsweise kann unterhalb eines Schwellwerts des Peak- to-Noise-Werts bzw. Spitze-Rausch-Abstands die Zeitcodedifferenz als ungültig erkannt werden. Oder werden beispiels- weise mehrere Peaks mit ähnlichem Spitze-Rausch-Abstand festgestellt, kann die Zeitcodedifferenz ebenso als ungültig erkannt werden.Such characteristics may be, for example, the loudness of the signal part or the "problem" of a signal and the signal analysis or detection of problematic parts on the basis of SNR (signal-to-noise ratio), PNR (peak-to-noise), spectral power or power density spectrum, spectral flatness or averaging a time ¬ union based sequence. For example, below a threshold value of the peak-to-noise ratio or peak-to-noise ratio, the time code difference can be recognized as invalid. Or if, for example, several peaks with a similar peak-to-noise ratio are detected, the time code difference can also be recognized as invalid.
Des Weiteren ist zum Beispiel die Qualität von Korrelatio- nen mit leisen Signalteilen, das heißt Signalteilen mit geringer Amplitude, wegen des höheren Quantisierungsgeräuschs bei der digitalen Abtastung geringer als von Korrelationen mit lauten Signalen, daher werden leise Signalteile anhand von Schwellwerten bzw. adaptiv ausgeblendet, um zufällige Schwankungen der Zeitachse zu vermeiden. Zusätzlich kann die Signalenergie ein weiteres Qualitätsmerkmal sein.Furthermore, for example, the quality of correlations with quiet signal parts, that is to say signal parts with a low amplitude, is lower than with correlations with loud signals because of the higher quantization noise in the digital sampling, therefore quiet signal parts are suppressed by means of threshold values or adaptively, to avoid random fluctuations of the time axis. In addition, the signal energy can be another quality feature.
Ein weiteres Beispiel ist das Ausblenden von problematischen, weil wiederkehrenden Signalteilen, um Mehrdeutigkei- ten und damit beispielsweise falsches Aufsynchronisieren zu vermeiden.Another example is the hiding of problematic, because recurrent signal parts in order to avoid ambiguity and thus, for example, incorrect synchronization.
Problematische Signalteile bzw. Abschnitte können ferner zum Beispiel als Metadaten signalisiert werden, um unabhän- gig von der Qualität der aktuellen Korrelation, diese Signalteile auszublenden.Problematic signal parts or sections can also be signaled as metadata, for example, in order to hide these signal parts, regardless of the quality of the current correlation.
Die Einrichtung 584 zur Zeitcodeerzeugung ist ausgebildet, um basierend auf dem Zeitcodesignal 582Z des Zeitgebers 582, das beispielsweise auf einem internen oder proprietären Zeitcode basieren kann, beispielsweise in einen standardisierten Zeitcode bzw. ein Zeitcodesignal, das auf einem standardisierten Zeitcode basiert, umzuwandeln.The time code generation means 584 is designed to convert based on the time code signal 582Z of the timer 582, which may for example be based on an internal or proprietary time code, into a standardized time code or a time code signal based on a standardized time code, for example.
Der Zeitgeber 582 wird von einer internen Uhr gesteuertThe timer 582 is controlled by an internal clock
(Intervall bzw. Häufigkeit der Korrelationen), einem groben Audio-ID-Fingerabdruck bzw. Fingerabdruckdarstellung, beispielsweise dem Zeitcodesignal 554Z aus der Merkmalsbestim- mung bzw. Fingerabdruckdarstellung, und der ermittelten Korrelationsdifferenz, beispielsweise dem aus der Korrelation ermittelten Zeitcodedifferenzsignal 570Z der Einrichtung 570 zur Abtasterwahl. Der Zeitgeber muss eine Priori- sierung aus Korrelationssignal (höchste Priorität) , Zeitcode aus der Merkmalsbestimmung und interner Uhr (niedrigste Priorität) vornehmen.(Interval or frequency of correlations), a coarse audio ID fingerprint or fingerprint representation, for example, the time code signal 554Z from the feature determination tion or fingerprint representation, and the determined correlation difference, for example, the time-code difference signal 570Z determined from the correlation of the device 570 for picker selection. The timer must prioritize correlation signal (highest priority), time code from feature determination, and internal clock (lowest priority).
Die Einrichtung 586 zum Zeitcodeglätten ist ausgebildet, um das Zeitcodesignal 584Z zu glätten, um so beispielsweise einen stark springenden Zeitcode zu vermeiden oder falls Zeitcodes aus der Korrelation fehlen, sinnvolle Zwischenwerte zu finden, um z.B. Pausen in dem Analogton auszugleichen. Das von der Einrichtung 586 zum Zeitcodeglätten er- zeugte Zeitcodesignal 592 ist vorzugsweise ein standardisierter Zeitcode mit dem das Filmereignissystem synchronisiert bzw. gesteuert wird. Das Zeitcodesignal 592 kann jedoch auch dafür genutzt werden, um über eine sehr langsam regelnde Phasenregelschleife (PLL = Phase Locked Loop) ei- nen entsprechenden Sample-takt oder einen Abtasttakt zu erzeugen, falls das eingeschlossene Tonwiedergabesystem digitaler Art ist. Solche Phasenregelschleifen sind als fertige Geräte erhältlich und nicht Gegenstand dieses Patents.The time code smoothing means 586 is arranged to smooth the time code signal 584Z so as to avoid, for example, a hopping time code or, if there are time codes from the correlation, to find meaningful intermediate values, e.g. Compensate for pauses in the analog tone. The time code signal 592 generated by the time code slicer 586 is preferably a standard time code with which the movie event system is synchronized. However, the time code signal 592 can also be used to generate a corresponding sample clock or sample clock via a very slowly regulating phase-locked loop (PLL) if the enclosed audio reproduction system is of a digital type. Such phase locked loops are available as finished devices and are not the subject of this patent.
Optional können mehr als ein Filmabtaster mit zeitlich unterschiedlichem Offset von der Projektionslinse zur Verbesserung der Robustheit bei Schäden am Film bzw. bei zur Synchronisation schlecht geeigneter Abschnitte verwendet werden.Optionally, more than one telecine with time varying offset from the projection lens may be used to improve the robustness of film damage or portions that are poorly tuned for synchronization.
Ein zweiter Filmtonabtaster 542' kann dann beispielsweise benutzt werden, da der zweite Filmtonabtaster 542' schon in herkömmlichen Kinosystemen vorhanden ist. Pausen in dem A- nalogton können hier durch die an unterschiedlichen Stellen am Kinofilm angebrachten Filmtonabtaster 542, 542' überbrückt werden, da die Wahrscheinlichkeit bei kurzen Pausen im Filmton steigt, das wenigstens ein Abtaster, der erste Filmtonabtaster 542 oder der zweite Filmtonabtaster 542' , genug Signal für eine Korrelation und die damit verbundene Synchronisation liefert.A second film tone sampler 542 'may then be used, for example, since the second film tone sampler 542' is already present in conventional cinema systems. Breaks in the analogue tone can hereby be bridged by the film tone samplers 542, 542 'attached at different locations on the motion picture film, since the probability increases with short pauses in the film tone, the at least one scanner, the first film sound scanner 542 or the second film sound scanner 542', provides enough signal for a correlation and the associated synchronization.
Des Weiteren können wahlweise verschiedene Abtaster, z.B. für Analog-Ton, Dolby-Digital-Ton (incl. Decoder), DTS- Digitalton (incl. DTS-Decoder) oder ein anderer Ton sowie einer Kombination aus den oben genannten als Referenztonspur und/oder Testtonspur verwendet werden.Furthermore, optionally, different scanners, e.g. for analogue sound, Dolby Digital sound (including decoder), DTS digital sound (including DTS decoder) or another sound and a combination of the above may be used as the reference soundtrack and / or test soundtrack.
Dabei können einzelne Spuren für den Vergleich unter Verwendung von Mittelung, Mehrheitsentscheidung oder Priori- sierung, automatisch oder über Metadaten, der daraus erzeugten Zeitinformationen verwendet werden, sowie ein Down- Mix auf Mono.In this case, individual tracks can be used for comparison using averaging, majority decision or prioritization, automatically or via metadata, the time information generated therefrom, as well as a downmix to mono.
Allgemein gesprochen, können verschiedene Abtaster für verschiedene Tonformate und/oder verschiedenen Filmabtastern mit zeitlich unterschiedlichen Offsets verwendet werden.Generally speaking, different scanners may be used for different audio formats and / or different film scanners with different timing offsets.
Die Verwendung eines Downmixes auf Mono hat den Vorteil, dass dann, wenn die Monospur als gespeicherte Tonspur verwendet wird, weniger gespeichert werden muss, als wenn man beispielsweise fünf Kanäle speichert.Using a downmix on mono has the advantage that when the monaural track is used as a stored audio track, it saves less than storing five channels, for example.
Die Abspeicherung verschiedener, das heißt mehr als einer Tonspur, das heißt also kein Downmix, bedeutet, dass sämtliche Kanäle unabhängig voneinander abgespeichert werden und dass dann beispielsweise, wie zuvor erläutert, entsprechende Vergleiche bzw. Mehrheitsentscheidungen durchgeführt werden, um dann die Synchronisation unter Verwendung eines bestimmten Kanals, der tatsächlichen Tonspur und eines entsprechenden Kanals der gespeicherten Tonspur, durchzuführen.The storage of different, that is, more than one soundtrack, ie no downmix, means that all channels are stored independently of each other and then, for example, as explained above, corresponding comparisons or majority decisions are performed, then the synchronization using a particular channel, the actual soundtrack and a corresponding channel of the stored soundtrack.
Die Initialisierungsphase bzw. erste Synchronisation und die Resynchronisation nach einer Tonpause bilden zwei kritische Phasen während einer Filmvorführung bzw. einer Synchronisation eines Filmereignissystems. Bevorzugte Ausführungsbeispiele berechnen daher am Anfang mehr als drei parallele Korrelationen, da noch keine Aufsynchronisation erfolgt ist, das heißt, mehr als drei Refe- renztonsignale verschiedener Abtastraten werden mit dem Testtonsignal verglichen bzw. korreliert, um schnellstmöglich die richtige Abtastrate bzw. Abspielgeschwindigkeit des Testtonsignals zu bestimmen. Hier können auch der Reihe nach verschiedene Abtastraten durchprobiert werden, bis ei- ne der Korrelationen den besten Signalrauschabstand besitzt.The initialization phase or the first synchronization and the resynchronization after a recording pause form two critical phases during a film projection or a synchronization of a film event system. Preferred embodiments therefore initially calculate more than three parallel correlations, since no synchronization has yet occurred, that is, more than three reference tone signals of different sampling rates are compared with the test tone signal in order to obtain the correct sampling rate or playback speed of the test tone signal as quickly as possible determine. It is also possible to try different sampling rates in succession until one of the correlations has the best signal-to-noise ratio.
Alternativ oder zusätzlich liefern der erste Merkmalsextraktor 552 und die Einrichtung 554 zur Merkmalsklassifika- tion im Verbund mit der Datenbank einen groben absolutenAlternatively or additionally, the first feature extractor 552 and the feature classifier 554 provide a coarse absolute in conjunction with the database
Zeitcodewert, der einen grobe Stelle in dem Film definiert, um in einem zweiten Schritt beispielsweise durch die Korrelation eine feine Bestimmung der Stelle des Films bzw. eine feine Zeitcodebestimmung durchzuführen. Sobald die Synchro- nisation erfolgt ist, kann beispielsweise mit drei Korrelationen gearbeitet werden, um Veränderungen der Abspielgeschwindigkeit des Testtonsignals während der Filmvorführung nachzusynchronisieren.Time code value defining a coarse location in the film to perform a fine determination of the location of the film or a fine time code determination in a second step, for example, by the correlation. For example, once synchro- nization has taken place, three correlations can be used to re-synchronize changes in the playback speed of the test tone signal during the movie screening.
Die Genauigkeit, mit der eine Stelle in einem Film bzw. einer der Stelle zugeordnete Zeitpunkt auf einer Zeitskala (Zeitcode) zugeordnet werden kann, hängt von der Abtastrate des Referenztonsignals und der Abtastrate des Testtonsignals ab, je höher die Abtastrate, desto genauer kann die Stelle in dem Film bestimmt werden. Eine geringere Abtastrate hat jedoch den Vorteil, dass mit der gleichen Anzahl von Abtastwerten ein längerer Abschnitt des Referenztonsignals oder des Testtonsignals dargestellt werden kann. Ein bevorzugtes Ausführungsbeispiel ist daher ausgebildet, in einem ersten Schritt eine grobe Bestimmung einer Stelle in einem Film zu ermitteln, indem ein längerer Abschnitt des Films durch ein Referenztonsignal mit geringerer Abtastrate dargestellt wird, und auch ein Testtonsignal durch Abtas- tung mit einer geringeren Abtastrate gewonnen wird. Auf Basis der groben Stelle im Film wird dann in einem zweiten Schritt ein Referenztonsignal höherer Abtastrate und ein Testton-Signal höherer Abtastrate für eine feine Bestimmung der Stelle in dem Film verwendet.The accuracy with which a location in a movie or time associated with a location can be assigned on a time scale depends on the sampling rate of the reference sound signal and the sampling rate of the test sound signal; the higher the sampling rate, the more accurate the location be determined in the movie. However, a lower sampling rate has the advantage that with the same number of samples, a longer portion of the reference sound signal or the test sound signal can be represented. A preferred embodiment is therefore designed, in a first step, to determine a rough determination of a location in a film by displaying a longer section of the film by means of a reference sampling signal with a lower sampling rate, and also a test tone signal by sampling. obtained at a lower sampling rate. Based on the coarse location in the film, in a second step, a higher sample rate reference tone signal and a higher sample rate test tone signal are used to finely determine the location in the film.
Anders ausgedrückt, wird die Fensterlänge beim Korrelieren angepasst. Zu Beginn des Suchens werden zeitlich lange Fenster, aber eine reduzierte Abtastrate der Signale ver- wendet, wenn ein Zeitpunkt ungefähr gefunden und nur nachgeführt werden soll, werden kurze Fenster evtl. sogar mit Überabtastung der Signale verwendet, um eine höhere zeitliche Genauigkeit zu erreichen.In other words, the window length is adjusted when correlated. At the beginning of the search, time-long windows but a reduced sampling rate of the signals are used, if a time should be approximately found and only tracked, short windows may even be used with oversampling of the signals to achieve a higher temporal accuracy.
In der Initialisierungsphase kann beispielsweise eine „kompatible Wiedergabe" des „alten" Audioformats erfolgen bis die genaue Position bestimmt ist.In the initialization phase, for example, a "compatible reproduction" of the "old" audio format can take place until the exact position is determined.
Genauso kann eine „kompatible Wiedergabe" des „alten" Au- dioformats erfolgen, wenn die Synchronisation deutlich verloren gegangen ist, bis die genaue Position wieder bestimmt ist .Similarly, a "compatible" playback of the "old" audio format can be done if the synchronization has been lost significantly until the exact position is determined again.
Die Einrichtung 570 zur Abtasterwahl und die Einrichtung zum Offset-Ausgleich 569 sind nur in Ausführungsbeispielen mit mehr als einem Filmtonabtaster notwendig. So entscheidet beispielsweise die Einrichtung 570 zur Abtasterwahl, ob sich das Ergebnis bzw. die Zeitcodedifferenz der ersten Einrichtung 568 zur Qualitätsbeurteilung (568Z) oder das Ergebnis bzw. die Zeitcodedifferenz 568Z' der zweiten Einrichtung 568' zur Qualitätsbeurteilung an den Zeitgeber 582 zur Bestimmung einer Stelle in dem Film bzw. eines Zeitcodes 582Z weiterleitet. Da der zweite Filmtonabtaster 542' das Testtonsignal an einer anderen Stelle des Films abtas- tet, wird die Differenz (Offset) zwischen der Stelle, an der der erste Filmtonabtaster 542 den Film abtastet zu der Stelle an der der zweite Filmtonabtaster 542' den Film abtastet durch die Einrichtung 569 zum Offsetausgleich ausge- glichen, so dass der Zeitgeber 582 die korrekte Zeitcodedifferenz 570Z unabhängig davon erhält, ob die Zeitcodedifferenz 568Z oder die Zeitcodedifferenz 568Z' gewählt wird, die bezüglich des zuletzt gespeicherten Zeitpunkts bzw. der zuletzt gespeicherten Stelle des Films, die im Zeitgeber gespeichert ist.The scanner selection means 570 and the offset compensation means 569 are necessary only in embodiments with more than one film sound scanner. For example, the scanner selection means 570 decides whether the result or time code difference of the first quality judging means 568 (568Z) or the result or time code difference 568Z 'of the second quality judging means 568' is sent to the job setting determiner 582 in the movie or a time code 582Z. Since the second film tone sampler 542 'scans the test tone signal at another location on the film, the offset between the location where the first film tone sampler 542 scans the film to where the second film tone sampler 542' scans the film by means 569 for offset compensation. so that the timer 582 obtains the correct time code difference 570Z regardless of whether the time code difference 568Z or the time code difference 568Z 'is selected with respect to the most recently stored or last stored location of the movie stored in the timer.
Abweichend von dem in Fig. 5a dargestellten Ausführungsbeispiel können die verschiedenen Referenztonsignale verschie- dener Referenzabtastraten auch nacheinander erzeugt und mit dem Testtonsignal verglichen bzw. korreliert werden, um das Maß für die Abspielgeschwindigkeit des Testtonsignals bzw. die optimale Referenzabtastrate zu bestimmen. Alternativ können auch mehr als drei modifizierte Referenztonsignale mit dem Testtonsignal verglichen werden, parallel oder seriell, um nicht nur in der Anfangsphase eine schnelle Synchronisation zu ermöglichen, sondern auch während einer Filmvorführung das Filmereignissystem nach größeren Sprüngen im Film, z.B. durch Schnitte bzw. im Film fehlende Ab- schnitte verursacht, schneller wieder auf die aktuelle Stelle im Film aufzusynchronisieren.In contrast to the exemplary embodiment illustrated in FIG. 5a, the different reference sound signals of different reference sampling rates can also be generated one after the other and compared with the test sound signal in order to determine the measure of the playback speed of the test sound signal or the optimum reference sampling rate. Alternatively, more than three modified reference sound signals may be compared to the test sound signal, in parallel or serially, to allow not only early synchronization fast sync but also during movie screening, the film event system for large cracks in the film, e.g. caused by cuts or in the film missing sections, faster to resynchronize to the current location in the film.
Abweichend von dem in Fig. 5a dargestellten Ausführungsbeispiel kann eine Synchronisation eines Filmereignissystems auch auf Basis der auf den Film aufgebrachten Bilder erfolgen, sowohl für eine Auswertung von Merkmalen bzw. Fingerabdrücken als auch für eine Korrelation eines Test- Bildsignals mit einem oder einer Mehrzahl von Referenz- Bildsignalen.Deviating from the exemplary embodiment illustrated in FIG. 5 a, a synchronization of a film event system can also take place on the basis of the images applied to the film, both for an evaluation of features or fingerprints and for a correlation of a test image signal with one or a plurality of references - picture signals.
Dabei kann, wie zuvor dargestellt die Korrelation von Audio- und/oder Videosignalen zur Bestimmung des zeitlichen Ortes in einem Audio- und/oder Videostroms eingesetzt werden, und ein synchrones Abspielen aufgrund dieser zeitli- chen Bestimmung gesteuert werden.In this case, as described above, the correlation of audio and / or video signals for determining the temporal location in an audio and / or video stream can be used, and a synchronous playback can be controlled on the basis of this timing determination.
Alternativ kann auch die Bestimmung einer Audio- und/oder Video-Signatur aus dem Rohmaterial in Form einer Audio- ID/Video-ID (ID = Identification) zum groben Bestimmen des Zeitpunkts in einem langen AV-Strom verwendet werden, um ein Aufsynchronisieren an beliebiger Stelle zu ermöglichen.Alternatively, the determination of an audio and / or video signature from the raw material in the form of an audio ID / Video ID (ID = Identification) can be used to roughly determine the time in a long AV stream to allow for synchronization anywhere.
Der Grundansatz der Erfindung besteht darin, beispielsweise den schon vorhandenen Analogton noch einmal digital abzuspeichern, um dann mittels Korrelation und anderer MerkmalsbeStimmung mit der Analogtonspur auf den Kinofilm zu synchronisieren. Das Ausgangssignal bzw. Steuersignal der Vorrichtung zum Erzeugen eines Steuersignals bzw. des Synchronisiergeräts kann ein beliebiges Zeitcodeformat sein. Vorzugsweise wird natürlich z.B. das SMPTE standardisierte LTC Zeitcodeformat eingesetzt. Für jeden Kinofilm muss bei der Produktion ein Datensatz für die Vorrichtung zum Erzeu- gen eines Steuersignals bzw. für das Synchronisationsgerät erstellt werden.The basic idea of the invention is, for example, to digitally store the already existing analog tone, in order to then synchronize it with the analog audio track on the motion picture film by means of correlation and other feature determination. The output signal or control signal of the device for generating a control signal or of the synchronizing device can be any time code format. Preferably, of course, e.g. used the SMPTE standardized LTC time code format. For each motion picture film, a data set for the device for generating a control signal or for the synchronization device must be created during production.
Für jeden Kinofilm wird bei der Produktion ein extra Datenträger für die vorher beschriebene Einrichtung zum Erzeugen eines Steuersignals bzw. Synchronisationsgerät erstellt.For each movie, an extra volume for the previously described device for generating a control signal or synchronization device is created during production.
Der Datenträger beinhaltet die digitalisierte analoge Tonspur, z.B. im Dolby-Stereo-Format, wie er auf der Filmrolle zu finden ist, Merkmalsdaten zur Tonspur und dazu passende Zeitcodes.The data carrier includes the digitized analog audio track, e.g. in dolby stereo format as found on the roll of film, feature data about the soundtrack and matching timecodes.
Im Folgenden wird anhand der Fig. 5b.1 bis 5b.4 eine beispielhafte Ermittlung einer Zeitcodedifferenz beschrieben.In the following, an exemplary determination of a time code difference will be described with reference to FIGS. 5b.1 to 5b.4.
Fig. 5b.1 zeigt einen beispielhaften Film 110 mit einer Tonspur 114, wie schon in Fig. 8 beschrieben.FIG. 5b.1 shows an exemplary film 110 with a sound track 114, as already described in FIG. 8.
Basierend auf dem Zeitcodesignal 582Z des Zeitgebers 582 wird aus der Einrichtung 522 zum Speichern einer Tonspur ein Referenztonsignal 274 ausgelesen und mittels der Vor- richtung zur Abtastratenkonvertierung 232 ein modifiziertes Referenzton-Signal gemäß Fig. 5b.2 erzeugt, das einen Filmabschnitt von der Stelle L0 bis zu der Stelle L3 bzw. dem der Stelle L0 zugeordnete Zeitpunkt To oder einem entspre- chenden Zeitcode und dem der Stelle L3 zugeordneten Zeitpunkt T3 bzw. Zeitcode darstellt.Based on the time code signal 582Z of the timer 582, a reference sound signal 274 is read from the device 522 for storing a sound track and a modified reference sound signal according to FIG. 5b.2 is generated by the device for sample rate conversion 232, which contains a film section from the point L 0 up to the point L 3 or the point of time To assigned to the point L 0 or a corresponding representing the time code T and the time L 3 associated with the point L 3 or time code.
Fig. 5b.3 zeigt ein beispielhaftes Testtonsignal bzw. Ab- schnitt eines Testtonsignals, der durch den Anfangszeitpunkt Ti und den Endzeitpunkt T2 definiert ist und auf der Basis der Abtastrate f = 1/Δt erzeugt worden ist.FIG. 5b.3 shows an exemplary test sound signal or section of a test sound signal, which is defined by the start time Ti and the end time T 2 and has been generated on the basis of the sampling rate f = 1 / Δt.
Fig. 5b.4 zeigt das Ergebnis der Korrelation des modifi- zierten Referenztonsignals gemäß Fig. 5b.2 und des Abschnitts des Testtonsignals Fig. 5b.3. Die Zeitdifferenz ΔT' ' = Ti - T0 zwischen dem Anfangszeitpunkt T0 des Suchfensters bzw. modifizierten Referenztonsignals aus Fig. 5b.2 und dem Zeitpunkt T1 des Suchfensters bzw. Referenz- tonsignals ist die Zeitverschiebung, auf der basierendFIG. 5b.4 shows the result of the correlation of the modified reference sound signal according to FIG. 5b.2 and the section of the test sound signal FIG. 5b.3. The time difference ΔT "= Ti-T 0 between the start time T 0 of the search window or modified reference sound signal from FIG. 5b.2 and the time T 1 of the search window or reference sound signal is the time shift based on
Zeitcodedifferenz bzw. der relative Zeitcode gebildet wird. Dabei ist der Zeitpunkt Ti der Zeitpunkt oder die zeitliche Verschiebung des Testtonsignals, bei dem ein Abschnitt des des n = 11 Abtastwerte langen Referenztonsignals maximal mit dem Testtonsignal übereinstimmt, bzw. eine Korrelation des Referenztonsignals und des N = 11 Abtastwerte langen Testtonsignals als Korrelationsergebnis ein Maximum aufweist .Time code difference or the relative time code is formed. In this case, the time Ti is the time or the temporal shift of the test sound signal at which a portion of the n = 11 samples long reference sound signal coincides with the maximum test tone signal, or a correlation of the reference sound signal and the N = 11 samples long test sound signal as the correlation result is a maximum having .
Dabei ist für die Qualitätsbeurteilung 568 die Kenntnis des absoluten Zeitpunktes To oder des Zeitpunktes Ti nicht notwendig, da beispielsweise der Zeitgeber 582 den letzten absoluten Zeitpunkt bzw. absoluten Zeitcode kennt und nur die Zeitcodedifferenz 570Z benötigt, um den aktualisierten ab- soluten Zeitpunkt bzw. Zeitcode zu bestimmen. Die Differenz kann beispielsweise aus der Position des Peaks gegenüber dem Zeitpunkt des Suchfensteranfangs dargestellt werden. In Fig. 5b.4 ist der Peak beispielsweise der vierte Abtastwert, d.h das Testonsignal aus Fig. 5b.3 ist um „3 Δt" gegenüber dem Referenztonsignal aus Fig. 5b.2 verschoben, wobei Δt die der modifizierten Abtastrate entsprechende Ab¬ tastperiode ist. Damit kann die Zeitcodedifferenz 570Z beispielsweise aus dem Wert n = 3 bestehen. Hier kommt der Vorteil der an die variable Abspielgeschwindigkeit des Testtonsignals angepaßte Abtastrate bzw. Abspielgeschwindigkeit des Referenzton- Signals vorteilhaft zum tragen, da auch das Δt an die Abspielgeschwindigkeit angepasst ist, eine genauere Bestimmung der Stelle in dem Film bzw. Verschiebung gegenüber dem Suchfenster möglich ist als bei einer festen Abtastrate des Referenztonsignals, da dann nur Vielfache dieser Abtastrate für eine Bestimmung der Stelle in dem Film erzeugt werden.It is not necessary for the quality assessment 568 to know the absolute time To or the time Ti, since, for example, the timer 582 knows the last absolute time or absolute time code and only requires the time code difference 570Z to obtain the updated absolute time or time code to determine. The difference can be represented, for example, from the position of the peak with respect to the time of the beginning of the search window. In FIG. 5b.4, the peak is, for example, the fourth sample, ie the test signal from FIG. 5b.3 is shifted by "3 Δt" relative to the reference sound signal from FIG. 5b.2, where Δt is the Ab ¬ corresponding to the modified sampling rate is the tasting period. Thus, the time code difference 570Z can consist, for example, of the value n = 3. Here, the advantage of the adapted to the variable playback speed of the test sound signal sampling rate or playback speed of the reference tone signal advantageous to wear, since the .DELTA.t is adapted to the playback speed, a more accurate determination of the location in the film or displacement relative to the search window is possible than at a fixed sampling rate of the reference sound signal, since then only multiples of this sampling rate are generated for a determination of the location in the film.
Dabei kann beispielsweise der Zeitpunkt To des Suchfensters bzw. Referenztonsignals gleich dem Ti der vorhergehenden Korrelation sein, da der Film nur vorwärts gespielt wird.In this case, for example, the time To of the search window or reference sound signal can be equal to the Ti of the previous correlation, since the film is played only forward.
Fig. 6a zeigt ein Ausführungsbeispiel eines Filmsystems, bei dem eine Vorrichtung 100 zum Erzeugen eines Steuersignals 190 mit einem Filmereignissystem 600 gekoppelt ist, dabei erzeugt die Vorrichtung 100 zum Erzeugen eines Steu- ersignals auf der Basis des Films 110, wie in Fig. 8 gezeigt, das Steuersignal 190, beispielsweise einen Zeitcode, mit dem Filmereignissystem 600 synchronisiert wird.6a shows an embodiment of a film system in which a device 100 for generating a control signal 190 is coupled to a movie event system 600, thereby generating the device 100 for generating a control signal based on the film 110, as shown in FIG that the control signal 190, for example a time code, is synchronized with the movie event system 600.
Fig. 6b zeigt ein Filmsystem, das eine Vorrichtung 100 zum Erzeugen eines Steuersignals 100 aufweist und ein Wellen- feldsynthese-System 610 als beispielhaftes Filmereignissystem, wobei das Ausführungsbeispiel des Wellenfeldsynthese- systems 610 eine Einrichtung 620 zur Steuerung des Wellen- feldsynthesesystems, einen digitalen Speicher 622 für die Wellenfeldsynthese-Audiosignale und eine Mehrzahl von Lautsprechern 624 für das Wellenfeldsynthese-System aufweist. Basierend auf dem Film 110 bzw. einer beispielsweise analogen Filmtonspur 114 erzeugt die Vorrichtung 100 zum Erzeugen eines Steuersignals das Steuersignal 190, um zu einem ursprünglich analogvertonten Film lippensynchron ein Wellenfeldsynthese-Audioerlebnis zu ermöglichen. Alternativ zu dem Wellenfeldsynthese-System 610 können natürlich auch andere Audiosysteme, beispielsweise digitale Audiosysteme bzw. digitale Sourround-Audiosysteme mittels der Vorrichtung 100 zum Erzeugen eines Steuersignals lip- pensynchron synchronisiert werden.6b shows a film system comprising a device 100 for generating a control signal 100 and a wave field synthesis system 610 as an exemplary film event system, the exemplary embodiment of the wave field synthesis system 610 comprising a device 620 for controlling the wave field synthesis system, a digital memory 622 for the wave field synthesis audio signals and a plurality of loud speakers 624 for the wave field synthesis system. Based on the film 110 or, for example, an analog movie soundtrack 114, the control signal generating device 100 generates the control signal 190 to lip-sync a wave analog audio audio experience to an originally analog-converted movie. As an alternative to the wave field synthesis system 610, other audio systems, for example digital audio systems or digital surround audio systems, can of course also be synchronized lip-synchronously by means of the device 100 for generating a control signal.
Fig. 7 zeigt einen beispielhaften Film, wie in Fig. 8 dargestellt, ein beispielhaftes digital gespeichertes Referenztonsignal 720 und eine Zuordnung einer Zeitskala.FIG. 7 shows an exemplary film as shown in FIG. 8, an exemplary digitally stored reference sound signal 720, and an assignment of a time scale.
Bei dem Erzeugen der gespeicherten Filminformation bzw. des Referenztonsignals, wird beispielsweise das analoge Tonsignal bei einer gegebenen Abspielgeschwindigkeit und einer gegebenen Abtastrate, beispielsweise 44,1 kHz, abgetastet und Tonabschnitte von beispielsweise 10 ms als ein sog. Audio-Frame abgespeichert, das heißt, das digitale Referenztonsignal liegt als Folge von Audio-Frames auf dem Speicher vor. Der zugeordnete Zeitpunkt einer Zeitskala kann dann beispielsweise darin bestehen, als Zeitcode bzw. Zeitskala die Audio-Frames von 0 oder 1 aufsteigend durch zu numme- rieren, Timecode TCl entspricht Audio-Frame AFI in Fig. 7, oder beispielsweise den Anfangszeitpunkt oder Endzeitpunkt eines Audio-Frames als Zeitcode zu finden, so z.B. für den ersten Audio-Frame entweder 0 ms oder 10 ms, wenn ein Au- dio-Frame eine Dauer von 10 ms hat.For example, in generating the stored movie information or reference tone signal, the analog audio signal is sampled at a given playback speed and rate, for example, 44.1 kHz, and audio portions of, for example, 10 ms are stored as a so-called audio frame, that is, the digital reference sound signal is present on the memory as a result of audio frames. The assigned time of a time scale can then be, for example, to number the audio frames from 0 or 1 in ascending order as time code or time scale, time code TCl corresponds to audio frame AFI in FIG. 7, or, for example, the start time or end time of one To find audio frames as time code, such as for the first audio frame either 0 ms or 10 ms if an audio frame has a duration of 10 ms.
Timecodes weisen üblicherweise Formate wie Stunde: Minute: Sekunde: Frame auf, wobei sich der Frame üblicher- weie auf Video-Frames mit z.B. 24 Frames pro Sekunde (Kino- film) bezieht. Eine Zeitskala oder Timecode kann daher beispielsweise mehrere Audio-Frames einem Video-Frame zuordnen oder als kleinste Zeitskalaeinheit einen Audio-Frame definieren. Entsprechend kann der Zeitcode bzw. die Zeitskala dann beispielsweise 4 Audio-Frames einem Zeitcode zuordnen, siehe TCl' in Fig. 7, der vier Audio-Frames AFI -AF4 um- fasst, oder einen einzelnen Audi-Frame einem Zeitcode zuordnen, siehe TCl in Fig. 7, dem ein Audio-Frame AFI zugeordnet ist. Dabei können je nach Audioformat, die Audio- Frames auch sich zeitlich überlappenden Abschnitte des Audiosignals repräsentieren.Time codes usually have formats such as hour: minute: second: frame, whereby the frame usually refers to video frames with, for example, 24 frames per second (cinema film). A time scale or time code can therefore, for example, assign a plurality of audio frames to a video frame or define an audio frame as the smallest time scale unit. Accordingly, the time code or the time scale can then for example assign 4 audio frames to a time code, see TCl 'in FIG. 7, which comprises four audio frames AFI -AF4, or assign a single Audi frame to a time code, see TCl in Fig. 7, which is associated with an audio frame AFI. Depending on the audio format, the audio Frames also represent temporally overlapping sections of the audio signal.
Das Steuersignal 190 kann beispielsweise als Zeitcode aus- gebildet sein, aber auch als Folge von Pulsen, wobei beispielsweise jeder Puls einer Zeitskaleneinheit entspricht und ähnlich einem relativem Zeitcode das Filmereignissystem die Pulse aufakkumuliert, um sich mit dem Film zu synchronisieren.The control signal 190 may be formed, for example, as a time code, but also as a sequence of pulses, where, for example, each pulse corresponds to a time scale unit and, similar to a relative time code, the film event system accumulates the pulses to synchronize with the film.
Ein weiteres Ausführungsbeispiel, um weiterhin ein beispielsweise analoges Tonsignal als Fallback zur Verfügung zu haben, aber gleichzeitig auch einen Timecode für synchrone Zusatzdienste zu realisieren, bietet der Ansatz ein Watermark in das Audio- und/oder Videosignal einzubetten. Vorteil dieser Lösung ist, dass auch bei „schwierigen" Audiosignalen, z.B. sehr leisen Passagen oder selbst ähnlichen „monotonen" Geräuschen, eine saubere Taktgewinnung möglich ist. Für diese Variante ist im Prinzip der komplet- te Satz der einschlägigen Watermark-Patentansprüche, insbesondere im Bereich der Suche nach der korrekten Taktrate bzw. der Nachregelung der Abtastrate, sinnvoll. Der entscheidende Nachteil dieses Ansatzes ist jedoch, dass der eigentliche Film verändert bzw. eine neue Version oder Ko- pie des Films erstellt werden muss, um die Watermarks in das Audio- und /oder Video-Signal einbetten zu können.A further exemplary embodiment, in order, furthermore, to have available, for example, an analog audio signal as a fallback, but at the same time also to realize a time code for synchronous additional services, offers the approach of embedding a watermark in the audio and / or video signal. Advantage of this solution is that even with "difficult" audio signals, such as very quiet passages or even similar "monotonous" noises, a clean clock recovery is possible. For this variant, in principle the complete set of the relevant Watermark claims, in particular in the field of searching for the correct clock rate or the readjustment of the sampling rate, makes sense. The decisive disadvantage of this approach, however, is that the actual film has to be changed or a new version or copy of the film has to be created in order to be able to embed the watermarks in the audio and / or video signal.
Abhängig von den Gegebenheiten kann das erfindungsgemäße Verfahren in Hardware oder in Software implementiert wer- den. Die Implementierung kann auf einem digitalen Speichermedium, insbesondere einer Diskette oder CD mit elektronisch auslesbaren Steuersignalen erfolgen, die so mit einem programmierbaren Computersystem zusammenwirken können, dass das Verfahren ausgeführt wird. Allgemein besteht die Erfin- düng somit auch in einem Computer-Programm-Produkt mit einem auf einem maschinenlesbaren Träger gespeicherten Programmcode zur Durchführung des erfindungsgemäßen Verfah¬ rens, wenn das Computer-Programm-Produkt auf einem Rechner abläuft. In anderen Worten ausgedrückt, kann die Erfindung somit als ein Computer-Programm mit einem Programmcode zur Durchführung des Verfahrens realisiert werden, wenn das Computer-Programm auf einem Computer abläuft. Depending on the circumstances, the method according to the invention can be implemented in hardware or in software. The implementation may be on a digital storage medium, in particular a floppy disk or CD with electronically readable control signals, which may interact with a programmable computer system such that the method is performed. In general, the inventions thus fertil in a computer program product with a program stored on a machine-readable carrier, the program code for performing the inventive procedural ¬ Rens, when the computer program product on a computer expires. In other words, the invention can thus be realized as a computer program with a program code for carrying out the method when the computer program runs on a computer.

Claims

Patentansprüche claims
1. Vorrichtung zum Ermitteln einer Stelle in einem Film (110) , der in einer zeitlichen Folge aufgebrachteA device for detecting a location in a film (110) applied in a temporal sequence
Filminformationen (112, 114) aufweist, mit folgenden Merkmalen:Film information (112, 114), having the following features:
einem Speicher (320) zum Speichern einer Referenzfin- gerabdruckdarstellung der Filminformationen (112,a memory (320) for storing a reference fingerprint representation of the movie information (112, 112);
114), wobei die Fingerabdruckdarstellung so ausgebildet ist, dass ein zeitlicher Verlauf der Fingerabdruckdarstellung von einem zeitlichen Verlauf der Filminformationen abhängt, und wobei einer gespei- cherten Referenzfingerabdruckdarstellung eine Zeitskala zugeordnet ist;114), wherein the fingerprint representation is designed such that a time profile of the fingerprint representation depends on a temporal course of the film information, and wherein a stored reference fingerprint representation is assigned a time scale;
einer Einrichtung (340) zum Empfangen eines von dem Film (110) gelesenen Abschnitts;means (340) for receiving a portion read from the film (110);
einer Einrichtung (350) zum Extrahieren einer Testfingerabdruckdarstellung aus dem eingelesenen Abschnitt; undmeans (350) for extracting a test fingerprint representation from the read portion; and
einer Einrichtung (360) zum Vergleichen der Testfingerabdruckdarstellung mit der Referenzfingerabdruckdarstellung, um auf der Basis des Vergleichs und der Zeitskala die Stelle in dem Film (110) zu ermitteln.means (360) for comparing the test fingerprint representation with the reference fingerprint representation to determine the location in the film (110) based on the comparison and the timescale.
2. Vorrichtung nach Anspruch 1, bei der die Filminformation auf einer analogen Tonspur auf dem Film aufgebracht ist, und bei der die Einrichtung (340) zum Empfangen ausgebildet ist, um die analoge Toninformation von der analogen Tonspur zu empfangen.An apparatus according to claim 1, wherein the film information is applied on an analog soundtrack on the film, and wherein the means (340) for receiving is adapted to receive the analog sound information from the analog soundtrack.
3. Vorrichtung nach Anspruch 1 oder 2, bei der die Einrichtung (350) zum Extrahieren ausgebildet ist, um als Fingerabdruckdarstellung eine Darstellung mit ei- ner spektralen Flachheit zu berechnen, so dass ein zeitlicher Verlauf der Fingerabdruckdarstellung einen zeitlichen Verlauf der spektralen Flachheit umfasst.3. Apparatus according to claim 1 or 2, wherein the means (350) for extracting is designed to display as a fingerprint representation with a ner spectral flatness, so that a time course of the fingerprint representation includes a time course of the spectral flatness.
4. Vorrichtung nach einem der Ansprüche 1 bis 3, die ferner eine weitere Vorrichtung zum Empfangen eines von dem Film gelesenen Abschnitts aufweist, wobei der Abschnitt von dem Abschnitt unterschiedlich ist, der durch die Vorrichtung (140) zum Empfangen empfangen wird.The apparatus of any one of claims 1 to 3, further comprising another device for receiving a portion read from the film, the portion being different than the portion received by the receiving device (140).
5. Verfahren zum Ermitteln einer Stelle in einem Film5. Method for determining a location in a movie
(110), der in einer zeitlichen Abfolge aufgebrachte Filminformationen (112, 114) aufweist, mit folgenden Schritten:(110) comprising film information (112, 114) applied in a temporal sequence, comprising the following steps:
Empfangen eines von dem Film (110) gelesenen Abschnitts;Receiving a portion read from the film (110);
Extrahieren einer Testfingerabdruckdarstellung aus dem gelesenen Abschnitt; undExtracting a test fingerprint representation from the read portion; and
Vergleichen der Test-Fingerabruckdarstellung mit der Referenzfingerabdruckdarstellung, wobei die Fingerab- druckdarstellung so ausgebildet ist, dass ein zeitlicher Verlauf der Fingerabdruckdarstellung von einem zeitlichen Verlauf der Filminformation (112, 114) abhängt, und wobei der gespeicherten Referenzfingerabdruckdarstellung eine Zeitskala zugeordnet ist, um auf der Basis des Vergleichs und der Zeitskala die Stelle in dem Film (110) zu ermitteln.Comparing the test fingerprint representation with the reference fingerprint representation, wherein the fingerprint representation is configured such that a time profile of the fingerprint representation depends on a temporal progression of the film information (112, 114), and wherein the stored reference fingerprint representation is assigned a time scale for displaying on the Based on the comparison and the time scale to determine the location in the film (110).
6. Computerprogramm mit einem Programm-Code zum Ausführen eines Verfahrens gemäß Anspruch 5, wenn das Com- puterprogramm auf einem Computer abläuft. A computer program comprising program code for carrying out a method according to claim 5 when the computer program is run on a computer.
PCT/EP2006/005553 2005-06-22 2006-06-09 Device and method for determining a point in a film comprising film data applied in chronological order WO2006136300A1 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
EP06754259A EP1894199A1 (en) 2005-06-22 2006-06-09 Device and method for determining a point in a film comprising film data applied in chronological order
CN2006800249179A CN101218648B (en) 2005-06-22 2006-06-09 Device and method for determining a point with film information in a film
JP2008517365A JP5137826B2 (en) 2005-06-22 2006-06-09 Apparatus and method for determining a position in a film having film information applied in a time sequence

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
DE102005028978.9 2005-06-22
DE102005028978 2005-06-22
DE102005045628A DE102005045628B3 (en) 2005-06-22 2005-09-23 Apparatus and method for determining a location in a film having film information applied in a temporal sequence
DE102005045628.6 2005-09-23

Publications (1)

Publication Number Publication Date
WO2006136300A1 true WO2006136300A1 (en) 2006-12-28

Family

ID=36716607

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/EP2006/005553 WO2006136300A1 (en) 2005-06-22 2006-06-09 Device and method for determining a point in a film comprising film data applied in chronological order

Country Status (4)

Country Link
EP (1) EP1894199A1 (en)
JP (1) JP5137826B2 (en)
DE (1) DE102005045628B3 (en)
WO (1) WO2006136300A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101290621B (en) * 2007-04-17 2011-06-15 上海申瑞电力科技股份有限公司 Safe digital card memory search method
US8989395B2 (en) 2010-12-07 2015-03-24 Empire Technology Development Llc Audio fingerprint differences for end-to-end quality of experience measurement

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013178216A (en) * 2012-02-28 2013-09-09 Koichi Ono Time-code history update type loudness meter

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5040081A (en) * 1986-09-23 1991-08-13 Mccutchen David Audiovisual synchronization signal generator using audio signature comparison
US5055939A (en) * 1987-12-15 1991-10-08 Karamon John J Method system & apparatus for synchronizing an auxiliary sound source containing multiple language channels with motion picture film video tape or other picture source containing a sound track
US5790236A (en) * 1994-05-12 1998-08-04 Elop Electronics Industries Ltd. Movie processing system
WO2003009273A1 (en) * 2001-07-16 2003-01-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Method and device for characterising a signal and for producing an indexed signal

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2153398C (en) * 1993-01-08 2004-06-29 Jerry Iggulden Method and apparatus for eliminating television commercial messages
JPH1020420A (en) * 1996-06-25 1998-01-23 Sony Cinema Prod Corp Movie film
JP4272050B2 (en) * 2001-05-25 2009-06-03 ドルビー・ラボラトリーズ・ライセンシング・コーポレーション Audio comparison using characterization based on auditory events
US20050022252A1 (en) * 2002-06-04 2005-01-27 Tong Shen System for multimedia recognition, analysis, and indexing, using text, audio, and digital video
EP2442566A3 (en) * 2002-10-15 2012-08-08 Verance Corporation Media Monitoring, Management and Information System
CN1742492B (en) * 2003-02-14 2011-07-20 汤姆森特许公司 Automatic synchronization of audio and video based media services of media content
DE10322722B4 (en) * 2003-05-20 2005-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for synchronizing an audio signal with a movie
ATE373389T1 (en) * 2003-07-25 2007-09-15 Koninkl Philips Electronics Nv METHOD AND DEVICE FOR GENERATING AND DETECTING FINGERPRINTS FOR SYNCHRONIZING AUDIO AND VIDEO

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5040081A (en) * 1986-09-23 1991-08-13 Mccutchen David Audiovisual synchronization signal generator using audio signature comparison
US5055939A (en) * 1987-12-15 1991-10-08 Karamon John J Method system & apparatus for synchronizing an auxiliary sound source containing multiple language channels with motion picture film video tape or other picture source containing a sound track
US5790236A (en) * 1994-05-12 1998-08-04 Elop Electronics Industries Ltd. Movie processing system
WO2003009273A1 (en) * 2001-07-16 2003-01-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. Method and device for characterising a signal and for producing an indexed signal

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
F. JORDAN: "Generating Time Code Information from Analog Sources", 28 May 2005, AUDIO ENGINEERING SOCIETY, BARCELONA, XP009070534 *
See also references of EP1894199A1 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101290621B (en) * 2007-04-17 2011-06-15 上海申瑞电力科技股份有限公司 Safe digital card memory search method
US8989395B2 (en) 2010-12-07 2015-03-24 Empire Technology Development Llc Audio fingerprint differences for end-to-end quality of experience measurement
US9218820B2 (en) 2010-12-07 2015-12-22 Empire Technology Development Llc Audio fingerprint differences for end-to-end quality of experience measurement

Also Published As

Publication number Publication date
JP2008547145A (en) 2008-12-25
DE102005045628B3 (en) 2007-01-11
EP1894199A1 (en) 2008-03-05
JP5137826B2 (en) 2013-02-06

Similar Documents

Publication Publication Date Title
EP1627391B1 (en) Device and method for synchronizing an audio signal with a film
EP1794564B1 (en) Device and method for synchronising additional data and base data
US5040081A (en) Audiovisual synchronization signal generator using audio signature comparison
CN101218648B (en) Device and method for determining a point with film information in a film
EP1968043B1 (en) Musical composition section detecting method and its device, and data recording method and its device
US8205148B1 (en) Methods and apparatus for temporal alignment of media
DE69734430T2 (en) Information recording and playback
DE69924765T2 (en) Apparatus for generating data for recovering video data and apparatus for recovering video data
EP2573773A2 (en) Time alignment of recorded audio signals
EP1894198B1 (en) Device and method for establishing a correlation between a test audio signal playable at a variable speed and a reference audio signal
WO2014164370A1 (en) Systems and methods for interactive broadcast content
DE102005045628B3 (en) Apparatus and method for determining a location in a film having film information applied in a temporal sequence
DE69922193T2 (en) METHOD AND DEVICE FOR THE DYNAMIC SYNCHRONIZATION OF A DIGITAL SOUND TRACK WITH A FILM IN A FILM MEDIUM
EP1872368B1 (en) Device and method for determining a point in a film
WO2000021290A2 (en) Reducing the proportion of an extraneous element in a transmit program
DE102017131266A1 (en) Method for importing additional information to a live transmission
WO2017207348A1 (en) Karaoke system and method for operating a karaoke system
Clunis DVTR Editing Considerations for Multiplexed Audio vs. Separate Audio Edge Tracks

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application
DPE1 Request for preliminary examination filed after expiration of 19th month from priority date (pct application filed from 20040101)
WWE Wipo information: entry into national phase

Ref document number: 2006754259

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 4951/KOLNP/2007

Country of ref document: IN

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 2008517365

Country of ref document: JP

WWW Wipo information: withdrawn in national office

Ref document number: DE

WWE Wipo information: entry into national phase

Ref document number: 200680024917.9

Country of ref document: CN

WWP Wipo information: published in national office

Ref document number: 2006754259

Country of ref document: EP