WO2003052743A1 - Systeme de transmission d'informations, codeur d'informations et decodeur d'informations - Google Patents

Systeme de transmission d'informations, codeur d'informations et decodeur d'informations Download PDF

Info

Publication number
WO2003052743A1
WO2003052743A1 PCT/JP2002/011969 JP0211969W WO03052743A1 WO 2003052743 A1 WO2003052743 A1 WO 2003052743A1 JP 0211969 W JP0211969 W JP 0211969W WO 03052743 A1 WO03052743 A1 WO 03052743A1
Authority
WO
WIPO (PCT)
Prior art keywords
information
intermediate code
voice
sound
audio
Prior art date
Application number
PCT/JP2002/011969
Other languages
English (en)
French (fr)
Inventor
Tetsuya Naruse
Original Assignee
Sony Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corporation filed Critical Sony Corporation
Priority to MXPA03007300A priority Critical patent/MXPA03007300A/es
Priority to EP02805015A priority patent/EP1457971A4/en
Priority to US10/468,106 priority patent/US7415407B2/en
Publication of WO2003052743A1 publication Critical patent/WO2003052743A1/ja

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M11/00Telephonic communication systems specially adapted for combination with other electrical systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B11/00Transmission systems employing sonic, ultrasonic or infrasonic waves

Definitions

  • the present invention relates to an information transmission system capable of transmitting transmission target information via voice, an information encoding device and an information decoding device used therefor.
  • a word or song generated from a human mouth, a musical instrument, or a speaker, a musical piece played by the musical instrument, or a synthetic sound of a sound similar thereto is converted into an electric signal by a microphone or the like.
  • Sending to a remote location the sound is reproduced by speed, and the reproduced sound enters the human ear.
  • character information is transmitted using such a voice communication system.
  • a voice is transmitted by a human reading out a character as it is or by replacing the character information with a voice by a voice synthesizer.
  • these voice information is recognized or converted into character information corresponding one-to-one, and is replaced with word information.
  • FIG. 1 shows a block diagram of a conventional voice communication using voice recognition.
  • character information text information
  • the character information is input from the input device 10 to the storage device 11.
  • the speech synthesizing unit 12 converts the character information into a speech signal.
  • the speech synthesis unit 12 performs speech synthesis based on human words.
  • This synthesized audio signal is converted into an analog waveform by the DAC circuit 13 and sound is output by the speaker 14. It is uttered as a voice waveform on channel 15 (in this case, space). This sound travels through the space to the microphone 16 of the receiver.
  • the audio waveform picked up by the microphone 16 is converted into a digital signal by the ADC circuit 17.
  • This digital signal is converted to character information by pattern matching with a character voice signal after removing the band limitation and unnecessary signal components in a voice recognition unit 18.
  • This character information is stored in the storage device 19. In this way, character information can be transmitted from the transmitting side to the receiving side.
  • Fig. 2 shows a voice communication block diagram using a conventional voice modem.
  • character information input from the input device 20 and stored in the storage device 21 is converted from a character code into a digital signal sequence that can be interpreted by the voice modem 23 in the data transmission unit 22.
  • the voice modem 23 outputs a digital signal sequence of 01 which is not recognized as a character.
  • the voice modem 23 modulates the input digit signal sequence of 01 into a waveform that can pass through the voice band. These signal waveforms are transmitted through a telephone line 25 by the same modular jack 24 as a telephone used for analog voice communication.
  • the voice signal is input to the voice modem 27 from the telephone line 25 through the modular jack 26 through the same communication path as the voice signal.
  • a signal waveform is converted into a digital signal by using a demodulation method for a modulation method equivalent to that of the voice modem 23 on the transmission side.
  • the digitized signal is input to the data receiving unit 28.
  • the data receiving section 28 recognizes the digital signal data as character information and stores it in the storage device 29 as an ASII code of the character information.
  • a recognition rate is not good or processing is slow.
  • there are problems such as the fact that the content to be conveyed is recognized by persons other than the person who wants to convey, and the fact that the content to be conveyed is uncomfortable as voice when encrypted. is there.
  • the encoded voice is unpleasant to humans and unspecified such as broadcast even in a place where many people gather. There is a problem that it cannot be used when a large number of human ears can hear loud sounds.
  • the present invention provides an input / output interface of an audio device that handles an existing voice such as a speech or a microphone by using an information encoding device that converts information to be transmitted into a voice.
  • Information transmission system capable of transmitting information to be transmitted as voice through a communication device and reproducing the information to be transmitted based on the received voice by an information decoding device, and an information encoding device and an information decoding device used therein DISCLOSURE OF THE INVENTION
  • An information transmission system includes an information encoding device that encodes information to be transmitted according to a predetermined encoding method, converts the information into an audio signal, and outputs the audio signal, and outputs audio generated from the information encoding device. And a decoding device for receiving and recognizing the audio waveform and reproducing the original transmission target information.
  • the information transmission system converts information to be transmitted into an intermediate code according to a predetermined encoding method, and outputs a sound obtained by adding music arrangement information to audio information based on the intermediate code.
  • Information mark Encoding apparatus and a decoding apparatus that receives audio generated from the information encoding apparatus, recognizes an audio waveform, decodes the intermediate code, and reproduces the original transmission target information.
  • transmission target information such as character information can be converted into an audio signal and passed through existing audio media.
  • a decoding device By using a decoding device, The original text information can be reproduced based on the original text information.
  • existing audio media such as televisions, radios, telephones, tape recorders, and CDs. Therefore, information can be transmitted only by attaching the encoding device and the decoding device of the present invention to the input / output device while using the existing system.
  • These encoders and decoders can be configured at a relatively low cost, so that they can be widely used.
  • character information is converted to a character code as the information to be transmitted, the character code is converted to the intermediate code, and the intermediate code is assigned to at least one sound element.
  • One element is determined based on the music arrangement information.
  • the sound component can include at least two of pitch, duration, timbre, timbre, melody, or chord.
  • An information encoding apparatus includes: a conversion unit that converts information to be transmitted into an intermediate code according to a predetermined encoding method; and an audio waveform corresponding to audio obtained by adding music arrangement information to audio information based on the intermediate code. Synthesis An audio waveform synthesizing unit that outputs the audio waveform, and an audio output unit that outputs the output of the audio waveform synthesizing unit as audio.
  • the character information is converted into a character code as the transmission target information, and the character code
  • the intermediate code is assigned to at least one sound element, and at least one other element can be determined based on the music arrangement information.
  • the intermediate chord can be assigned to a pitch, a duration, a timbre, a tone, a melody, a chord, and the like. Elements of the sound not assigned to the intermediate code can be arbitrarily arranged.
  • An information decoding apparatus converts an information to be transmitted into an intermediate code according to a predetermined encoding method, and generates an information encoding apparatus that outputs audio obtained by adding music arrangement information to audio information based on the intermediate code.
  • An information decoding device that decodes the original information to be transmitted based on the received voice, voice receiving means for receiving voice, voice waveform recognition means for recognizing the received voice waveform, and the recognized voice. Based on the waveform, a predetermined intermediate
  • FIG. 1 is a block diagram of a conventional voice communication using voice recognition.
  • FIG. 2 is a block diagram of a voice communication using a conventional voice modem.
  • FIG. 3 is a diagram showing the concept of the information transmission system of the present invention.
  • FIG. 4 is a block diagram showing a schematic configuration of an information transmission system according to an embodiment of the present invention.
  • FIG. 5 is a block diagram showing a schematic configuration of an embodiment of an information transmission system using an intermediate code according to the present invention.
  • FIG. 6 is a block diagram of an embodiment of an information transmission system using MIDI according to the present invention.
  • 7A to 7B are diagrams for explaining an encoding method when pitch is used as an intermediate code.
  • FIG. 8 is a diagram showing a specific example of encoding using the intermediate codes of FIGS. 7A to 7B.
  • FIGS. 9A to 9B are diagrams showing conversion tables in the case where a tone length is used as an intermediate code.
  • FIG. 10 is a diagram showing a specific example of encoding using the conversion table 73 of FIG. 9A.
  • FIG. 11 is a diagram showing a specific example of encoding using the conversion table 74 of FIG. 9B.
  • FIGS. 12A to 12E are diagrams showing conversion tables when a melody is used as an intermediate code.
  • FIG. 13 is a diagram showing a specific example of encoding using the conversion table 75 shown in FIGS. 12A to 12E.
  • FIG. 14 is a diagram showing a conversion table when a chord is used.
  • FIG. 15 is a diagram showing a specific example of encoding using the conversion table 76 of FIG.
  • FIG. 16 is a diagram showing an example of a conversion table when a timbre is used.
  • FIG. 17 shows a specific example of encoding using the conversion table 77 of FIG. FIG.
  • FIG. 18 is a diagram showing an example in which intermediate chords are assigned to various sound elements.
  • BEST MODE FOR CARRYING OUT THE INVENTION Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
  • FIG. 3 is a diagram showing the concept of the information transmission system of the present invention.
  • audio signals such as voice and music are transmitted using any communication and transmission media, and transmission target information is transmitted through audible sounds emitted in the air.
  • “Speech” in the present embodiment is mainly a sound in a voice band that can be uttered by humans or a sound in a human auditory band, and a device to be used is an existing analog device or digital device that handles the human hearing band. It is.
  • the “information to be transmitted” is simply textual information, which may be meaningful in itself, and may include information for obtaining further information based on the textual information. The latter use is, for example, IT
  • IT-related devices suitable for use of the present invention include portable information devices such as mobile phones, personal digital assistants (PDAs), mail terminals, and small personal computers, but exclude non-portable information devices It does not do.
  • the user inputs a code such as a character string to be transmitted to the information encoding device 31.
  • FIG. 3 shows an example of inputting a URL address.
  • the information encoding device 31 encodes the code according to a predetermined encoding method, and transmits the encoded voice.
  • a specific example of the encoding method will be described later in detail. Since the voice emitted from the information encoding device 31 has the same frequency band as human voice or music, it can be transmitted using the microphone 32 used for human voice or music. this Sometimes, it can be inserted between human voices and music. It is preferable that the two be separated in time. However, depending on the redundancy at the time of encoding, the code can be extracted from the superimposed signal, so that multiplexing is possible.
  • the signal waveform transmitted from the microphone 32 is reproduced like a normal audio signal after passing through some communication / transmission / storage media.
  • This playback is performed, for example, by speakers 33 installed indoors or outdoors, speakers 36 on television receivers, radio receivers, telephones, etc., playback devices 35 on recording media (publications) such as CDs and DVDs, and audio devices.
  • This is performed by various existing audio output means such as a video recorder and a video recorder / player 37, and the audio is output as an audible sound as air vibration.
  • the audible sound is received by the information decoding device 34 and decoded, whereby the original URL can be reproduced.
  • the URL address can be notified to many persons at the same time.
  • the receiver has the information decryption device 34 or a device having the information decryption device 34
  • the receiver can receive the audio, decode the audio, and confirm the URL address.
  • the device using the URL address can receive the URL address from the information decryption device 34 and use the URL address for using various services.
  • Various services are assumed to be versatile services, such as voice information electronic information provision services. For example, it can be used as a guide for players at baseball bazaars or as an exhibition guide at art museums.
  • a sound band that can be heard by humans may be used, but in art museums, there is a method that uses a non-audible range with a slightly removed audible range. In other words, it is possible to use a band that cannot be heard by the normal human ear and to prevent transmission from being recognized. Also, instead of broadcasting directly inside the building or outdoors, if the equipment has a function to communicate human voice such as television, radio, telephone, etc., communicate as long as the signal uses the voice band. Becomes possible.
  • FIG. 4 is a block diagram showing a schematic configuration of an information transmission system according to an embodiment of the present invention.
  • character information to be transmitted such as URL is input by a user from an arbitrary input device 40.
  • the input character information is temporarily stored in a storage device 41 such as a memory.
  • the character information is converted or encoded by the audio waveform converter 42 into an audio signal that can be decoded on the receiving side.
  • the audio waveform converter 42 can be constituted by a processor such as PU or DSP.
  • the voice waveform conversion unit 42 switches or multiplexes the same (the same applies to other embodiments described later).
  • the coded signal is generally digitally processed, and this digital signal is converted into an analog waveform by a digital analog conversion (D AC) circuit 43.
  • This analog signal is generally emitted from a speaker along with general voice into the air or a communication path 45 through which a voice waveform propagates.
  • the input device 40, the audio waveform converter 42, the DAC circuit 43 and the speaker 44 constitute an information encoding device.
  • the microphone 46 converts the audio waveform into an electric signal
  • the analog-to-digital conversion (ADC) circuit 47 inputs the digital waveform to the audio waveform recognition unit 48 as a digital waveform.
  • the voice waveform recognition unit 48 recognizes each sound and performs a conversion process or a decoding process reverse to the conversion method or coding method used on the transmission side to convert the voice waveform into character information.
  • the voice waveform recognition unit 48 switches, separates or extracts the same (the same applies to other embodiments described later).
  • the microphone 46, the ADC circuit 47, the audio waveform recognition unit 48, and the storage device 49 constitute an information decoding device.
  • FIG. 5 is a block diagram showing a schematic configuration of an embodiment of an information transmission system using an intermediate code.
  • the intermediate code encoding unit 52 converts character information such as URLs input from the input device 50 and stored in the storage device 51 into an intermediate code as an identification code corresponding to the character information.
  • the audio waveform synthesizing section 54 synthesizes an audio waveform signal obtained by adding music arrangement information 53 to audio information based on the intermediate code.
  • the intermediate chord is a pitch (referred to as a pitch in this specification)
  • the music arrangement information may be a sound length (referred to as a duration in this specification), a timbre, or the like.
  • the intermediate code is the length of the note, the melody, pitch, tone, etc.
  • the input device 50, the intermediate code encoder 52, the music arrangement information 53, the audio waveform synthesizer 54, the DAC 55, and the speaker 56 constitute an information encoder.
  • This sound is transmitted to the receiving side via a communication path 57 (for example, a space or an existing broadcasting system or communication system).
  • those voice waveforms are converted into electrical signals by the microphone 58 and input to the voice waveform recognition unit 60 as digital waveforms by the 80 ⁇ circuit 59.
  • the speech waveform recognition unit 60 removes musical arrangement information while recognizing each sound, and extracts an intermediate code by a method reverse to the method embedded on the transmission side.
  • the intermediate code decoding unit 61 decodes the received information as character information by a conversion method in the same manner as the method of encoding the transmission target information into the intermediate code on the transmission side. This Is stored in the storage device 62.
  • Microphones 58, 0 circuit 59, speech waveform recognition unit 60, intermediate code decoding unit 61, and storage device 62 constitute an information decoding device.
  • FIG. 6 is a schematic diagram of the MIDI (Musical Instrument Digital
  • FIG. 2 is a block diagram of an embodiment of an information transmission system using an (Interface).
  • the MDI synthesis unit 64 and the recognition unit 65 that are easier and more versatile can be used.
  • Other configurations are the same as those in FIG. More specifically, a MIDI signal is composed of parameters such as pitch, volume, tone length, and timbre, and only the corresponding parameter is intermediate depending on which parameter the intermediate code corresponds to. Decide according to the code. Other parameters are free, so music arrangement information
  • FIG. 7A to 7B are diagrams for explaining an encoding method when pitch is used as an intermediate code
  • FIG. The applied conversion table 72, 7B is shown on a staff notation, in which seven C, D, and octaves in one octave are represented by frequencies corresponding to pitches.
  • the pitch names of E, F, G, A, and B and silence (rest) N are represented by eight different codes (here, 3-bit binary numbers 0 0 0 to 1 1 1).
  • Fig. 8 (a) shows, for convenience, four alphabets s, o, n, and y as character information to be transmitted. However, it may be any number of characters, numbers, symbols, etc. In this example, as shown in Fig.
  • the character information to be transmitted is temporarily written in an AS CII code (one character is represented by a binary number).
  • AS CII code one character is represented by a binary number.
  • FIG. 8 (c) the intermediate code to the AS CII code Convert to That is, in this example, the AS CII codes are listed as binary numbers, which are divided into three pits and assigned to each pitch intermediate code.
  • Fig. 8 (d) shows the resulting sounds arranged on a musical score. In this example, the pitch is fixed, but it is sufficient if only the pitch is specified according to the character information. Other sound elements are optional.
  • FIGS. 7A to 7B are assigned to pitches, they can also be assigned to pitches.
  • FIG. 9A shows a conversion table 73 in which the lengths of the intermediate chords are equal. In this example, a 2-bit binary number is used as an intermediate code, and the four codes 0, 0, 1, 10, and 11 are assigned to different combinations of notes. However, the total length of different combinations of notes in each intermediate chord is fixed (equal length).
  • FIG. 9B shows a conversion table 74 in which the length of each intermediate code is different. In this example, variable length binary numbers are used for the intermediate chords, and each intermediate chord is assigned to a single note of a different duration.
  • FIG. 10 shows a specific example of encoding using the conversion table 73 of FIG. 9A.
  • Fig. 10 (a) and (b) show the same character information to be transmitted as above and their ASCI I code representations.
  • FIG. 10 (c) shows a tone intermediate code sequence corresponding to the conversion table 73 of FIG. 9A
  • FIG. 10 (d) shows the notes corresponding to the intermediate code sequence on a staff notation. It is a thing. However, since the intermediate code in this example specifies only the pitch, the pitch is arbitrarily determined. Other sound elements can be arbitrarily determined or arranged.
  • FIG. 11 shows a specific example of encoding using the conversion table 74 of FIG. 9B.
  • Fig. 11 (a) and (b) show the same character information to be transmitted and their ASCII code representation as described above.
  • Fig. 11 (c) shows the ninth FIG. 11 (d) shows a note corresponding to the intermediate code string on a staff notation corresponding to the conversion table 74 of FIG. B. Also in this case, since the intermediate code specifies only the pitch, the pitch is determined arbitrarily, and other tone elements can also be determined or arranged arbitrarily.
  • FIG. 12A shows an example of a conversion table 75 using a melody.
  • This conversion table 75 converts different melody (phrases) A, B, C, and D into a 2-bit binary intermediate code. Assigned to. Examples of the melodies A, B C and D are shown in FIGS. 12B to 12E, respectively.
  • melody is assigned to an intermediate code, music arrangement information is not particularly necessary, but it is possible to arrange sound quality and volume.
  • FIG. 13 shows a specific example of encoding using the conversion table 75 of FIG. 12A.
  • Fig. 13 (a) and (b) show the same character information to be transmitted and their ASCII code representations as described above.
  • FIG. 13 (c) shows a melody intermediate code sequence corresponding to the conversion table 75 of FIG. 12A
  • FIG. 13 (d) shows a note corresponding to the intermediate code sequence on a staff notation. It is shown in
  • FIG. 14 shows an example of a conversion table 76 using chords.
  • This conversion table 76 associates different chords with intermediate codes (here, 2-bit binary numbers).
  • intermediate codes here, 2-bit binary numbers
  • the same intermediate chord is associated with two different chords.
  • chords C and G 7 are associated with the intermediate chord 00. This creates redundancy in the available chords.
  • the degree of freedom in arrangement is improved, and it becomes easier to perform coding that leads to musically more appropriate chord progression.
  • music arrangement information is not particularly necessary, but it is still possible to arrange sound quality, volume, and the like.
  • FIG. 15 shows a specific example of encoding using the conversion table 76 of FIG. Fig.
  • FIG. 15 (a) and (b) show the same character information to be transmitted as above and their ASCII code representation.
  • FIG. 15 (c) shows a chord intermediate chord sequence corresponding to the conversion table 76 of FIG. 14, and
  • FIG. 15 (d) shows an example of a chord corresponding to the intermediate chord sequence.
  • FIG. 16 shows an example of a conversion table 77 using timbres.
  • the conversion table 77 associates different timbres with intermediate codes (here, 1-bit binary numbers). As the different timbres, a humming vibration waveform is assigned to bit 0 and a whistle oscillation waveform is assigned to bit 1. If the number of timbres is further increased, the number of intermediate code bits allocated to one timbre can be increased. For example,
  • the intermediate chord can be 2 bits.
  • other sound elements can be arbitrarily determined as music arrangement information.
  • FIG. 17 shows a specific example of encoding using the conversion table 77 of FIG. Fig. 17 (a) and (b) show the same character information to be transmitted as above and their ASCI I code representations.
  • FIG. 17 (c) shows a tone color intermediate code string corresponding to the conversion table 77 shown in FIG. The illustration of the tone color row corresponding to this intermediate code row is omitted.
  • FIG. 18 shows such an example.
  • Figures 18 (a) and 18 (b) show the same character information to be transmitted and their AS CII code representations as described above.
  • the most significant 2 bits of 8 bits per character of the AS CII code are assigned to the pitch
  • the next 2 high-order bits are assigned to the pitch
  • the lower 4 bits are assigned to the sound quality.
  • the sound quality is also related to the above timbre, but the sound quality here It assumes different qualities of sounds that can be perceived by musical instruments. If 4 bits are used, 256 different sound qualities can be used. In the example of Fig.
  • pitch C or G for 00 can be selectively assigned to each of the two most significant bits of the ASCII code in the example of Fig. 18 or the lower 4 bits. It is possible to selectively assign different instrument sounds (for example, piano and flute sounds to 011) to each chord.
  • the transmission and reception speeds are made to match in advance in order to synchronize the transmitting side and the receiving side.
  • ASCII code was used to convert the character information into the intermediate code
  • other character codes may be used.
  • the information transmission system of the present invention includes an information encoding device that converts information to be transmitted into audio, and an information decoding device that reproduces the original information to be transmitted from the audio.
  • the information to be transmitted can be transmitted as voice via the input / output interface of the audio equipment that handles voice.
  • such audio can be transmitted with another audio signal.
  • Since the information to be transmitted is converted into audio and transmitted, it can be easily transmitted using existing audio media such as radio and television.
  • the operability of the IT device can be improved.

Description

明細 ; 情報伝達システム、 情報符号化装置および情報復号装置 技術分野
本発明は、 音声を媒介として伝達対象情報を伝達することができる情 報伝達システムならびにそのために用いる情報符号化装置および情報復 号装置に関する。 背景技術 '
従来の音声通信システムにおける送信装置では、 人間の口や楽器また はスピーカから発生する言葉や歌、 楽器で演奏される楽曲またはそれに 似た音の合成音をマイク等により電気信号に変換することによって離れ た場所に送信している。 この電気信号を受ける受信装置では、 音声がス ピー力によって再生され、 この再生音が人間の耳に入る。 このような音 声通信システムを用いて、 文字情報を伝達する場合もある。 この場合、 人間が文字をそのまま読み上げたり、 音声合成装置により文字情報を音 声に置きかえることにより、 音声の発信が行われる。 また、 受信側では、 これらの音声情報から一対一に対応する文字情報に認識または変換する ことによって、 言葉の情報に置きかえられる。
第 1図に従来の音声認識を用いた音声通信ブロック図を示す。 U R L アドレス等の文字情報 (テキスト情報) を音声を使って伝える場合に、 入力装置 1 0から記憶装置 1 1に文字情報を取り込む。 ついで、 音声合 成部 1 2により、 文字情報を音声信号に変換する。 この際、 音声合成部 1 2では、 人間の言葉を元に音声合成を行う。 この合成された音声信号 は、 D A C回路 1 3によりアナログ波形に変換しスピーカ 1 4により音 声波形として、 通信路 1 5 (この場合、 空間) に発声される。 この音声 は、 空間を伝って受信部のマイク 1 6まで伝わる。 マイク 1 6で拾われ た音声波形は、 A D C回路 1 7により、 ディジタル信号に変換される。 このディジタル信号は、 音声認識部 1 8において帯域制限や不要な信号 成分を取り除いた後、 文字の音声信号とのパターンマッチングにより文 字情報に変換される。 この文字情報は記憶装置 1 9に格納される。 この ようにして、 送信側から受信側に文字情報を伝えることができる。 また、 音声モデムのように音声の帯域による通信を利用した符号化、 復号方法もあるが、 この場合は、 有線の電話線等の音声の通る閉ざされ た通信路 1 5が利用される場合が多い。 第 2図に従来の音声モデムを用 いた音声通信プロック図を示す。
まず、 入力装置 2 0から入力され記憶装置 2 1に格納された文字情報 は、 データ送信部 2 2において文字コードから音声モデム 2 3が解釈し うるディジタル信号列に変換される。 音声モデム 2 3には、 文字とは認 識されない 0 1のディジタル信号列を出力する。 音声モデム 2 3は、 入 力された 0 1のディジ夕ル信号列を音声帯域を通過できる波形に変調す る。 それらの信号波形は、 アナログの音声通話に利用する電話と同じモ ジユラジャック 2 4により、 電話線 2 5を通って送信される。
受信側では、 通話音声と同じ通信路を通って、 電話線 2 5からモジュ ラジャック 2 6を通して、 音声モデム 2 7に入力される。 この音声モデ ム 2 7において、 送信側の音声モデム 2 3と同等の変調方式に対する復 調方式を用いて信号波形からディジタルの信号に変換される。 このディ ジ夕ル信号化された信号をデータ受信部 2 8に入力する。 データ受信部 2 8では、 ディジタル信号のデータを文字情報として認識し、 記憶装置 2 9に文字情報の A S I Iコードとして記憶される。 上記従来の技術で述べた音声を利用した情報伝達システムでは、 人間 の言葉をそのまま音声に変換する場合には、 認識率が良くなかったり、 処理が遅かったりする問題点があった。 さらに、 伝えたい内容が伝えた い相手以外の者にも認識されてしまうこと、 これに対して伝えたい内容 を暗号化したときに音声として不快に感じられたりすること、 などの問 題点がある。
また、 音声モデム等の従来方式の音声帯域の通信を利用した符号化、 復号方法では、 その符号化された結果の音声が人間にとって不快であり 人がたくさん集まるようなところでも放送などの不特定多数の人間の耳 に大きな音で聞こえる場合には利用できないという問題点があった。
本発明は、 このような背景の下に、 伝達対象情報を音声に変換する情 報符号化装置を用いることにより、 スピ一力やマイクなどの既存の音声 を扱う音響機器の入出力ィンターフェースを介して、 伝達対象情報を音 声として伝達し、 さらに情報復号装置により、 受信した音声に基づいて 伝達対象情報を再生することができる情報伝達システムならびにこれに 用いる情報符号化装置および情報復号装置を提供することを目的とする , 発明の開示
本発明による情報伝達システムは、 予め定めた符号化方式に従って伝 達対象情報を符号化して音声信号に変換し、 音声として出力する情報符 号化装置と、 この情報符号化装置から発生した音声を受信し、 音声波形 を認識し、 元の伝達対象情報を再生する復号装置とを備えたことを特徴 とする。
本発明による情報伝達システムは、 他の見地によれば、 予め定めた符 号化方式に従って伝達対象情報を中間コードに変換し、 この中間コード に基づく音声情報に音楽アレンジ情報を付加した音声を出力する情報符 号化装置と、 この情報符号化装置から発生した音声を受信し、 音声波形 を認識し、 前記中間コードを復号して元の伝達対象情報を再生する復号 装置とを備えたことを特徴とする。
このように、 符号化装置を用いることにより、 文字情報等の伝送対象 情報を音声信号に変換し、 既存の音声メディアを通すことが可能となる, さらに、 復号装置を用いることにより、 前記音声に基づいて元の文字情 報を再生するができる。 特に、 既存の音声メディア、 例えば、 テレビ、 ラジオ、 電話、 テープレコーダ、 C D等にその情報を通すことが可能と なる。 このため、 既存のシステムを利用したまま入出力装置に本発明の 符号化装置および復号装置を取り付けるだけで、 情報を送信することが 可能となる。 これらの符号化装置および復号装置は、 比較的安価に構成 することが可能なため、 幅広い利用が可能となる。
また、 音声信号に置き換えた時に、 音声モデムのような不快な音では なく、 音楽のように人間にとって快適な音にすることが可能であり、 こ れによって、 スピーカによる広域エリアに対する放送や館内放送等にも 利用することができる。
より具体的には、 前記伝達対象情報として文字情報を文字コードに変 換し、 この文字コードを前記中間コードに変換し、 この中間コードを少 なくとも一つの音の要素に割り当て、 他の少なくとも一つの要素を音楽 アレンジ情報に基づいて決定する。 この音の要素は、 音の高さ、 長さ、 音色、 音質、 メロディ、 または和音のうちの少なくとも二つを含むこと ができる。
本発明による情報符号化装置は、 予め定めた符号化方式に従って伝達 対象情報を中間コードに変換する変換手段と、 この中間コードに基づく 音声情報に音楽アレンジ情報を付加した音声に対応する音声波形を合成 する音声波形合成部と、 この音声波形合成部の出力を音声として出力す る音声出力手段とを備える。
前記伝達対象情報として文字情報を文字コードに変換し、 この文字コ
―ドを前記中間コードに変換し、 この中間コードを少なくとも一つの音 の要素に割り当て、 他の少なくとも一つの要素を音楽アレンジ情報に基 づいて決定することができる。
前記中間コードは、 音の高さ、 音の長さ、 音色、 音質、 メロディ、 和 音などに割り当てることができる。 中間コ一ドに割り当てられなかった 音の要素は任意にアレンジすることが可能である。
本発明による情報復号装置は、 予め定めた符号化方式に従って伝達対 象情報を中間コードに変換し、 この中間コードに基づく音声情報に音楽 アレンジ情報を付加した音声を出力する情報符号化装置から発生した音 声に基づいて元の伝達対象情報を復号する情報復号装置であって、 音声 を受信する音声受信手段と、 受信された音声波形を認識する音声波形認 識手段と、 この認識された音声波形に基づいて、 予め定められた中間コ
―ドを復号し、 この中間コードに基づいて元の伝達対象情報を再生する 中間コード復号手段とを備える。 図面の簡単な説明
第 1図は、 従来の音声認識を用いた音声通信ブロック図である。 第 2図は、 従来の音声モデムを用いた音声通信ブロック図である。 第 3図は、 本発明の情報伝達システムの概念を示す図である。
第 4図は、 本発明による情報伝達システムの一実施の形態の概略構成 を示すブロック図である。
第 5図は、 本発明による中間コードを用いた情報伝達システムの実施 の形態の概略構成を示すブロック図である。 第 6図は、 本発明の M I D Iを利用した情報伝達システムの実施の形 態のブロック図である。
第 7 A図乃至第 7 B図は、 中間コードとして音高を用いた場合の符号 化方式を説明するための図である。
第 8図は、 第 7 A図乃至第 7 B図の中間コードを用いた符号化の具体 例を示した図である。
第 9 A図乃至第 9 B図は、 中間コードとして音長を用いた場合の変換 テーブルを示した図である。
第 1 0図は、 第 9 A図の変換テーブル 7 3を用いた符号化の具体例を 示した図である。
第 1 1図は、 第 9 B図の変換テーブル 7 4を用いた符号化の具体例を 示した図である。
第 1 2 A図乃至第 1 2 E図は、 中間コードとしてメロディを用いた場 合の変換テーブルを示した図である。
第 1 3図は、 第 1 2 A図乃至第 1 2 E図の変換テーブル 7 5を用いた 符号化の具体例を示した図である。
第 1 4図は、 和音を用いた場合の変換テーブルを示した図である。 第 1 5図は、 第 1 4図の変換テーブル 7 6を用いた符号化の具体例を 示した図である。
第 1 6図は、 音色を用いた場合の変換テーブルの例を示した図である 第 1 7図は、 第 1 6図の変換テ一ブル 7 7を用いた符号化の具体例を 示した図である。
第 1 8図は、 中間コードを種々の音要素に割り当てた例を示す図であ る。 発明を実施するための最良の形態 以下、 本発明の実施の形態について、 図面を参照して詳細に説明する 第 3図は、 本発明の情報伝達システムの概念を示す図である。 本発明 では、 任意の通信、 伝達メディアを利用し、 音声や音楽のようなオーデ ィォ信号を伝達するとともに、 空中に発せられた可聴音を介して伝達対 象情報を伝達するものである。 本実施の形態における 「音声」 とは、 主 として、 人間の発声できる音声帯域または人間の聴覚帯域の音であり、 使用する機器も、 人間の聴覚帯域を扱う既存のアナログ機器やディジ夕 ル機器である。 「伝達対象情報」 としては、 端的には文字情報であり、 それ自体で意味のあるものの他、 その文字情報に基づいてさらに他の情 報を得るためのものも含みうる。 後者の用途は、 例えば、 I T
(Information Technology)関連機器のアクセス先の特定のために必 要な UR L (Universal Resource Locat or)アドレスやメ—— レアドレ ス等の文字情報である。 このような文字情報を音声信号にして送信する ことによって、 受信側で人間がそのような文字情報を手で入力する必要 なく情報復号装置によって I T関連機器に入力することが可能となり、 その操作性が大幅に向上する。 本発明の利用に相応しい I T関連機器に は、 携帯電話、 携帯情報端末 (PDA) 、 メール端末、 小型パーソナル コンピュータのような携帯型の情報機器が挙げられるが、 非携帯型の情 報機器を排除するものではない。
まず、 送信部において、 ユーザは伝達したい文字列等のコ一ドを情報 符号化装置 3 1に入力する。 第 3図では、 URLアドレスを入力する例 を示している。 情報符号化装置 3 1は、 このコードを予め定められた符 号化方式に従って符号化し、 符号化された音声として発信する。 符号化 方式の具体例については後に詳述する。 情報符号化装置 3 1から発せら れる音声は、 周波数帯域が人の音声または音楽と同じため、 人の音声ま たは音楽に利用するマイク 3 2を利用して送信することができる。 この 時、 人の音声や音楽の合間に挿入することも可能である。 両者は時間的 に分けることが好ましいが、 符号化するときの冗長度によっては、 重畳 信号から符号を抽出することもできるので、 多重化することも可能であ る。
マイク 3 2から送信された信号波形は、 いくつかの通信 ·伝達 '記憶 媒体を通った後、 通常の音声信号と同様に再生される。 この再生は例え ば屋内や野外に設置されたスピーカ 3 3、 テレビ受像機, ラジオ受信機, 電話等 3 6のスピーカ、 C D, D V D等の記録媒体 (出版物) の再生装 置 3 5、 オーディオやビデオの録音再生器 3 7のような種々の既存の音 声出力手段により行われ、 空気の振動としての可聴音として音声が出力 される。 この可聴音を情報復号装置 3 4で受信し、 復号することにより, 元の U R Lを再生することができる。
例えば、 U R Lアドレスを符号化し、 館内放送やイベント等の,屋外の 放送でこの符号化された音声を放出することにより、 多数の者に同時に 当該 U R Lアドレスを報知することができる。 受信者は、 情報復号装置 3 4またはそれを内蔵した機器を持っている場合に当該音声を受信し、 復号してその U R Lアドレスを確認することができる。 この場合に、 U R Lアドレスを利用する機器は、 情報復号装置 3 4から U R Lアドレス を受け取って、 各種のサービス利用のために当該 U R Lアドレスを用い ることができる。 各種のサービスには、 音声サ一ビスの電子情報の提供 サービス等、 多用なサービスが想定される。 例えば、 野球塲での選手紹 介や、 美術館での展示ガイドなどに利用することができる。 ただし、 野 球場では、 人間に聞こえる音声帯域を利用してよいが、 美術館等では、 可聴域を少しはずした非可聴域を利用する方法もある。 すなわち、 通常 の人間の耳には聞くことができない帯域を利用して、 送信したことが分 からないようにすることも可能である。 また、 館内や屋外で直接放送する場合ではなく、 テレビやラジオ、 電 話等の人間の音声を通信する機能を持ち合わせている機器においては、 信号が音声帯域を使用している限りは通信することが可能となる。
第 4図は、 本発明による情報伝達システムの一実施の形態の概略構成 を示すブロック図である。 ここでは、 システム全体の構成を説明する。 まず、 U R L等の伝送対象文字情報が、 ユーザが任意の入力装置 4 0 から入力される。 入力された文字情報は一旦メモリ等の記憶装置 4 1に 記憶される。 この文字情報を、 音声波形変換部 4 2が、 受信側で復号で きるような音声信号に変換または符号化する。 音声波形変換部 4 2は P Uや D S P等のプロセッサにより構成することができる。 他の音声と ともに伝送する場合には、 音声波形変換部 4 2は、 その切替または多重 化を行う (後述する他の形態についても同様) 。 符号化された信号は、 一般にディジタル処理されており、 このディジタル信号をデジタルアナ ログ変換 (D A C ) 回路 4 3によりアナログ波形に変換する。 このアナ ログ信号は、 一般的にスピーカより一般の音声と共に空気中または音声 波形が伝播する通信路 4 5に放出される。 入力装置 4 0、 音声波形変換 部 4 2、 D A C回路 4 3およびスピーカ 4 4が情報符号化装置を構成す る。
受信側では、 マイク 4 6によりそれらの音声波形を電気信号に変換し アナログデジタル変換 (A D C ) 回路 4 7により、 ディジタル的な波形 として音声波形認識部 4 8に入力される。 この音声波形認識部 4 8にお いて、 各音を認識し、 送信側で利用した変換方式または符号化方式と逆 の変換処理または復号化処理を行って、 音声波形を文字情報に変換する, 他の音声とともに伝送される場合には、 音声波形認識部 4 8はその切替 または分離もしくは抽出を行う (後述する他の形態についても同様) 。 マイク 4 6、 A D C回路 4 7、 音声波形認識部 4 8および記憶装置 4 9 が情報復号装置を構成する。
第 5図は、 中間コードを用いた情報伝達システムの実施の形態の概略 構成を示すブロック図である。 入力装置 5 0から入力され記憶装置 5 1 に格納された U R L等の文字情報を、 中間コード符号化部 5 2が、 文字 情報に対応するような識別コードとしての中間コードに変換する。 続く 音声波形合成部 5 4では、 中間コードに基づく音声情報に対して音楽の アレンジ情報 5 3を付加した音声の波形信号を合成する。 例えば、 中間 コードが音の高さ (本明細書では音高という) であれば、 音楽アレンジ 情報は、 音の長さ (本明細書では音長という) や音色などにすることが できる。 また、 中間コ一ドを音の長さとした場合には、 メロディ一や音 高や音色などについては、 任意にアレンジすることができる。 このァレ ンジにおいて、 既存の曲の一部において所定の音要素を変更することに より、 既存の曲内に文字情報を組み込むことも可能である。 ついで、 D A C 5 5によりアナログ波形に変換してスピーカ 5 6から発生される。 入力装置 5 0、 中間コード符号化部 5 2、 音楽アレンジ情報 5 3、 音声 波形合成部 5 4、 D A C 5 5およびスピーカ 5 6が情報符号化装置を構 成する。
この音声は通信路 5 7 (例えば空間や既存の放送システムや通信シス テム等) を介して受信側に伝わる。 受信側では、 マイク 5 8によりそれ らの音声波形を電気信号に変換し、 八0〇回路5 9にょり、 ディジタル 的な波形として音声波形認識部 6 0に入力される。 音声波形認識部 6 0 では、 各音を認識しつつ音楽的なアレンジ情報を取り除き、 送信側で埋 め込まれた方法と逆の方法により、 中間コードを抽出する。 続く中間コ 一ド復号部 6 1では、 送信側で伝達対象情報を中間コードに符号化した 方法と同様に変換方法により、 受信情報を文字情報として復号する。 こ の文字情報は記憶装置 62に格納される。 マイク 58、 0( 回路 5 9. 音声波形認識部 6 0、 中間コード復号部 6 1および記憶装置 6 2が情報 復号装置を構成する。
第 6図は、 本発明の M I D I (Musical Instrument Digital
Interface)を利用した情報伝達システムの実施の形態のブロック図で ある。 第 5図で説明した中間コードに M I D Iのフォーマツト上のパラ メ一夕を対応付けることで、 より容易で汎用性のある M I D Iの合成部 64および認識部 65を使用することができる。 他の構成は、 第 5図の 場合と同様である。 より具体的には、 M I D I信号は、 音高、 音量、 音 長、 音色などのパラメータからなっており、 中間コードがそれらのどの パラメ一夕に該当するかによつて、 該当するパラメータのみを中間コ一 ドに従って決定する。 他のパラメータは自由なので、 音楽アレンジ情報
53により任意にアレンジすることができる。
以下、 中間コードを用いた符号化の具体的な例について説明する。
第 7 A図乃至第 7 B図は、 中間コードとして音高を用いた場合の符号 化方式を説明するための図であり、 第 7 A図は音高を中間コ一ドに害 (Jり 当てた変換テ一ブル 7 2、 第 7 B図はそれを五線譜上に表したものであ る。 ここでは、 音高に相当する周波数で表される 1オクターブ中の 7個 の C, D, E, F, G, A, Bの音名と無音 (休符) Nを 8個の異なる コード (ここでは 3ビットの 2進数 0 0 0から 1 1 1) で表している。 第 8図は、 この中間コ一ドを用いた符号化の具体例を示したものであ る。 第 8図 (a) は、 伝達対象の文字情報として 4つのアルファベット s , o, n, yを便宜上挙げているが、 任意個数の文字、 数字、 記号等 であってよい。 この例では、 第 8図 (b) に示すように、 伝達対象の文 字情報を一旦 AS C I Iコード ( 1文字は 2進数で 8ビット) に変換し さらに、 第 8図 (c) に示すように、 この AS C I Iコードを中間コー ドに変換する。 すなわち、 この例では、 AS C I Iコードを 2進数とし て羅列し、 それを 3ピット単位で区切って各音高中間コードに割り当て ている。 第 8図 (d) はこの結果得られた音を譜面上に並べたものであ る。 この例では、 音長を一定としているが、 音高のみ文字情報にしたが つて指定すれば足りるので、 音長は図示のもの (四分音符) に限らず任 意である。 他の音の要素についても任意である。
第 7 A図乃至第 7 B図の中間コードは音高に割り当てたが、 音長に割 り当てることも可能である。 第 9 A図は、 各中間コードの音長が等しい 変換テーブル 7 3を示す。 この例では、 2ビットの 2進数を中間コード として用い、 その 4通りのコード 0 0, 0 1 , 1 0 , 1 1をそれぞれ異 なる音符の組み合わせに割り当てている。 但し、 各中間コードの異なる 音符の組み合わせの合計の長さは一定 (等長音) としている。 第 9 B図 は、 各中間コードの音長が異なる変換テーブル 7 4を示す。 この例では、 中間コードに可変長の 2進数を用い、 各中間コードを異なる音長の単一 の音符に割り当てている。
第 1 0図は、 第 9 A図の変換テーブル 7 3を用いた符号化の具体例を 示したものである。 第 1 0図 (a) (b) は上記と同様の伝達対象の文 字情報およびその AS C I Iコード表現である。 第 1 0図 (c ) は第 9 A図の変換テーブル 7 3に対応した音調中間コード列であり、 第 1 0図 (d) は、 その中間コード列に対応する音符を五線譜上に表したもので ある。 但し、 本例での中間コードは音長のみを規定しているので、 音高 は任意に決定したものである。 他の音要素も任意に決定またはアレンジ することができる。
第 1 1図は、 第 9 B図の変換テーブル 7 4を用いた符号化の具体例を 示したものである。 第 1 1図 (a) (b) は上記と同様の伝達対象の文 字情報およびその A S C I Iコード表現である。 第 1 1図 (c ) は第 9 B図の変換テーブル 7 4に対応した音調中間コード列であり、 第 1 1図 ( d ) は、 その中間コード列に対応する音符を五線譜上に表したもので ある。 この場合も、 中間コ一ドは音長のみを規定しているので、 音高は 任意に決定したものであり、 他の音要素も任意に決定またはアレンジす ることができる。
第 1 2 A図は、 メロディを用いた変換テーブル 7 5の例を示している, この変換テーブル 7 5は、 異なるメロディ (フレーズ) A, B, C , D を 2ビットの 2進数の中間コードに割り当てている。 各メロディ A , B C , Dの例を第 1 2 B図乃至第 1 2 E図にそれぞれ示している。 メロデ ィを中間コードに割り当てる場合には、 音楽アレンジ情報は特に必要で はないが、 音質、 音量等をアレンジすることが可能である。
第 1 3図は、 第 1 2 A図の変換テーブル 7 5を用いた符号化の具体例 を示したものである。 第 1 3図 (a ) ( b ) は上記と同様の伝達対象の 文字情報およびその A S C I Iコード表現である。 第 1 3図 (c ) は第 1 2 A図の変換テーブル 7 5に対応したメロディ中間コ一ド列であり、 第 1 3図 (d ) は、 その中間コード列に対応する音符を五線譜上に表し たものである。
第 1 4図は、 和音を用いた変換テーブル 7 6の例を示している。 この 変換テ一ブル 7 6は、 異なる和音と中間コ一ド (ここでは、 2ビットの 2進数) とを対応付けている。 この例では、 同じ中間コードに異なる 2 つの和音を対応付けている。 例えば、 中間コード 0 0に和音 Cと G 7を 対応付けている。 これによつて、 使用できる和音に冗長度が生じる。 そ の結果、 アレンジの自由度が向上し、 音楽的により適切な和音進行とな るような符号化を行いやすくなる。 和音を中間コ一ドに割り当てる場合 も音楽アレンジ情報は特に必要ではないが、 やはり音質、 音量等をァレ ンジすることが可能である。 第 1 5図は、 第 1 4図の変換テーブル 76を用いた符号化の具体例を 示したものである。 第 1 5図 (a) (b) は上記と同様の伝達対象の文 字情報およびその AS C I Iコード表現である。 第 1 5図 (c) は第 1 4図の変換テーブル 7 6に対応した和音中間コード列であり、 第 1 5図 (d) は、 その中間コード列に対応する和音の例を表したものである。 第 1 6図は、 音色を用いた変換テーブル 7 7の例を示してい-る。 この 変換テーブル 77は、 異なる音色と中間コード (ここでは、 1ビットの 2進数) とを対応付けている。 ここでの異なる音色としては、 ビット 0 に対してハミングの振動波形を割り当て、 ビット 1に対して口笛の振動 波形を割り当てている。 さらに音色の個数を増加させれば、 1個の音色 に割り当てる中間コードのビッ卜数を増加させることができる。 例えば,
4個の音色を用いれば中間コードは 2ビットとすることができる。 音色 を中間コードに割り当てる場合、 他の音要素は音楽アレンジ情報として 任意に決定可能である。
第 1 7図は、 第 1 6図の変換テーブル 7 7を用いた符号化の具体例を 示したものである。 第 1 7図 (a) (b) は上記と同様の伝達対象の文 字情報およびその AS C I Iコード表現である。 第 1 7図 (c) は第 1 6図の変換テーブル 7 7に対応した音色中間コード列である。 この中間 コ一ド列に対応する音色の列の図示は省略する。
以上、 中間コードを種々の音要素に割り当てた例を示したが、 上述の 複数の要素を組み合わせて用いることも可能である。 第 1 8図にそのよ うな一例を示す。 第 1 8図 (a) (b) は上記と同様の伝達対象の文字 情報およびその AS C I Iコード表現である。 この例では、 AS C I I コードの 1文字 8ビットの最上位 2ビットを音高に割り当て、 次の上位 2ビットを音長に割り当て、 さらに、 下位 4ビットを音質に割り当てて いる。 音質は上記の音色とも関係するが、 ここでいう音質は例えば異な る楽器などから感知せられる異なる音の質を想定している。 4ビットを 用いれば 2 5 6通りの異なる音質が使用できる。 第 1 8図の例では、 1 つの文字が与えられれば、 それの音高、 音長および音質が限定されるが、 音量の自由度は残る。 1つの中間コ一ドに割り当てる 1つの要素の内容 に冗長度を持たせることにより、 さらなる自由度を付与することもでき る。 例えば、 第 1 8図の例における A S C I Iコードの最上位 2ビット の各コードに対して複数の音高 (例えば 0 0に対して音高 Cまたは G ) を選択的に割り当てたり、 下位 4ビッ卜の各コードに対して異なる楽器 の音 (例えば 0 0 1 1に対してピアノとフルートの音) を選択的に割り 当てたりすることができる。
なお、 常に無音状態から、 本発明の、 文字情報を含む音声が発生され る場合には必ずしも必要ないが、 上記いずれの符号化方式においても、 音声として発生される文字情報の開始点を示すために、 通常の文字とし て使用されない文字コード (例えば 1 1 1 1 1 1 1 1 ) を送信文字列の前に付 加するようにしてもよい。 終了点を示すために、 別の不使用文字コード を、 送信文字列の最後に付加してもよい。 あるいは、 開始点等を示すた めに文字コードを用いるのではなく、 予め定めた使用しない周波数の短 い音を利用することも可能である。 そのためには、 復号装置には、 その ような開始点または終了点となる音を識別する手段を追加する。 また、 送信側と受信側の同期を取るために送受信速度は予め一致させておく。 以上、 本発明の好適な実施の形態について説明したが、 上記で言及し た以外にも、 種々の変形、 変更が可能である。 例えば、 文字情報を中間 コードに変換する際に A S C I Iコードを用いたが、 他の文字コードを 用いてもよい。 音質を単独で中間コードに割り当てる例は示さなかった が、 そのような割り当ても可能である。 また、 定量的な音の要素、 例え ば音の高さ、 については、 各音自体に中間コードを割り当てるのではな く、 隣接する音の差分情報に中間コードを割り当てるようにすることも 可能である。
本発明の情報伝達システムは、 伝達対象情報を音声に変換する情報符 号化装置と、 この音声を元の伝達対象情報を再生する情報復号装置を設 けることにより、 スピーカやマイクなどの既存の音声を扱う音響機器の 入出力インタ一フェースを介して、 伝達対象情報を音声として伝達する ことができる。 また、 このような音声を他の音声信号とととに伝送する ことができる。
伝達対象情報を音声に変換して伝達するので、 ラジオやテレビのよう な既存の音声メディアを利用して容易に伝送可能である。
館内や屋外等の広いエリァで、 伝達対象情報を含めた音声を放送する ことが可能である。
いずれの場合も、 音の特定の要素を伝達対象情報の符号化に利用する ことにより、 他の音の要素を音楽的にアレンジすることが可能となる。 これによつて、 不快な音でなく、 音楽のように人間にとって快適な音に することが可能となる。
また、 本発明の情報復号装置を I T機器と組み合わせることにより、 I T機器の操作性を向上させることができる。

Claims

請求の範囲
1 . 予め定めた符号化方式に従って伝達対象情報を符号化して音声信 号に変換し、 音声として出力する情報符号化装置と、
この情報符号化装置から発生した音声を受信し、 音声波形を認識し、 元の伝達対象情報を再生する復号装置と、
を備えたことを特徴とする情報伝達システム。
2 . 予め定めた符号化方式に従って伝達対象情報を中間コードに変換 し、 この中間コードに基づく音声情報に音楽ァレンジ情報を付加した音 声を出力する情報符号化装置と、
この情報符号化装置から発生した音声を受信し、 音声波形を認識し、 前記中間コードを復号して元の伝達対象情報を再生する復号装置と、 を備えたことを特徴とする情報伝達システム。
3 . 前記伝達対象情報として文字情報を文字コ一ドに変換し、 この文 字コ一ドを前記中間コードに変換し、 この中間コードを少なくとも一つ の音の要素に割り当て、 他の少なくとも一つの要素を音楽アレンジ情報 に基づいて決定することを特徴とする請求の範囲第 2項記載の情報伝達 システム。
4 . 前記音の要素は、 音の高さ、 長さ、 音色、 音質、 メロディ、 また は和音のうちの少なくとも二つを含むことを特徴とする請求の範囲第 3 項記載の情報伝達システム。
5 . 予め定めた符号化方式に従って伝達対象情報を中間コードに変換 する変換手段と、
この中間コードに基づく音声情報に音楽アレンジ情報を付加した音声 に対応する音声波形を合成する音声波形合成部と、
この音声波形合成部の出力を音声として出力する音声出力手段と、 を備えた情報符号化装置。
6 . 前記伝達対象情報として文字情報を文字コードに変換し、 この文 字コードを前記中間コードに変換し、 この中間コードを少なくとも一つ の音の要素に割り当て、 他の少なくとも一つの要素を音楽アレンジ情報 に基づいて決定することを特徴とする請求の範囲第 5項記載の情報符号 化装置。
7 . 前記中間コードを音の高さに割り当てたことを特徴とする請求の 範囲第 6項記載の情報符号化装置。
8 . 前記中間コードを音の長さに割り当てたことを特徴とする請求の 範囲第 6項記載の情報符号化装置。
9 . 前記中間コ一ドを音色に割り当てたことを特徴とする請求の範囲 第 6項記載の情報符号化装置。
1 0 . 前記中間コードを音質に割り当てたことを特徴とする請求の範 囲第 6項記載の情報符号化装置。
1 1 . 前記中間コードをメロディに割り当てたことを特徴とする請求 の範囲第 6項の情報符号化装置。
1 2 . 前記中間コードを和音に割り当てたことを特徴とする請求の範 囲第 6項の情報符号化装置。
1 3 . 予め定めた符号化方式に従って伝達対象情報を中間コードに変 換し、 この中間コードに基づく音声情報に音楽アレンジ情報を付加した 音声を出力する情報符号化装置から発生した音声に基づいて元の伝達対 象情報を復号する情報復号装置であつて、
音声を受信する音声受信手段と、
受信された音声波形を認識する音声波形認識手段と、 この認識された音声波形に基づいて、 予め定められた中間コードを復 号し、 この中間コードに基づいて元の伝達対象情報を再生する中間コー ド復号手段と、
を備えた情報復号装置。
PCT/JP2002/011969 2001-12-17 2002-11-15 Systeme de transmission d'informations, codeur d'informations et decodeur d'informations WO2003052743A1 (fr)

Priority Applications (3)

Application Number Priority Date Filing Date Title
MXPA03007300A MXPA03007300A (es) 2001-12-17 2002-11-15 Sistema de transmision de informacion, aparato de codificacion de informacion, y aparato de decodificacion de informacion.
EP02805015A EP1457971A4 (en) 2001-12-17 2002-11-15 INFORMATION TRANSMISSION SYSTEM, INFORMATION ENCODER AND INFORMATION DECODER
US10/468,106 US7415407B2 (en) 2001-12-17 2002-11-15 Information transmitting system, information encoder and information decoder

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2001383732A JP2003186500A (ja) 2001-12-17 2001-12-17 情報伝達システム、情報符号化装置および情報復号装置
JP2001-383732 2001-12-17

Publications (1)

Publication Number Publication Date
WO2003052743A1 true WO2003052743A1 (fr) 2003-06-26

Family

ID=19187624

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2002/011969 WO2003052743A1 (fr) 2001-12-17 2002-11-15 Systeme de transmission d'informations, codeur d'informations et decodeur d'informations

Country Status (6)

Country Link
US (1) US7415407B2 (ja)
EP (1) EP1457971A4 (ja)
JP (1) JP2003186500A (ja)
CN (1) CN1253852C (ja)
MX (1) MXPA03007300A (ja)
WO (1) WO2003052743A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005046058A1 (en) * 2003-11-07 2005-05-19 Queensland University Of Technology Method and apparatus for encoding and decoding digital data

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3822224B1 (ja) * 2005-06-28 2006-09-13 株式会社フィールドシステム 情報提供システム
US9344802B2 (en) 2005-06-28 2016-05-17 Field System, Inc. Information providing system
JP3834579B1 (ja) * 2006-03-13 2006-10-18 株式会社フィールドシステム 情報提供システム
EP2036003B1 (en) * 2006-06-30 2017-05-03 Leica Biosystems Imaging, Inc. Method for storing and retrieving large images via dicom
US8625808B2 (en) 2006-09-29 2014-01-07 Lg Elecronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
JP4295781B2 (ja) * 2006-11-16 2009-07-15 株式会社フィールドシステム 情報提供システム
JP5556074B2 (ja) * 2008-07-30 2014-07-23 ヤマハ株式会社 制御装置
JP5556076B2 (ja) * 2008-08-20 2014-07-23 ヤマハ株式会社 シーケンスデータ出力装置、音声処理システム、および電子楽器
JP5556075B2 (ja) * 2008-07-30 2014-07-23 ヤマハ株式会社 演奏情報出力装置、及び演奏システム
JP5604824B2 (ja) * 2008-07-29 2014-10-15 ヤマハ株式会社 テンポ情報出力装置、音声処理システム、および電子楽器
JP2010201985A (ja) * 2009-02-27 2010-09-16 Car Mate Mfg Co Ltd 情報報知装置
RU2523934C2 (ru) * 2010-03-26 2014-07-27 Филд Систем, Инк. Передатчик
JP5333388B2 (ja) * 2010-09-07 2013-11-06 ブラザー工業株式会社 認証システムおよび認証装置
GB2546025B (en) * 2010-10-01 2017-08-23 Asio Ltd A Transaction authenticating device and method
US8699948B2 (en) 2011-01-25 2014-04-15 Sony Corporation Connection method for near field communication
JP5561497B2 (ja) * 2012-01-06 2014-07-30 ヤマハ株式会社 波形データ生成装置及び波形データ生成プログラム
WO2013185844A1 (en) * 2012-06-15 2013-12-19 Sezer Nagihan Passive communication system and method involving ultrasound signal patterns
US9812137B2 (en) 2012-07-25 2017-11-07 Paypal, Inc. Data communication using audio patterns systems and methods
US9263060B2 (en) 2012-08-21 2016-02-16 Marian Mason Publishing Company, Llc Artificial neural network based system for classification of the emotional content of digital music
JP5887446B1 (ja) 2014-07-29 2016-03-16 ヤマハ株式会社 情報管理システム、情報管理方法およびプログラム
JP5871088B1 (ja) * 2014-07-29 2016-03-01 ヤマハ株式会社 端末装置、情報提供システム、情報提供方法およびプログラム
JP6484958B2 (ja) 2014-08-26 2019-03-20 ヤマハ株式会社 音響処理装置、音響処理方法およびプログラム
US9755764B2 (en) * 2015-06-24 2017-09-05 Google Inc. Communicating data with audible harmonies
CN105049389A (zh) * 2015-07-10 2015-11-11 苏州凌犀物联网技术有限公司 基于编码映射的数据传输方法
CN106452607B (zh) * 2016-11-03 2020-05-12 武汉斗鱼网络科技有限公司 一种传输、解析信息的方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000021203A1 (en) * 1998-10-02 2000-04-13 Comsense Technologies, Ltd. A method to use acoustic signals for computer communications
JP2000261560A (ja) * 1999-03-09 2000-09-22 Seiko Epson Corp ワイヤレス音響カプラモデム
JP2001016349A (ja) * 1999-06-29 2001-01-19 Sharp Corp 音響結合による通信端末装置

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4731847A (en) * 1982-04-26 1988-03-15 Texas Instruments Incorporated Electronic apparatus for simulating singing of song
JP3333022B2 (ja) * 1993-11-26 2002-10-07 富士通株式会社 歌声合成装置
US5540589A (en) * 1994-04-11 1996-07-30 Mitsubishi Electric Information Technology Center Audio interactive tutor
US5583933A (en) * 1994-08-05 1996-12-10 Mark; Andrew R. Method and apparatus for the secure communication of data
JPH08263094A (ja) * 1995-03-10 1996-10-11 Winbond Electron Corp メロディを混合した音声を発生する合成器
JPH08335091A (ja) * 1995-06-09 1996-12-17 Sony Corp 音声認識装置、および音声合成装置、並びに音声認識合成装置
JP3371187B2 (ja) * 1995-12-04 2003-01-27 ソニー株式会社 情報信号記録装置および方法、並びに情報信号複製装置および方法
US5895449A (en) * 1996-07-24 1999-04-20 Yamaha Corporation Singing sound-synthesizing apparatus and method
US5915237A (en) * 1996-12-13 1999-06-22 Intel Corporation Representing speech using MIDI
US6603835B2 (en) * 1997-09-08 2003-08-05 Ultratec, Inc. System for text assisted telephony
US6140568A (en) * 1997-11-06 2000-10-31 Innovative Music Systems, Inc. System and method for automatically detecting a set of fundamental frequencies simultaneously present in an audio signal
JP2000105595A (ja) * 1998-09-30 2000-04-11 Victor Co Of Japan Ltd 歌唱装置及び記録媒体
US6462264B1 (en) * 1999-07-26 2002-10-08 Carl Elam Method and apparatus for audio broadcast of enhanced musical instrument digital interface (MIDI) data formats for control of a sound generator to create music, lyrics, and speech
FR2799330B1 (fr) * 1999-09-30 2001-12-28 Xiring Dispositif comprenant un ordinateur et un peripherique communiquant a distance par liaison sonore
US6947893B1 (en) * 1999-11-19 2005-09-20 Nippon Telegraph & Telephone Corporation Acoustic signal transmission with insertion signal for machine control
JP4465564B2 (ja) * 2000-02-28 2010-05-19 ソニー株式会社 音声認識装置および音声認識方法、並びに記録媒体
US6694297B2 (en) * 2000-03-30 2004-02-17 Fujitsu Limited Text information read-out device and music/voice reproduction device incorporating the same
JP3250559B2 (ja) * 2000-04-25 2002-01-28 ヤマハ株式会社 歌詞作成装置及び歌詞作成方法並びに歌詞作成プログラムを記録した記録媒体
US6668043B2 (en) * 2000-11-16 2003-12-23 Motorola, Inc. Systems and methods for transmitting and receiving text data via a communication device
GB0113581D0 (en) * 2001-06-04 2001-07-25 Hewlett Packard Co Speech synthesis apparatus

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000021203A1 (en) * 1998-10-02 2000-04-13 Comsense Technologies, Ltd. A method to use acoustic signals for computer communications
JP2000261560A (ja) * 1999-03-09 2000-09-22 Seiko Epson Corp ワイヤレス音響カプラモデム
JP2001016349A (ja) * 1999-06-29 2001-01-19 Sharp Corp 音響結合による通信端末装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005046058A1 (en) * 2003-11-07 2005-05-19 Queensland University Of Technology Method and apparatus for encoding and decoding digital data

Also Published As

Publication number Publication date
EP1457971A4 (en) 2007-06-27
CN1494714A (zh) 2004-05-05
EP1457971A1 (en) 2004-09-15
US7415407B2 (en) 2008-08-19
MXPA03007300A (es) 2003-12-04
CN1253852C (zh) 2006-04-26
US20040073429A1 (en) 2004-04-15
JP2003186500A (ja) 2003-07-04

Similar Documents

Publication Publication Date Title
WO2003052743A1 (fr) Systeme de transmission d'informations, codeur d'informations et decodeur d'informations
JP4780375B2 (ja) 音響信号への制御コード埋込装置、および音響信号を用いた時系列駆動装置の制御システム
Lopes et al. Acoustic modems for ubiquitous computing
CN102169705B (zh) 音调再现装置和方法
JP2001077931A (ja) 電話端末装置
JP2971796B2 (ja) 低ビット速度のオーディオエンコーダおよびデコーダ
US6636602B1 (en) Method for communicating
KR0145374B1 (ko) 패킷 어셈블링/디스어셈블링 및 8 내지 14비트 부호화/복호화를 이용한 디지탈 통신 시스템
US7356373B2 (en) Method and device for enhancing ring tones in mobile terminals
KR100549634B1 (ko) 데이터 압축 방법, 데이터 전송 방법 및 데이터 재생 방법
TW529018B (en) Terminal apparatus, guide voice reproducing method, and storage medium
JP3646703B2 (ja) 音声メロディ楽曲生成装置およびそれを用いた携帯端末装置
JP7331645B2 (ja) 情報提供方法および通信システム
JP2000316038A (ja) 着信音発生装置
JP2797644B2 (ja) 発声機能付きカラオケ装置
CN1857028B (zh) 扬声器敏感声音重放
KR100695368B1 (ko) 고음질의 음성 출력이 가능한 이동단말기의 음향처리장치
JP2007102103A (ja) オーディオデータ再生装置および携帯端末装置
WO2002005433A1 (en) A method, a device and a system for compressing a musical and voice signal
US8168878B2 (en) System for coordinating a performance
KR20080080013A (ko) 휴대 단말 장치
JP4337726B2 (ja) 携帯端末装置、プログラムおよび記録媒体
TWI265718B (en) Speech and music reproduction apparatus
Salomon Audio Compression
Pierce 22 Storage and Reproduction of Music

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 02805695.7

Country of ref document: CN

AK Designated states

Kind code of ref document: A1

Designated state(s): CN MX US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR IE IT LU MC NL PT SE SK TR

WWE Wipo information: entry into national phase

Ref document number: 2002805015

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: PA/a/2003/007300

Country of ref document: MX

Ref document number: 10468106

Country of ref document: US

121 Ep: the epo has been informed by wipo that ep was designated in this application
WWP Wipo information: published in national office

Ref document number: 2002805015

Country of ref document: EP

WWW Wipo information: withdrawn in national office

Ref document number: 2002805015

Country of ref document: EP