WO2012091608A1 - Electronic receiving and transmitting system with the function of synchronous translation of verbal speech from one language into another - Google Patents

Electronic receiving and transmitting system with the function of synchronous translation of verbal speech from one language into another Download PDF

Info

Publication number
WO2012091608A1
WO2012091608A1 PCT/RU2010/000818 RU2010000818W WO2012091608A1 WO 2012091608 A1 WO2012091608 A1 WO 2012091608A1 RU 2010000818 W RU2010000818 W RU 2010000818W WO 2012091608 A1 WO2012091608 A1 WO 2012091608A1
Authority
WO
WIPO (PCT)
Prior art keywords
language
text
speech
communication terminal
input
Prior art date
Application number
PCT/RU2010/000818
Other languages
French (fr)
Russian (ru)
Inventor
Юрий Константинович НИЗИЕНКО
Виктор Абрамович БЕЛИЛОВСКИЙ
Original Assignee
Nizienko Yuri Konstantinovich
Belilovsky Viktor Abramovich
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nizienko Yuri Konstantinovich, Belilovsky Viktor Abramovich filed Critical Nizienko Yuri Konstantinovich
Priority to PCT/RU2010/000818 priority Critical patent/WO2012091608A1/en
Publication of WO2012091608A1 publication Critical patent/WO2012091608A1/en

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems

Definitions

  • the utility model relates to the field of electronics, in particular to systems (devices) and methods of their industrial implementation for translating phrases from one language to another, in particular, but not exclusively, to such systems that produce a speech audio signal at the output (at the 3rd , output, language) from the speech audio signal at the input (on the 1st, input, language).
  • the prior art electronic transceiver system with the function of simultaneous translation of oral speech from one language to another including at least one transceiver communication terminal of an incoming analog audio signal in a speech form, which contains: non-volatile storage device, mainly flash -memory; speech input means an analog audio signal in the input language to the communication terminal, which is functionally transmitting; means for analog-to-digital conversion and processing of the speech form of an analog audio signal into a code text form in the input language; means for translating the code form of the text in the input language into the code form of the text in the output language; means for digital-to-analog conversion and processing of the code form of text in the output language into an analog audio signal in the same language in speech form, as well as means for outputting the speech form of an analog audio signal in the output language through a communication terminal that is functionally receiving (RU, NQ 2070734, 1996 .).
  • the main technical result realized by the claimed utility model is to increase the accuracy of the conversion of the audio signal entering the transmitting terminal in speech form into coded text a form in the input language, while providing the possibility of using a memory device with a relatively small amount of memory in this terminal, due to the need to translate the code text form of the input audio signal always to the same intermediate language (generally accepted in world practice).
  • an electronic transceiver system with the function of simultaneous translation of oral speech from one language to another including at least one transceiver communication terminal of an incoming analog audio signal in a speech form, which contains: non-volatile memory device, mainly flash memory; speech input means of an analog audio signal in the input language to the communication terminal, which is functionally transmitting; means for analog-to-digital conversion and processing of the speech form of an analog audio signal into a code text form in the input language; means for translating the code form of the text in the input language into the code form of the text in the output language; means for digital-to-analog conversion and processing of the code form of the text in the output language into an analog audio signal in the same language in speech form, as well as means for outputting the speech form of an analog audio signal in the output language through a communication terminal that is functionally receiving, according to the utility model, a communication terminal, functionally transmitting, equipped with a means of verifying the spoken language of the owner of the terminal regarding its written form
  • the same communication terminal can functionally be used.
  • a transmitting and receiving terminal functionally two structurally identical communication terminals that are spatially remote from one another and virtually connected via a global mobile communication system of the GSM standard and the Internet can be used.
  • a communication terminal it is permissible to use a mobile electronic device, mainly a cell phone, adapted to the global mobile communication system of the GSM standard and the Internet.
  • a mobile electronic device as a communication terminal, mainly a “laptop” type personal computer adapted to the Internet.
  • the utility model is illustrated by graphic materials.
  • FIG. 1 - block diagram of the 1st communication terminal operating in the transmit-receive mode paired with the 2nd spatially remote communication terminal (thin lines with transparent arrows conditionally duplicated the communication / information transfer channel incoming from the 2nd terminal /) .
  • FIG. 2 is a block diagram of a 2nd communication terminal operating in a transmit-receive mode paired with a 1st, spatially remote, communication terminal.
  • FIG. 3 is a block diagram of an electronic translator combining the functions of receiving and transmitting input information within one communication terminal.
  • FIG. 4 algorithm of the functioning of the system (means) of verbal verification of the owner of the terminal.
  • FIG. 5 is an algorithm for the operation of an electronic transceiver system with spatially remote 1st and 2nd structurally similar communication terminals.
  • FIG. 6 is an algorithm for the operation of an electronic translator.
  • dashed lines conventionally depict blocks and switching connections that are not functionally necessary in the framework of the implementation of the present inventions in accordance with the independent claim of the utility model.
  • 3 means of verifying speech in the 1st, input, language (for the 1st communication terminal 1 and electronic translator 27);
  • 11 - means of confirmation of alternative input of information in the form of text in the 1st, input, language (for the 1st communication terminal 1 and electronic translator 27); 12 - means for verifying voice input of information in the form of text in the 1st, input, language (for the 1st communication terminal 1 and electronic translator 27);
  • 25 - means of alternative text output in 3rd, output, language (for the 2nd communication terminal 13 and electronic translator);
  • 28 means of text translation from the 1st (input) language to the 2nd (intermediate) language and from the latter to the 3rd (output) language (for an electronic translator).
  • Recognition process the process of processing a system (means) of recognition of an audio signal introduced into a computer, for example, a speech signal with characteristic acoustic-linguistic features, as a result of which the recognition system assigns a program (computer) identification code to this audio signal and / or its characteristic features
  • “Verification process” is the comparison (comparing the adequacy) of computer codes (symbols) with an audio signal (for example, in speech form) and / or with its characteristic acoustic-linguistic features introduced by a person and / or a replacement device and / or computer program into an electronic device (e.g. computer, mobile phone device, etc.).
  • An electronic transceiver system with the function of simultaneous translation of oral speech from one language to another includes at least one transceiver communication terminal of the incoming analog audio signal in speech form, which contains:
  • non-volatile storage device for example, flash memory
  • Distinctive features of the electronic transceiver system is the following.
  • the communication terminal which is functionally transmitting, is equipped with a means of verifying the spoken language of the owner of the terminal regarding its written form, structured by means of this communication terminal.
  • the structure of the means of translating the code form of the text in the input language into the code form of the text in the output language is organized two-level.
  • the first level is part of the communication terminal, which is functionally transmitting and equipped with a means of converting the code form of the text in the input language into the code form of the text in the intermediate language generally accepted in the world practice, mainly English.
  • the second level is part of the communication terminal, which is functionally receiving and equipped with a means of converting the code form of the text in the intermediate language into the code form of the text in the output language.
  • the structure of the means of translating the code form of the text in the input language into the code form of the text in the output language is, firstly, programmatically organized with the ability to translate text into text, both in the first and second of the above stages, by machine searching for individual text forms in the form of phrases, sentences or groups of sentences from a translation database previously performed by professional translators and stored on the mobile network, for example, "The Internet”.
  • a translation database previously performed by professional translators and stored on the mobile network, for example, "The Internet”.
  • it is structurally and technologically organized with the possibility of using such a database of mobile network translations, which is constantly updated, mainly in an interactive mode, and in which the mentioned text forms requested for translation but not in the translation database are set taking into account the frequencies of their use are publicly available and are offered for translation, for example, on a commercial basis by professional translators.
  • the same communication terminal can functionally be used.
  • a transmitting and receiving terminal functionally two structurally identical communication terminals that are spatially remote from one another and virtually connected via a global mobile communication system of the GSM standard and the Internet can be used.
  • a mobile electronic device mainly a cell phone, adapted to the global mobile communication system of the GSM standard and the Internet.
  • a mobile electronic device mainly a “laptop” type personal computer adapted to the Internet can be used.
  • This system includes at least two transceiver terminals 1 and 13 of the incoming analog communication an audio signal in speech form, each of which contains, respectively: a storage device 5 (FIG. 1) and 17 (FIG. 2) with non-volatile memory, mainly flash memory; means 2 (FIG. 1) and 14 (FIG. 2) of voice input (using microphone 26) of an analog audio signal in speech form in the 1st, input (FIG. 1) or 3rd, output (FIG. 2) language to the corresponding communication terminal 1 and 13, which is functionally transmitting; analog-to-digital converter (ADC) for processing the speech form of an analog audio signal (input via microphone 26) into a code text form in the 1st, input, language (Fig.
  • ADC analog-to-digital converter
  • the communication terminal 1 or 13, which is functionally transmitting, is equipped with means 3 (Fig. 1) and 15 (Fig. 12 of verifying the oral speech of the owner of the terminal regarding its written form, structured by means of this communication terminal 1 and 13.
  • the structure of the translation system is programmatically organized code form the text in the 1st, input, language into the text in the 3rd, the output, language and the text in the 3rd, the output, the language in the text in the 1st, input, the language is organized two-level.
  • the second level is part of the communication terminal, which is functionally currently receiving and equipped with means for converting the code form of the text in the 2nd, intermediate, language into the code form of the text in the 3rd (figure 2), output, language or the code form of the text in the 1st, input, language (figure 1).
  • the system functions as a transceiver between remote communication subscribers with the function of simultaneous translation and input-output of information in speech form.
  • the structure of the electronic transceiver system may include additional alternative means 10, 1 1, 12, and 22, 23, 24 and 25 of input-output of information in text and / or speech form in the corresponding languages in the transmitting and receiving terminals.
  • a mobile electronic device mainly a cellular mobile phone
  • a communication terminal 1 and 13 a mobile electronic device adapted to the global GSM and Internet network mobile communication system
  • GSM and Internet network mobile communication system can be used as a communication terminal 1 and 13.
  • a mobile terminal can be used as a communication terminal 1 and 13 an electronic device (mainly a personal computer such as a “laptop”) adapted to the Internet.
  • an electronic device mainly a personal computer such as a “laptop”
  • the same communication terminal (electronic translator 27) is functionally used as the transmitting and receiving terminals 1 and 13, in which the functions of reception and transmission are combined with the verification of voice speech by the owner of the terminal using the above two-stage process of electronic translation of the code form of the text in the input language into the code form of the text in the output language through the translation of the code form of the text in the input language into the code form of the text in the intermediate (universal Mr. generally accepted in the world practice) language, such as English.
  • Such a system essentially, is functionally a universal electronic phrasebook (translator) for direct communication with a foreign interlocutor without knowledge of his language, i.e., in his native language.
  • An electronic translator 27 with the function of simultaneous translation of oral speech from one language to another includes a transceiver terminal of an incoming analog audio signal in a speech form, which comprises: non-volatile storage device 5, mainly flash memory; means 2 for inputting the speech form of an analog audio signal in the input language into the transmitting structure of the terminal, including a microphone 26; means for analog-to-digital conversion (ADC) and processing of the speech form of an analog audio signal into a code text form in the input language; a system for translating a code form of text in an input language into a code form of text in an output language; digital-to-analog conversion (DAC) and processing the code form of the text in the output language into an analog audio signal in speech form in the output language (text-to-speech converter 19), as well as means for outputting the speech form of the analog audio signal in the output language through the receiving structure of the terminal (speech synthesizer 20 and speaker 29).
  • non-volatile storage device 5 mainly flash memory
  • ADC analog-
  • the structure of the communication terminal (electronic translator 27), which is functionally transmitting, is equipped with means 3 for verifying the spoken language of the owner of the terminal regarding its writing structured by this terminal, as well as means 4 for recognizing speech in the 1st, input, language.
  • the structure of the system for translating text in the input language (1st language) into a programmatically organized code text form (text) in the output language (3rd language) is organized in two levels.
  • the first level is equipped with a means of 28 text translation from the input language (1st language) into the code form of the text in the intermediate language generally accepted in the world practice (the 2nd language), mainly English
  • the second level is equipped with the means of 28 code translation from the intermediate language language (2nd language) into a programmatically organized code text form (text) in the output language (3rd language).
  • electronic translator 27 combines the functions of the 1st and 2nd communication terminals by looping (switching) the output of the electronic translator 27 with its input.
  • the structure of the electronic translator 27 can be additionally equipped with such functional means as: means 10 for alternative input of information in the form of text in the 1st, input language; means 1 1 confirming alternative input of information in the form of text in the 1st, input language; means confirmation of voice input of information in the form of speech in the 1st, input language; means 25 alternative output of information in the form of text in the 3rd, day off, language.
  • each individual communication terminal has a unit for verifying the owner’s speech, that is, one-time configured by the owner and programmatically adaptable to the reference data (i.e., the original database embedded in non-volatile flash memory), a program for verbal conversion the owner of the terminal in code writing form (text).
  • the reference data i.e., the original database embedded in non-volatile flash memory
  • the claimed translation architecture removes the main problem today in automating the process of electronic simultaneous translation "speech to speech" and instead offers a translation architecture based on the use of relatively simple and fairly currently operating unified electronic units (functional means).
  • the code form of the text in the input (native for the owner of this terminal) language is converted into the code form of the text in an intermediate language generally accepted in world practice, mainly English;
  • the code form of the text in the intermediate language is converted to the code form of the text in the output (native language for the owner of this terminal) language.
  • the terminal verifies once the spoken language of the owner of the given communication terminal regarding its written form, programmatically structured by means of this communication terminal. To do this, carry out the selection and storage of data on characteristic acoustic-linguistic features of spoken language by the owner of this (transmitting) terminal to implement software adaptation of them relative to reference phonemes embedded in the database of this (transmitting) terminal.
  • a speech-to-speech automatic translation system is structurally similar to a professional movie translation process. So, first the speech in the original language is translated into a text form also in the original language, this text is translated into a text form in the film rental language and then the actors (native speakers of the film rental language) voice this text.
  • the main difficulty of the program is the translation of text into text.
  • the completeness of the translation database, their quality and the speed of replenishment of the database will mainly depend on the quality of the organization of the structure of Internet translators, the motivation for their activity, etc.
  • the translation database and the search engine in a certain form can be stored autonomously in a mobile terminal (telephone) with the function of simultaneous translation “speech to speech”.
  • the software provides the transition to the next verification text stored in the memory of this communication terminal and duplicates the verification process described above.
  • the claimed utility model can be widely used among mobile phone owners, as part of the implementation of the functions of converting conversational speech in the language of the owner of the phone (terminal) into voiced conversational speech and / or written information (text) in the language of his foreign interlocutor.
  • the owner’s oral speech transducer is tuned to the characteristic acoustic-linguistic features of the owner’s voice by means of the audio reproduction by the owner of special and / or arbitrary texts appearing on the display of the communication terminal during verification of the characteristic features of the owner’s voice.
  • the verification process algorithm is described in detail in the previous description and is graphically displayed in FIG. 4.
  • the code conversion of the written text from the language of the owner of the terminal into the written text in the language of the interlocutor is carried out using electronic machine translation programs, mainly Translation Memory, for example, the company "Trados".
  • electronic machine translation programs mainly Translation Memory, for example, the company "Trados”.
  • texts can be selected that match the translation text as closely as possible.
  • a search is made for the whole sentence or a group of sentences highlighted by a pause when pronouncing the text. If there is no whole sentence or sentence group in the involved translation databases, then a sentence or a group of sentences is divided into two, three or more parts, up to individual words and syllables until an identical phoneme (analogue) is found in the involved database.
  • the above missing sentence as a whole should be further supplemented in the original translation database.
  • the second conversion of a code text form from an intermediate language (mainly English) to a code text form in the language of the interlocutor (owner of the second terminal), if the interlocutor does not speak English, is carried out similarly to the first written conversion using translation databases.
  • the voice of the speaker of the voiceover program can be converted in order to approximate the acoustic-linguistic features of the voice of the speaker to the corresponding characteristic features of the voice of the owner 1st terminal.
  • the claimed technical solution can be widely used in the field of electronics, in particular in systems (devices) for translating phrases from the first language into the second, in particular, but not exclusively, to such systems, which generate a speech audio signal at the output (in the output language) from the speech audio signal at the input (in the input language).

Abstract

The invention relates to systems for translating phrases from one language into another. The technical result consists in increasing the accuracy of the conversion of an audio signal in speech form into a coded text form in the source language whilst providing the possibility of the use of a memory with a small storage capacity in this terminal. The system comprises a receiving and transmitting communications terminal for an incoming analog audio signal (АА) in speech form. The terminal comprises: a non-volatile memory; means for converting and processing the speech form AA into a coded text form (CTF) in the source language; means for translating the CTF in the source language into a CTF in a target language; means for converting the CTF in the target language into a speech form AA in the target language; means for outputting the speech form AA in the target language via a receiving communications terminal. The transmitting communications terminal is equipped with a means for verifying verbal speech relative to the written form thereof. Furthermore, the translation of the CTF in the source language into the CTF in the target language is performed by means of converting the CTF in the source language into a CTF in an intermediate language at the transmitting communications terminal. Then, the CTF in the intermediate language is converted into the CTF in the target language at the receiving communications terminal.

Description

ЭЛЕКТРОННАЯ ПРИЕМО-ПЕРЕДАЮЩАЯ СИСТЕМА С ФУНКЦИЕЙ СИНХРОННОГО ПЕРЕВОДА УСТНОЙ РЕЧИ С ОДНОГО ЯЗЫКА НА ELECTRONIC TRANSMISSION AND TRANSMISSION SYSTEM WITH THE FUNCTION OF SYNCHRONOUS INTERPRETATION OF SPEECH FROM ONE LANGUAGE
ДРУГОЙ OTHER
Область техники Technical field
Полезная модель относится к области электроники, в частности к системам (устройствам) и способам их промышленной реализации для перевода фраз с одного языка на другой, в частности, но не исключительно, к таким системам, которые вырабатывают речевой аудиосигнал на выходе (на 3-м, выходном, языке) из речевого аудиосигнала на входе (на 1 -м, входном, языке).  The utility model relates to the field of electronics, in particular to systems (devices) and methods of their industrial implementation for translating phrases from one language to another, in particular, but not exclusively, to such systems that produce a speech audio signal at the output (at the 3rd , output, language) from the speech audio signal at the input (on the 1st, input, language).
Уровень техники  State of the art
Длительное время идет поиск электронной системы, которая могла бы в автоматическом режиме осуществлять синхронный перевод, в частности устный, с одного языка на другой. Однако, несмотря на огромные успехи в современном уровне развития вычислительной техники (в частности, средств и методов распознавания и синтеза речи за последние годы) такие системы обладают существенными недостатками в области верификации речи владельца передающего мобильного терминала и, как следствие, в части достоверности передаваемой информации после ее перевода и озвучивания на выходе принимающего терминала.  For a long time, there has been a search for an electronic system that could automatically carry out simultaneous translation, in particular interpretation, from one language to another. However, despite the huge successes in the modern level of development of computer technology (in particular, speech recognition and synthesis tools and synthesis in recent years), such systems have significant shortcomings in the field of speech verification of the owner of a transmitting mobile terminal and, as a result, in terms of the reliability of the transmitted information after its translation and scoring at the output of the receiving terminal.
В области автоматического электронного перевода текста на одном, входном, языке в текст на другом, выходном, языке были проведены интенсивные исследовательские работы с применением современных вычисл ител ьн ых систем и програм м ного обеспечен ия . Однако, пом и мо очень ограниченных применений (например, перевод прогнозов погоды), ранее отсутствовали электронные системы синхронного перевода речи с одного языка на другой, способные автоматически, в режиме реального времени осуществлять точные переводы и, следовательно, заменять профессиональных переводчиков. Как правило, проблемы перевода речи усугубляются ошибками в распознавании речи (т.е., ее верификации), на основе дополнительной информации для верификации, содержащейся в акустико-лингвистических особенностях речи, характерных для каждого индивидуума (абонента связи). In the field of automatic electronic translation of text in one input language into a text in another output language, intensive research work was carried out using modern computing systems and software. However, because of very limited applications (for example, translating weather forecasts), previously there were no electronic systems for simultaneous translation of speech from one language to another, capable of automatically, in real time make accurate translations and, therefore, replace professional translators. Typically, speech translation problems are exacerbated by errors in speech recognition (i.e., its verification), based on additional information for verification contained in the acoustic-linguistic features of speech characteristic of each individual (communication subscriber).
Существующие пакеты автоматического электронного перевода текстов по тем или иным причинам неэффективны и не отвечают требованиям, предъявляемым к системам речевого перевода. Большая часть таких пакетов разработана в помощь профессиональным переводчикам и результат работы таких пакетов должен быть отредактирован, прежде чем он примет приемлемый вид на том языке, на который осуществляется перевод. Большинство таких пакетов является диалоговыми или интерактивными и работают в относительно медленном режиме пакетной обработки и ни один из них не способен работать в реальном масштабе времени с речевым вводом информации.  Existing packages of automatic electronic translation of texts for one reason or another are inefficient and do not meet the requirements for speech translation systems. Most of these packages are designed to help professional translators, and the result of such packages must be edited before it takes on an acceptable look in the language into which the translation is being done. Most of these packages are interactive or interactive and operate in a relatively slow mode of batch processing, and none of them is capable of working in real time with voice input of information.
Кроме того, пакеты программ, использующиеся для текстового перевода, неподвижны, поскольку идиомы и другие исключения из правил вполне могут вызвать ошибку на выходе, т.е., пользователь не имеет полной гарантии, что полученный текст переведен правильно. Существующие системы, кроме того, весьма интенсивно используют центральный процессор, что делает их дорогими в эксплуатации и, следовательно, недоступными для широкого круга индивидуальных абонентов сетей мобильной связи.  In addition, the software packages used for text translation are stationary, since idioms and other exceptions to the rules may well cause an output error, i.e., the user does not have full guarantee that the received text is translated correctly. Existing systems, in addition, very intensively use the central processor, which makes them expensive to operate and, therefore, inaccessible to a wide range of individual subscribers of mobile communication networks.
Из уровня техники известна электронная приемо-передающая система с функцией синхронного перевода устной речи с одного языка на другой, включающая, по меньшей мере, один приемо-передающий терминал связи входящего аналогового аудиосигнала в речевой форме, который содержит: энергонезависимое запоминающее устройство, преимущественно, флэш-память; средства ввода речевой формы аналогового аудиосигнала на входном языке в терминал связи, функционально являющийся передающим; средства аналого-цифрового преобразования и обработки речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; средства перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке; средства цифро-аналогового преобразования и обработки кодовой формы текста на выходном языке в аналоговый аудиосигнал на этом же языке в речевой форме, а также средства вывода речевой формы аналогового аудиосигнала на выходном языке через терминал связи, функционально являющийся принимающим, (RU, NQ 2070734, 1996г.). The prior art electronic transceiver system with the function of simultaneous translation of oral speech from one language to another, including at least one transceiver communication terminal of an incoming analog audio signal in a speech form, which contains: non-volatile storage device, mainly flash -memory; speech input means an analog audio signal in the input language to the communication terminal, which is functionally transmitting; means for analog-to-digital conversion and processing of the speech form of an analog audio signal into a code text form in the input language; means for translating the code form of the text in the input language into the code form of the text in the output language; means for digital-to-analog conversion and processing of the code form of text in the output language into an analog audio signal in the same language in speech form, as well as means for outputting the speech form of an analog audio signal in the output language through a communication terminal that is functionally receiving (RU, NQ 2070734, 1996 .).
К недостаткам данного известного из уровня техники решения следует отнести относительно низкие функциональные и технические характеристики, вследствие значительных погрешностей преобразования речевой формы вводимого в передающий терминал аудиосигнала в кодовую текстовую форму.  The disadvantages of this prior art solution include relatively low functional and technical characteristics, due to significant errors in the conversion of the speech form of the audio signal input into the transmitting terminal into a code text form.
В качестве еще одного недостатка данного известного из уровня техники решения целесообразно отметить необходимость оснащения передающего терминала (при передачи информации на удаленный, принимающий терминал) запоминающим устройством с достаточно большим объемом памяти, в особенности, при осуществлении приемо- передачи с одного входного языка на несколько выходных языков, поскольку весь процесс текстового перевода с одного языка (входного) на другой (выходной) осуществляется в пределах операционной системы (микропроцессора) передающего терминала, вследствие чего в памяти данного терминала должна содержаться расширенная номенклатура словарей, в том числе и для редко используемых языков, например, хинди.  As another drawback of this prior art solution, it is advisable to note the need to equip the transmitting terminal (when transmitting information to the remote receiving terminal) with a memory device with a sufficiently large amount of memory, especially when transmitting from one input language to several days off languages, since the whole process of text translation from one language (input) to another (output) is carried out within the operating system (microprocessor) transmitting terminal, which is why the memory of this terminal should contain an expanded nomenclature of dictionaries, including for rarely used languages, for example, Hindi.
Таким образом, основным техническим результатом, реализуемым посредством заявленной полезной модели, является повышение точности преобразования входящего в передающий терминал аудиосигнала в речевой форме в кодированную текстовую форму на входном языке при обеспечении возможности применения в данном терминале запоминающего устройства с относительно небольшим объемом памяти, за счет необходимости осуществления перевода кодовой текстовой формы входного аудиосигнала всегда на один и тот же, промежуточный (общепринятый в мировой практике) язык. Thus, the main technical result realized by the claimed utility model is to increase the accuracy of the conversion of the audio signal entering the transmitting terminal in speech form into coded text a form in the input language, while providing the possibility of using a memory device with a relatively small amount of memory in this terminal, due to the need to translate the code text form of the input audio signal always to the same intermediate language (generally accepted in world practice).
Раскрытие полезной модели  Utility Model Disclosure
Указанный технический результат достигается посредством того, что в электронной приемо-передающей системе с функцией синхронного перевода устной речи с одного языка на другой, включающей, по меньшей мере, один приемо-передающий терминал связи входящего аналогового аудиосигнала в речевой форме, который содержит: энергонезависимое запоминающее устройство, преимущественно, флэш-память; средства ввода речевой формы аналогового аудиосигнала на входном языке в терминал связи, функционально являющийся передающим; средства аналого-цифрового преобразования и обработки речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; средства перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке; средства цифро-аналогового преобразования и обработки кодовой формы текста на выходном языке в аналоговый аудиосигнал на этом же языке в речевой форме, а также средства вывода речевой формы аналогового аудиосигнала на выходном языке через терминал связи, функционально являющийся принимающим, согласно полезной модели, терминал связи, функционально являющийся передающим, оснащен средством верификации устной речи владельца терминала относительно ее письменной формы, структурируемой посредством данного терминала связи; структура средств перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке организована двухуровневой; причем первый уровень входит в состав терминала связи, функционально являющегося передающим и оснащен средством преобразования кодовой формы текста на входном языке в кодовую форму текста на общепринятом в мировой практике промежуточном языке, преимущественно, английском; а второй уровень входит в состав терминала связи, функционально являющегося принимающим и оснащен средством преобразования кодовой формы текста на промежуточном языке в кодовую форму текста на выходном языке; кроме того, структура средств перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке, во-первых, программно организована с возможностью осуществления перевода текста в текст, как на первом, так и на втором из вышеуказанных этапов, посредством машинного поиска отдельных текстовых форм в виде словосочетаний, предложений или групп предложений из базы данных переводов, предварительно выполненных профессиональными переводчиками и хранящимися в мобильной сети, например, «Интернет»; а, во-вторых, конструктивно-технологически организована с возможностью использования такой базы данных переводов мобильной сети, которая является постоянно пополняемой, преимущественно в интерактивном режиме, и в которой упомянутые текстовые формы, запрашиваемые для перевода, но отсутствующие в базе переводов, выставляются с учетом частоты их использования в открытый доступ и предлагаются, для перевода профессиональным переводчикам, например, на коммерческой основе The specified technical result is achieved by the fact that in an electronic transceiver system with the function of simultaneous translation of oral speech from one language to another, including at least one transceiver communication terminal of an incoming analog audio signal in a speech form, which contains: non-volatile memory device, mainly flash memory; speech input means of an analog audio signal in the input language to the communication terminal, which is functionally transmitting; means for analog-to-digital conversion and processing of the speech form of an analog audio signal into a code text form in the input language; means for translating the code form of the text in the input language into the code form of the text in the output language; means for digital-to-analog conversion and processing of the code form of the text in the output language into an analog audio signal in the same language in speech form, as well as means for outputting the speech form of an analog audio signal in the output language through a communication terminal that is functionally receiving, according to the utility model, a communication terminal, functionally transmitting, equipped with a means of verifying the spoken language of the owner of the terminal regarding its written form, structured by means of this communication terminal; the structure of the means of translating the code form of the text in the input language into the code form of the text in the output language is organized two-level; moreover, the first level is part of the communication terminal, functionally transmitting and equipped with a means of converting the code form of the text in the input language into the code form of the text on the intermediate language generally accepted in world practice, mainly English; and the second level is part of the communication terminal, functionally receiving and equipped with a means of converting the code form of the text in the intermediate language into the code form of the text in the output language; in addition, the structure of the means of translating the code form of the text in the input language into the code form of the text in the output language is, firstly, programmatically organized with the ability to translate text into text, both in the first and second of the above steps, by machine searching for individual text forms in the form of phrases, sentences or groups of sentences from a translation database previously performed by professional translators and stored on a mobile network, for example, the Internet; and, secondly, it is structurally and technologically organized with the possibility of using such a database of mobile network translations, which is constantly updated, mainly in an interactive mode, and in which the mentioned text forms requested for translation but not in the translation database are set taking into account frequencies of their use in the public domain and are offered for translation by professional translators, for example, on a commercial basis
В качестве передающего и принимающего терминала функционально может быть использован один и тот же терминал связи.  As the transmitting and receiving terminal, the same communication terminal can functionally be used.
В качестве передающего и принимающего терминала функционально могут использоваться два пространственно удаленных один от другого конструктивно идентичных терминала связи виртуально скоммутированные посредством глобальной системы мобильной связи стандарта GSM и сети «Интернет».  As a transmitting and receiving terminal, functionally two structurally identical communication terminals that are spatially remote from one another and virtually connected via a global mobile communication system of the GSM standard and the Internet can be used.
В передающем и принимающем терминалах связи могут быть предусмотрены дополнительные альтернативные средства ввода- вывода передаваемой информации в текстовой форме на соответствующих языках. В качестве терминала связи допустимо использовать мобильное электронное устройство, преимущественно, сотовый телефон, адаптированное к глобальной системе мобильной связи стандарта GSM и сети «Интернет». In the transmitting and receiving communication terminals, additional alternative means of input-output of the transmitted information in text form in the respective languages may be provided. As a communication terminal, it is permissible to use a mobile electronic device, mainly a cell phone, adapted to the global mobile communication system of the GSM standard and the Internet.
В качестве терминала связи допустимо также использовать мобильное электронное устройство, преимущественно, персональный компьютер типа «ноутбук», адаптированное к сети «Интернет».  It is also permissible to use a mobile electronic device as a communication terminal, mainly a “laptop” type personal computer adapted to the Internet.
Лучший вариант осуществления полезной модели The best option for implementing a utility model
Полезная модель поясняется графическими материалами. The utility model is illustrated by graphic materials.
Фиг. 1 - блок-схема 1-го терминала связи, функционирующего в режиме приема-передачи в паре со 2-м, пространственно удаленным, терминалом связи (тонкими линиями с прозрачными стрелками условно продублирован входящий со 2-го терминала канал связи /передачи информации/).  FIG. 1 - block diagram of the 1st communication terminal operating in the transmit-receive mode paired with the 2nd spatially remote communication terminal (thin lines with transparent arrows conditionally duplicated the communication / information transfer channel incoming from the 2nd terminal /) .
Фиг. 2 - блок-схема 2-го терминала связи, функционирующего в режиме приема-передачи в паре с 1-м, пространственно удаленным, терминалом связи.  FIG. 2 is a block diagram of a 2nd communication terminal operating in a transmit-receive mode paired with a 1st, spatially remote, communication terminal.
Фиг. 3 - блок-схема электронного переводчика, совмещающего функции приема-передачи вводимой информации в пределах одного терминала связи.  FIG. 3 is a block diagram of an electronic translator combining the functions of receiving and transmitting input information within one communication terminal.
Фиг. 4 - алгоритм функционирования системы (средства) верификации устной речи владельца терминала.  FIG. 4 - algorithm of the functioning of the system (means) of verbal verification of the owner of the terminal.
Фиг. 5 - алгоритм функционирования электронной приемо- передающей системы с пространственно удаленными 1-м и 2-м конструктивно аналогичными терминалами связи.  FIG. 5 is an algorithm for the operation of an electronic transceiver system with spatially remote 1st and 2nd structurally similar communication terminals.
Фиг. 6 - алгоритм функционирования электронного переводчика. FIG. 6 is an algorithm for the operation of an electronic translator.
В графических материалах некоторые существенные блоки и средства коммуникации (такие, как, кнопочная панель, аккумулятор, флеш-накопитель /флеш-память/, цифровой микропроцессор и др.), условно не показаны поскольку они являются общеизвестными и их функциональная принадлежность к рассматриваемым приемо- передающим системам неоспорима, к тому же они не являются принципиальными объектами заявленных изобретений (см., например,
Figure imgf000009_0001
In graphic materials, some essential blocks and means of communication (such as a keypad, battery, flash drive / flash memory /, digital microprocessor, etc.) are not conventionally shown because they are well-known and their functional affiliation with the considered transmission systems are undeniable, moreover, they are not principal objects of the claimed inventions (see, for example,
Figure imgf000009_0001
В графических материалах пунктиром условно изображены блоки и коммутационные связи, не являющиеся функционально необходимыми в рамках реализации настоящих изобретений в соответствии с независимым пунктом формулы полезной модели.  In graphical materials, the dashed lines conventionally depict blocks and switching connections that are not functionally necessary in the framework of the implementation of the present inventions in accordance with the independent claim of the utility model.
В графических материалах функциональные блоки, средства и системы обозначены следующими позициями:  In graphic materials, functional blocks, tools and systems are indicated by the following positions:
1 - 1-й терминал связи;  1 - 1st communication terminal;
2 - средство речевого ввода информации на 1-м, входном, языке (для 1-го терминала 1 связи и электронного переводчика 27);  2 - means of voice input of information in the 1st, input, language (for the 1st communication terminal 1 and electronic translator 27);
3 - средство верификации речи на 1-м, входном, языке (для 1-го терминала 1 связи и электронного переводчика 27);  3 - means of verifying speech in the 1st, input, language (for the 1st communication terminal 1 and electronic translator 27);
4 - средство распознавания речи на 1-м, входном, языке (для 1-го терминала 1 связи и электронного переводчика 27);  4 - means of speech recognition in the 1st, input, language (for the 1st communication terminal 1 and electronic translator 27);
5 - устройство запоминающее (для 1-го терминала 1 связи и электронного переводчика 27);  5 - storage device (for the 1st communication terminal 1 and electronic translator 27);
6 - средство текстового перевода с 1-го языка (входного) на 2-й язык (промежуточный) - (для 1-го терминала 1 связи);  6 - means of text translation from the 1st language (input) to the 2nd language (intermediate) - (for the 1st communication terminal 1);
7 - преобразователь тексто-речевой для 1-го, входного, языка (для 1-го терминала 1 связи);  7 - text-to-speech converter for the 1st, input, language (for the 1st communication terminal 1);
8 - синтезатор речи на 1-м, входном, языке (для 1-го терминала 1 связи);  8 - speech synthesizer in the 1st, input, language (for the 1st communication terminal 1);
9 - динамик (выход на 1-м, входном, языке для 1-го терминала 1 связи);  9 - speaker (output on the 1st, input, language for the 1st communication terminal 1);
10 - средство альтернативного ввода информации в виде текста на 1-м, входном, языке (для 1-го терминала 1 связи и электронного переводчика 27);  10 - means of alternative input of information in the form of text in the 1st, input, language (for the 1st communication terminal 1 and electronic translator 27);
11 - средство подтверждения альтернативного ввода информации в виде текста на 1-м, входном, языке (для 1 -го терминала 1 связи и электронного переводчика 27); 12 - средство подтверждения речевого ввода информации в виде текста на 1-м, входном, языке (для 1-го терминала 1 связи и электронного переводчика 27); 11 - means of confirmation of alternative input of information in the form of text in the 1st, input, language (for the 1st communication terminal 1 and electronic translator 27); 12 - means for verifying voice input of information in the form of text in the 1st, input, language (for the 1st communication terminal 1 and electronic translator 27);
13 - 2-й терминал связи;  13 - 2nd communication terminal;
14 - средство речевого ввода информации на 3-м, выходном, языке (для 2-го терминала 13 связи)  14 - means of voice input of information in the 3rd, output, language (for the 2nd communication terminal 13)
15 - средство верификации речи на 3-м, выходном, языке (для 2- го терминала 13 связи);  15 - means of verifying speech in the 3rd, output, language (for the 2nd communication terminal 13);
16 - средство распознавания речи на 3-м, выходном, языке (для 2-го терминала 13 связи);  16 - speech recognition means in the 3rd, output, language (for the 2nd communication terminal 13);
17 - запоминающее устройство (для 2-го терминала 13 связи); 17 - storage device (for the 2nd communication terminal 13);
18 - средство текстового перевода с 3-го (выходного) языка на 2-й (промежуточный) язык (для 2-го терминала 13 связи); 18 - means of text translation from the 3rd (output) language to the 2nd (intermediate) language (for the 2nd communication terminal 13);
19 - преобразователь тексто-речевой (для 2-го терминала 13 связи и электронного переводчика 27);  19 - text-to-speech converter (for the 2nd communication terminal 13 and electronic translator 27);
20 - синтезатор речи на 3-м, выходном, языке (для 2-го терминала 3 связи и электронного переводчика 27);  20 - speech synthesizer in 3rd, output, language (for the 2nd communication terminal 3 and electronic translator 27);
21 - динамик (выход на на 3-м языке, выходном, для 2-го терминала 13 связи);  21 - speaker (output in the 3rd language, output, for the 2nd communication terminal 13);
22 - средство альтернативного ввода текста на 3-м, выходном, языке (для 2-го терминала 13 связи);  22 - means of alternative text input in the 3rd, output, language (for the 2nd communication terminal 13);
23 -средство подтверждения альтернативного ввода текста на 3-м, выходном, языке (для 2-го терминала 13 связи);  23 - means for confirming alternative text input in the 3rd, output, language (for the 2nd communication terminal 13);
24 - средство подтверждения речевого ввода на 3-м, выходном, языке (для 2-го терминала 13 связи);  24 - means of verifying voice input in the 3rd, output, language (for the 2nd communication terminal 13);
25 - средство альтернативного вывода текста на 3-м, выходном, языке (для 2-го терминала 13 связи и электронного переводчика);  25 - means of alternative text output in 3rd, output, language (for the 2nd communication terminal 13 and electronic translator);
26 - микрофон;  26 - microphone;
27 - переводчик электронный  27 - electronic translator
28 - средство текстового перевода с 1-го (входного) языка на 2-й (промежуточный) язык и с последнего на 3-й (выходной) язык (для электронного переводчика). 29 - динамик (выход на 3-м языке и выход на 1 -м языке для электронного переводчика 27). 28 - means of text translation from the 1st (input) language to the 2nd (intermediate) language and from the latter to the 3rd (output) language (for an electronic translator). 29 - speaker (output in 3 languages and output in 1 languages for electronic translator 27).
В рамках настоящей заявки целесообразно раскрыть технический смысл терминов «процесс распознавания» и «процесс верификации» применительно к цифровой электронной технике (в частности, микропроцессорам, используемым в мобильных телефонных аппаратах /терминалах/ связи).  In the framework of this application, it is advisable to disclose the technical meaning of the terms “recognition process” and “verification process” as applied to digital electronic equipment (in particular, microprocessors used in mobile telephones / terminals / communications).
«Процесс распознавания» - процесс обработки системой (средством) распознавания введенного в компьютер некоего аудиосигнала, например, речевого с характерными акустико-лингвистическими признаками, в результате чего система распознавания приписывает этому аудиосигналу и/или его характерным признакам программный (компьютерный) идентификационный код  “Recognition process” - the process of processing a system (means) of recognition of an audio signal introduced into a computer, for example, a speech signal with characteristic acoustic-linguistic features, as a result of which the recognition system assigns a program (computer) identification code to this audio signal and / or its characteristic features
«Процесс верификации» - производимое человеком и/или заменяющим его устройством, и/или компьютерной программой сличение (определение адекватности) компьютерных кодов (символов) с аудиосигналом (например, в речевой форме) и/или с его характерными акустико-лингвистическими признаками, введенными в электронное устройство (например, компьютер, аппарат мобильной связи и т.п.).  “Verification process” is the comparison (comparing the adequacy) of computer codes (symbols) with an audio signal (for example, in speech form) and / or with its characteristic acoustic-linguistic features introduced by a person and / or a replacement device and / or computer program into an electronic device (e.g. computer, mobile phone device, etc.).
Электронная приемо-передающая система с функцией синхронного перевода устной речи с одного языка на другой, включает, по меньшей мере, один приемо-передающий терминал связи входящего аналогового аудиосигнала в речевой форме, который содержит:  An electronic transceiver system with the function of simultaneous translation of oral speech from one language to another, includes at least one transceiver communication terminal of the incoming analog audio signal in speech form, which contains:
- энергонезависимое запоминающее устройство, например, флэш-память;  - non-volatile storage device, for example, flash memory;
- средства ввода речевой формы аналогового аудиосигнала на входном языке в терминал связи, функционально являющийся передающим;  - means for inputting the speech form of an analog audio signal in the input language into the communication terminal, which is functionally transmitting;
- средства аналого-цифрового преобразования и обработки речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; - средства перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке; - means of analog-to-digital conversion and processing of the speech form of an analog audio signal into a code text form in the input language; - means of translating the code form of the text in the input language into the code form of the text in the output language;
- средства цифро-аналогового преобразования и обработки кодовой формы текста на выходном языке в аналоговый аудиосигнал на этом же языке в речевой форме;  - means of digital-to-analog conversion and processing of the code form of the text in the output language into an analog audio signal in the same language in speech form;
- а также средства вывода речевой формы аналогового аудиосигнала на выходном языке через терминал связи, функционально являющийся принимающим.  - as well as means for outputting the speech form of the analog audio signal in the output language through the communication terminal, which is functionally receiving.
Отличительными особенностями электронной приемо- передающей системы является следующее.  Distinctive features of the electronic transceiver system is the following.
Терминал связи, функционально являющийся передающим, оснащен средством верификации устной речи владельца терминала относительно ее письменной формы, структурируемой посредством данного терминала связи. Структура средств перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке организована двухуровневой. Причем первый уровень входит в состав терминала связи, функционально являющегося передающим и оснащен средством преобразования кодовой формы текста на входном языке в кодовую форму текста на общепринятом в мировой практике промежуточном языке, преимущественно, английском. А второй уровень входит в состав терминала связи, функционально являющегося принимающим и оснащен средством преобразования кодовой формы текста на промежуточном языке в кодовую форму текста на выходном языке.  The communication terminal, which is functionally transmitting, is equipped with a means of verifying the spoken language of the owner of the terminal regarding its written form, structured by means of this communication terminal. The structure of the means of translating the code form of the text in the input language into the code form of the text in the output language is organized two-level. Moreover, the first level is part of the communication terminal, which is functionally transmitting and equipped with a means of converting the code form of the text in the input language into the code form of the text in the intermediate language generally accepted in the world practice, mainly English. And the second level is part of the communication terminal, which is functionally receiving and equipped with a means of converting the code form of the text in the intermediate language into the code form of the text in the output language.
Кроме того, структура средств перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке, во-первых, программно организована с возможностью осуществления перевода текста в текст, как на первом, так и на втором из вышеуказанных этапов, посредством машинного поиска отдельных текстовых форм в виде словосочетаний, предложений или групп предложений из базы данных переводов, предварительно выполненных профессиональными переводчиками и хранящимися в мобильной сети, например, «Интернет». А, во-вторых, конструктивно-технологически организована с возможностью использования такой базы данных переводов мобильной сети, которая является постоянно пополняемой, преимущественно в интерактивном режиме, и в которой упомянутые текстовые формы, запрашиваемые для перевода, но отсутствующие в базе переводов, выставляются с учетом частоты их использования в открытый доступ и предлагаются, для перевода, например, на коммерческой основе профессиональным переводчикам. In addition, the structure of the means of translating the code form of the text in the input language into the code form of the text in the output language is, firstly, programmatically organized with the ability to translate text into text, both in the first and second of the above stages, by machine searching for individual text forms in the form of phrases, sentences or groups of sentences from a translation database previously performed by professional translators and stored on the mobile network, for example, "The Internet". And, secondly, it is structurally and technologically organized with the possibility of using such a database of mobile network translations, which is constantly updated, mainly in an interactive mode, and in which the mentioned text forms requested for translation but not in the translation database are set taking into account the frequencies of their use are publicly available and are offered for translation, for example, on a commercial basis by professional translators.
В качестве передающего и принимающего терминала функционально может использоваться один и тот же терминал связи.  As the transmitting and receiving terminal, the same communication terminal can functionally be used.
В качестве передающего и принимающего терминала функционально могут использоваться два пространственно удаленных один от другого конструктивно идентичных терминала связи виртуально скоммутированные посредством глобальной системы мобильной связи стандарта GSM и сети «Интернет».  As a transmitting and receiving terminal, functionally two structurally identical communication terminals that are spatially remote from one another and virtually connected via a global mobile communication system of the GSM standard and the Internet can be used.
В передающем и принимающем терминалах могут быть предусмотрены дополнительные альтернативные средства ввода- вывода передаваемой информации в текстовой форме на соответствующих языках.  In the transmitting and receiving terminals, additional alternative means of input-output of the transmitted information in text form in the respective languages may be provided.
В качестве терминала связи допустимо использовать мобильное электронное устройство, преимущественно, сотовый телефон, адаптированное к глобальной системе мобильной связи стандарта GSM и сети «Интернет».  As a communication terminal, it is permissible to use a mobile electronic device, mainly a cell phone, adapted to the global mobile communication system of the GSM standard and the Internet.
В качестве терминала связи может быть использовано мобильное электронное устройство, преимущественно, персональный компьютер типа «ноутбук», адаптированное к сети «Интернет».  As a communication terminal, a mobile electronic device, mainly a “laptop” type personal computer adapted to the Internet can be used.
Одно из возможных частных приложений использования заявленного технического решения (передача информации между двумя пространственно удаленными терминалами, см. фиг.1 и фиг.2) более подробно рассмотрено ниже.  One of the possible private applications using the claimed technical solution (information transfer between two spatially remote terminals, see figure 1 and figure 2) is discussed in more detail below.
Данная система включает, по меньшей мере, два приемо- передающих терминала 1 и 13 связи входящего аналогового аудиосигнала в речевой форме, каждый из которых содержит, соответственно: запоминающее устройство 5 (фиг.1 ) и 17 (фиг.2) с энергонезависимой памятью, преимущественно, флэш-памятью; средства 2 (фиг.1 ) и 14 (фиг.2) речевого ввода (с использованием микрофона 26) аналогового аудиосигнала в речевой форме на 1-м, входном (фиг.1) или 3-м, выходном (фиг.2) языке в соответствующий терминал 1 и 13 связи, функционально являющийся передающим; аналого-цифровой преобразователь (АЦП) для обработки речевой формы аналогового аудиосигнала (входящего через микрофон 26) в кодовую текстовую форму на 1-м, входном, языке (фиг.1 ) или на 3-м, выходном, языке (фиг.2); программно-организованную систему перевода кодовой формы текста на 1-м, входном, языке или на 3-м, выходном, языке в кодовую форму текста на 3-м, выходном, языке или на 1-м, входном, языке, соответственно; тексто-речевой преобразователь 7 (фиг.1 ) и 19 (фиг.2), функционально являющийся средством цифро-аналогового преобразования (ЦАП) и обработки текста на 3-м, выходном, языке (фиг.2) или на 1-м, входном, языке (фиг.1 ), соответственно, в аналоговый аудиосигнал в речевой форме; а также средства вывода речевой формы аналогового аудиосигнала на 1 - м, входном, языке (фиг.1 ) или 3-м, выходном, языке (фиг.2), соответственно, через терминал связи 1 и 13, функционально являющийся на данный момент принимающим, с использованием синтезатора речи 8 и 20 на 1-м, входном, языке (фиг.1) или на 3-м, выходном, языке (фиг.2), соответственно. This system includes at least two transceiver terminals 1 and 13 of the incoming analog communication an audio signal in speech form, each of which contains, respectively: a storage device 5 (FIG. 1) and 17 (FIG. 2) with non-volatile memory, mainly flash memory; means 2 (FIG. 1) and 14 (FIG. 2) of voice input (using microphone 26) of an analog audio signal in speech form in the 1st, input (FIG. 1) or 3rd, output (FIG. 2) language to the corresponding communication terminal 1 and 13, which is functionally transmitting; analog-to-digital converter (ADC) for processing the speech form of an analog audio signal (input via microphone 26) into a code text form in the 1st, input, language (Fig. 1) or in the 3rd, output, language (Fig. 2) ; a software-organized system for translating the code form of text in the 1st, input, language or in the 3rd, output, language into the code form of the text in the 3rd, output, language or in the 1st, input, language, respectively; a text-to-speech converter 7 (Fig. 1) and 19 (Fig. 2), which is functionally a means of digital-to-analog conversion (DAC) and text processing on the 3rd, output, language (Fig. 2) or on the 1st, input, language (figure 1), respectively, into an analog audio signal in speech form; as well as means for outputting the speech form of the analog audio signal in the 1st, input, language (Fig. 1) or 3rd, output, language (Fig. 2), respectively, through the communication terminal 1 and 13, which is currently receiving functionally using a speech synthesizer 8 and 20 in the 1st, input, language (Fig. 1) or in the 3rd, output, language (Fig. 2), respectively.
Терминал связи 1 или 13, функционально являющийся передающим, оснащен средством 3 (фиг.1) и 15 (фиг.12 верификации устной речи владельца терминала относительно ее письменной формы, структурируемой посредством данного терминала 1 и 13 связи. Структура системы перевода программно организованной кодовой формы текста на 1-м, входном, языке в текст на 3-м, выходном, языке и текста на 3-м, выходном, языке в текст на 1 -м, входном, языке организована двухуровневой. Причем первый уровень входит в состав терминала связи, функционально являющегося передающим и оснащен средством преобразования кодовой формы текста на 1-м, входном, языке (фиг.1) или кодовой формы текста на 3-м, выходном, языке (фиг.2) в кодовую форму текста на общепринятом в мировой практике 2-м, промежуточном, языке, преимущественно, английском; а второй уровень входит в состав терминала связи, функционально являющегося на данный момент времени принимающим и оснащен средством преобразования кодовой формы текста на 2-м, промежуточном, языке в кодовую форму текста на 3-м (фиг.2), выходном, языке или в кодовую форму текста на 1-м, входном, языке (фиг.1 ). The communication terminal 1 or 13, which is functionally transmitting, is equipped with means 3 (Fig. 1) and 15 (Fig. 12 of verifying the oral speech of the owner of the terminal regarding its written form, structured by means of this communication terminal 1 and 13. The structure of the translation system is programmatically organized code form the text in the 1st, input, language into the text in the 3rd, the output, language and the text in the 3rd, the output, the language in the text in the 1st, input, the language is organized two-level. a communication terminal that is functionally transmitting and is equipped with a means of converting the code form of the text in the 1st, input, language (Fig. 1) or the code form of the text in the 3rd, output, language (Fig. 2) into the code form of the text in generally accepted world practice 2nd, intermediate, language, mainly English; and the second level is part of the communication terminal, which is functionally currently receiving and equipped with means for converting the code form of the text in the 2nd, intermediate, language into the code form of the text in the 3rd (figure 2), output, language or the code form of the text in the 1st, input, language (figure 1).
В рассматриваемой электронной приемо-передающей системе в качестве передающего и принимающего терминала 1 и 13 функционально могут использоваться и более двух пространственно удаленных один от другого конструктивно идентичных терминалов связи (фиг.1 и фиг.2) виртуально скоммутированных посредством глобальной системы мобильной связи стандарта GSM и сети «Интернет». В данном случае система функционирует как приемо-передатчик между удаленными абонентами связи с функцией синхронного перевода и ввода-вывода информации в речевой форме.  In the considered electronic transceiver system, as a transmitting and receiving terminal 1 and 13, functionally more than two structurally identical communication terminals (Fig. 1 and Fig. 2) virtually connected via a global GSM mobile communication system and the Internet. In this case, the system functions as a transceiver between remote communication subscribers with the function of simultaneous translation and input-output of information in speech form.
Структура электронной приемо-передающей системы может предусматривать в передающем и принимающем терминалах дополнительные альтернативные средства 10, 1 1 , 12, и 22, 23, 24 и 25 ввода-вывода информации в текстовой и/или речевой форме на соответствующих языках.  The structure of the electronic transceiver system may include additional alternative means 10, 1 1, 12, and 22, 23, 24 and 25 of input-output of information in text and / or speech form in the corresponding languages in the transmitting and receiving terminals.
В рассматриваемой электронной приемо-передающей системе в качестве терминала 1 и 13 связи может быть использовано мобильное электронное устройство (преимущественно, сотовый мобильный телефон) адаптированное к глобальной системе мобильной связи стандарта GSM и сети «Интернет».  In the considered electronic transceiver system, a mobile electronic device (mainly a cellular mobile phone) adapted to the global GSM and Internet network mobile communication system can be used as a communication terminal 1 and 13.
В рассматриваемой электронной приемо-передающей системе в качестве терминала 1 и 13 связи может быть использовано мобильное электронное устройство (преимущественно, персональный компьютер типа «ноутбук») адаптированное к сети «Интернет». In the electronic transceiver system in question, a mobile terminal can be used as a communication terminal 1 and 13 an electronic device (mainly a personal computer such as a “laptop”) adapted to the Internet.
Другое возможное частное приложение использования заявленного технического решения (электронный переводчик 27, см. фиг.З) рассмотрено далее.  Another possible private application using the claimed technical solution (electronic translator 27, see Fig.Z) is discussed below.
В данном частном приложении в качестве передающего и принимающего терминала 1 и 13 функционально используется один и тот же терминал связи (электронный переводчик 27), в котором совмещены функции приемо- передачи с верификацией голосовой речи владельца терминала при использовании вышерассмотренного двухэтапного процесса электронного перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке через осуществление перевода кодовой формы текста на входном языке в кодовую форму текста на промежуточном (универсальном, общепринятом в мировой практике) языке, например, английском.  In this particular application, the same communication terminal (electronic translator 27) is functionally used as the transmitting and receiving terminals 1 and 13, in which the functions of reception and transmission are combined with the verification of voice speech by the owner of the terminal using the above two-stage process of electronic translation of the code form of the text in the input language into the code form of the text in the output language through the translation of the code form of the text in the input language into the code form of the text in the intermediate (universal Mr. generally accepted in the world practice) language, such as English.
Такая система, по существу, функционально представляет собой универсальный электронный разговорник (переводчик) для непосредственного общения с иностранным собеседником без знания его языка, т.е., на своем родном языке.  Such a system, essentially, is functionally a universal electronic phrasebook (translator) for direct communication with a foreign interlocutor without knowledge of his language, i.e., in his native language.
Электронный переводчик 27 с функцией синхронного перевода устной речи с одного языка на другой включает приемо-передающий терминал входящего аналогового аудиосигнала в речевой форме, который содержит: энергонезависимое запоминающее устройство 5, преимущественно, флэш-память; средство 2 ввода речевой формы аналогового аудиосигнала на входном языке в передающую структуру терминала, включающее микрофон 26; средство аналого-цифрового преобразования (АЦП) и обработки речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; систему перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке; средства цифро-аналогового преобразования (ЦАП) и обработки кодовой формы текста на выходном языке в аналоговый аудиосигнал в речевой форме на выходном языке (тексто-речевой преобразователь 19), а также средства вывода речевой формы аналогового аудиосигнала на выходном языке через принимающую структуру терминала (синтезатор 20 речи и динамик 29). Структура терминала связи (электронного переводчика 27), функционально являющаяся передающей, оснащена средством 3 верификации устной речи владельца терминала относительно ее письменной формы, структурируемой посредством данного терминала, а также средством 4 распознавания речи на 1-м, входном, языке. Структура системы перевода текста на входном языке (1-й язык) в программно организуемую кодовую текстовую форму (текст) на выходном языке (3-й язык) организована двухуровневой. Причем первый уровень оснащен средством 28 текстового перевода с входного языка (1-й язык) в кодовую форму текста на общепринятом в мировой практике промежуточном языке (2-й язык), преимущественно, английском, а второй уровень - средством 28 кодового текстового перевода с промежуточного языка (2-й язык) в программно организованную кодовую текстовую форму (текст) на выходном языке (3-й язык). An electronic translator 27 with the function of simultaneous translation of oral speech from one language to another includes a transceiver terminal of an incoming analog audio signal in a speech form, which comprises: non-volatile storage device 5, mainly flash memory; means 2 for inputting the speech form of an analog audio signal in the input language into the transmitting structure of the terminal, including a microphone 26; means for analog-to-digital conversion (ADC) and processing of the speech form of an analog audio signal into a code text form in the input language; a system for translating a code form of text in an input language into a code form of text in an output language; digital-to-analog conversion (DAC) and processing the code form of the text in the output language into an analog audio signal in speech form in the output language (text-to-speech converter 19), as well as means for outputting the speech form of the analog audio signal in the output language through the receiving structure of the terminal (speech synthesizer 20 and speaker 29). The structure of the communication terminal (electronic translator 27), which is functionally transmitting, is equipped with means 3 for verifying the spoken language of the owner of the terminal regarding its writing structured by this terminal, as well as means 4 for recognizing speech in the 1st, input, language. The structure of the system for translating text in the input language (1st language) into a programmatically organized code text form (text) in the output language (3rd language) is organized in two levels. Moreover, the first level is equipped with a means of 28 text translation from the input language (1st language) into the code form of the text in the intermediate language generally accepted in the world practice (the 2nd language), mainly English, and the second level is equipped with the means of 28 code translation from the intermediate language language (2nd language) into a programmatically organized code text form (text) in the output language (3rd language).
Совершенно очевидно, что в данном конкретном варианте технической реализации заявленного объекта электронный переводчик 27 совмещает функции 1 -го и 2-го теминалов связи посредством зацикливания (коммутации) выхода электронного переводчика 27 с его входом.  It is quite obvious that in this particular embodiment of the technical implementation of the claimed object, electronic translator 27 combines the functions of the 1st and 2nd communication terminals by looping (switching) the output of the electronic translator 27 with its input.
Оптимально, чтобы в передающей и принимающей структурах электронного переводчика 27 были бы предусмотрены дополнительные альтернативные средства ввода-вывода передаваемой информации в текстовой форме на соответствующих языках.  It is optimal that in the transmitting and receiving structures of the electronic translator 27 additional alternative means of input-output of the transmitted information in text form in appropriate languages would be provided.
То есть, структура электронного переводчика 27 может быть дополнительно оснащена такими функциональными средствами, как: средство 10 альтернативного ввода информации в виде текста на 1-м, входном языке; средство 1 1 подтверждения альтернативного ввода информации в виде текста на 1-м, входном языке; средство подтверждения речевого ввода информации в виде речи на 1-м, входном языке; средство 25 альтернативного вывода информации в виде текста на 3-м, выходном, языке. That is, the structure of the electronic translator 27 can be additionally equipped with such functional means as: means 10 for alternative input of information in the form of text in the 1st, input language; means 1 1 confirming alternative input of information in the form of text in the 1st, input language; means confirmation of voice input of information in the form of speech in the 1st, input language; means 25 alternative output of information in the form of text in the 3rd, day off, language.
Алгоритмы программной организации соответствующих структур рассматриваемых технических решений представлены на фиг.4 - фиг.6 графических материалов.  Algorithms for the software organization of the corresponding structures of the considered technical solutions are presented in figure 4 - figure 6 graphic materials.
Таким образом, согласно настоящей полезной модели, обеспечивается возможность исключения наиболее проблемных средств (блоков) системы синхронного перевода («речь в речь»).  Thus, according to this utility model, it is possible to exclude the most problematic means (blocks) of the simultaneous translation system (“speech to speech”).
А именно, исключены средства распознавания родной, но акустико-лингвистически озвученной различными (носителями родного языка) индивидуами речи, и, особенно, чужой разноязычной и разновариантной (с акустико-лингвистической точки зрения) речи.  Namely, the means of recognizing native, but acoustically linguistically voiced by various (native speakers) individuals of speech, and, especially, foreign multilingual and multivariate (from the acoustic-linguistic point of view) speech, are excluded.
Взамен этого в каждом индивидуальном терминале связи предусмотрен блок верификации речи владельца, т.е., однократно настраиваемое владельцем и программно адаптируемое к эталонным данным (т.е., исходной базе данных, заложенной в энергонезависимую флеш-память) программно реализуемое средство преобразования устной речи владельца терминала в кодовую письменную форму (текст).  Instead, each individual communication terminal has a unit for verifying the owner’s speech, that is, one-time configured by the owner and programmatically adaptable to the reference data (i.e., the original database embedded in non-volatile flash memory), a program for verbal conversion the owner of the terminal in code writing form (text).
Средства перевода «текст в текст» достаточно хорошо известны из современного уровня техники, промышленно реализованы с высокой степенью достоверности электронной версии перевода и интенсивно развиваются на современном этапе развития электронной техники (например, система «Travados», система машинного (электронного) перевода «Promt»).  Means of translation “text to text” are well known from the modern level of technology, are industrially implemented with a high degree of reliability of the electronic version of the translation and are intensively developed at the present stage of development of electronic equipment (for example, the “Travados” system, the system of machine (electronic) translation “Promt” )
Системы озвучивания различных кодовых электронных текстов на различных языках также достаточно хорошо развиты. Таким образом, в заявленной архитектуре перевода снимается основная на сегодняшний день проблема в автоматизации процесса электронного синхронного перевода «речь в речь» и взамен предлагается архитектура перевода, основанная на использовании сравнительно простых и достаточно эффективно действующих на сегодняшний день унифицированных электронных блоков (функциональных средств). Sound systems for various code electronic texts in various languages are also quite well developed. Thus, the claimed translation architecture removes the main problem today in automating the process of electronic simultaneous translation "speech to speech" and instead offers a translation architecture based on the use of relatively simple and fairly currently operating unified electronic units (functional means).
Процесс осуществления всех переводов через один (промежуточный, общепринятый в мировой практике) язык, например, английский, в целом существенно упрощает разработку задачи перевода, т.к. исключается разработка специальных программируемых средств и программного обеспечения для осуществления перекрестных переводов, обеспечивающих множественную комбинаторику совокупности различных языков и языковых диалектов.  The process of making all translations through one (intermediate, generally accepted in world practice) language, for example, English, as a whole significantly simplifies the development of the translation task, because it excludes the development of special programmable tools and software for cross-translation, providing multiple combinatorics of a combination of different languages and language dialects.
Таким образом, согласно заявленной полезной модели, для осуществления перевода кодированного текста с одного языка на другой в соответствующем терминале связи для приемо-передачи кодированной текстовой информации на множестве различных языков необходимо иметь для любого языка (из упомянутого множества) программный блок (программируемое средство) текстового перевода входящего (первого) языка на английский язык в текстовой форме и обратно.  Thus, according to the claimed utility model, in order to translate encoded text from one language to another in the corresponding communication terminal for receiving and transmitting encoded text information in a variety of different languages, it is necessary to have a text block (programmable tool) for any language (from the said set) translation of the incoming (first) language into English in text form and vice versa.
Принцип организации синхронного перевода устной речи с одного языка на другой посредством заявленной электронной приемо- передающей системы (т.е., принцип ее функционирования) характеризуется следующими необходимыми и достаточными (существенными) признаками.  The principle of organizing simultaneous translation of oral speech from one language to another by means of the declared electronic transceiver system (ie, the principle of its functioning) is characterized by the following necessary and sufficient (essential) features.
В запоминающее устройство 5 (фиг.1 ), коммутационно связанное с аналого-цифровым преобразователем /АЦП/ 1-го терминала 1 связи электронной системы (функционально являющегося в данном рассмотрении - передающим), вводят входящий аналоговый аудиосигнал в речевой форме на входном языке. Затем, посредством АЦП осуществляют аналого-цифровую обработку и преобразование речевой формы аналогового аудиосигнала в кодовую текстовую форму на 1-м, входном, языке. В процессе обмена информационными кодовыми сигналами (в текстовой форме) между 1 -м терминалом 1 связи и вторым (принимающим) терминалом 13 обеспечивают электронный перевод кодовой текстовой формы на 1-м, входном, языке передающего 1-го терминала 1 в кодовую текстовую форму на 3-м, выходном, языке 2-го (принимающего) терминала 13. На конечном этапе приемо-передачи преобразуют кодовую форму текста на 3-м, выходном, языке 2-го терминала 13 в аналоговый аудиосигнал в речевой форме на 3-м, выходном, языке этого 2-го терминала 13 (фиг.2), посредством синтезатора 20 речи и выводят речевую форму аналогового аудиосигнала на 3-м, выходном, языке через динамик 21 2-го терминала 13 связи (функционально являющегося, в рассматриваемом случае - принимающим). In the storage device 5 (Fig. 1), switching connected with the analog-to-digital converter / ADC / 1st terminal 1 of the electronic system (functionally transmitting in this consideration), an incoming analog audio signal is introduced in speech form in the input language. Then, by means of the ADC, analog-to-digital processing and conversion of the speech form of an analog audio signal into a code text form are carried out in the 1st, input, language. In the process of exchanging information code signals (in text form) between the 1st communication terminal 1 and the second (receiving) terminal 13, electronic translation of the code text form in the 1st, input, language of the transmitting 1st terminal 1 into the code text form in the 3rd, output, the language of the 2nd (receiving) terminal 13. At the final stage of the transmission, the code form of the text is converted in the 3rd, output, language of the 2nd terminal 13 into an analog audio signal in a speech form on the 3rd, output, language of this 2nd terminal 13 (Fig. 2), by means of a speech synthesizer 20 and the speech form of the analog audio signal is output to 3rd, output, language through the speaker 21 of the 2nd communication terminal 13 (which is functionally matrivaemom case - receiving).
Отличительными особенностями принципа функционирования заявленной электронной системы является следующее.  Distinctive features of the principle of operation of the claimed electronic system is the following.
Процесс электронного перевода кодовой формы текста на 1-м, входном, языке в кодовую форму текста на 3-м, выходном языке организуют в два этапа:  The process of electronic translation of the code form of the text in the 1st, input language into the code form of the text in the 3rd, output language is organized in two stages:
- на первом этапе (который осуществляют посредством терминала связи функционально являющегося в данный момент времени передающим) обеспечивают преобразования кодовой формы текста на входном (родном для владельца данного терминала) языке в кодовую форму текста на общепринятый в мировой практике промежуточный язык, преимущественно, английский;  - at the first stage (which is carried out by means of a communication terminal that is functionally currently transmitting), the code form of the text in the input (native for the owner of this terminal) language is converted into the code form of the text in an intermediate language generally accepted in world practice, mainly English;
- на втором этапе (который осуществляют посредством терминала связи функционально являющегося в данный момент времени принимающим) обеспечивают преобразования кодовой формы текста на промежуточном языке в кодовую форму текста на выходном (родном для владельца данного терминала) языке.  - at the second stage (which is carried out by the communication terminal, which is functionally currently receiving), the code form of the text in the intermediate language is converted to the code form of the text in the output (native language for the owner of this terminal) language.
Причем, перед началом использования терминала связи, функционально являющегося передающим, на данном терминале однократно осуществляют верификацию устной речи владельца данного терминала связи относительно ее письменной формы, программно структурируемой посредством данного терминала связи. Для этого осуществляют выделение и запоминание данных о характерных акустико-лингвистических признаках устной речи владельца этого (передающего) терминала для осуществления программной адаптации их относительно эталонных фонемов, заложенных в базе данных этого (передающего) терминала. Moreover, before using the communication terminal, which is functionally transmitting, the terminal verifies once the spoken language of the owner of the given communication terminal regarding its written form, programmatically structured by means of this communication terminal. To do this, carry out the selection and storage of data on characteristic acoustic-linguistic features of spoken language by the owner of this (transmitting) terminal to implement software adaptation of them relative to reference phonemes embedded in the database of this (transmitting) terminal.
Система автоматического перевода речь в речь структурно похожа на процесс профессионального перевода кинофильма. Так, вначале речь на языке оригинала переводят в текстовую форму также на языке оригинала, данный текст переводят в текстовую форму на языке проката фильма и затем актеры (носители языка проката фильма) озвучивают этот текст.  A speech-to-speech automatic translation system is structurally similar to a professional movie translation process. So, first the speech in the original language is translated into a text form also in the original language, this text is translated into a text form in the film rental language and then the actors (native speakers of the film rental language) voice this text.
Совершенно очевидно, что процессы кодовых текстовых переводов, согласно настоящего изобретения, можно осуществлять и с использованием соответствующих баз данных из глобальной мировой сети «Интернет». Алгоритм подобной виртуальной коммутации терминала связи с упомянутыми базами данных широко известен, см, например, RU, N° 2 324296 С1.  It is clear that the processes of code-based text translations, according to the present invention, can be carried out using the appropriate databases from the global global network "Internet". An algorithm for such virtual switching of the communication terminal with the mentioned databases is widely known, see, for example, RU, N ° 2 324296 C1.
В программном плане такие части процесса, как преобразование речи в текст и текста в речь в настоящее время достаточно развиты для коммерческого применения, постоянно совершенствуются и могут использоваться как готовые блоки программы переводчика.  In the programmatic plan, such parts of the process as the conversion of speech into text and text to speech are currently sufficiently developed for commercial use, are constantly being improved and can be used as ready-made blocks of a translator program.
Основная трудность программы заключается в переводе текста в текст.  The main difficulty of the program is the translation of text into text.
В предпочтительном варианте целесообразно организовать перевод текста в текст как машинный поиск групп предложений или отдельных предложений из базы переводов, выполненных профессиональными переводчиками и хранящимися в сети «Интернет». При этом, для постоянного пополнения соответствующей базы переводов предложения, которые запрашиваются для перевода, но отсутствуют в базе переводов, выставляются с учетом их частотности в открытый доступ и могут предлагаться, например, для перевода на коммерческой основе переводчикам. При такой организации процесса перевод текста в текст будет выполнять целая армия переводчиков, связанная с пользователем сетью «Интернет», а электронно-вычислительная машина будет лишь проводить выбор соответствующего текста из базы заранее выполненных переводов. Предполагается наличие обратной связи пользователя с переводчиками, т.е., при неудовлетворительном переводе пользователь простым нажатием кнопки может послать соответствующую информацию в базу переводов. In a preferred embodiment, it is advisable to organize the translation of text into text as a machine search for groups of sentences or individual sentences from a translation database made by professional translators and stored on the Internet. At the same time, in order to constantly replenish the corresponding translation base, proposals that are requested for translation but are not in the translation database are exposed for open frequency taking into account their frequency and can be offered, for example, for translation on a commercial basis to translators. With this organization of the process, text-to-text translation will be carried out by a whole army of translators associated with the Internet user, and the electronic computer will only select the appropriate text from the database of pre-made translations. It is assumed that the user has feedback from the translators, i.e., if the translation is unsatisfactory, the user can send the corresponding information to the translation database with a simple click of a button.
В этом случае полнота базы переводов, их качество и скорость пополнения базы будут в основном зависеть от качества организации структуры Интернет-переводчиков, мотивации их активности и т.д.  In this case, the completeness of the translation database, their quality and the speed of replenishment of the database will mainly depend on the quality of the organization of the structure of Internet translators, the motivation for their activity, etc.
В дальнейшем, по мере развития техники, база переводов и программа-поисковик в определенном виде при необходимости смогут храниться и автономно в мобильном терминале (телефоне) с функцией синхронного перевода «речь в речь».  In the future, as technology develops, the translation database and the search engine in a certain form, if necessary, can be stored autonomously in a mobile terminal (telephone) with the function of simultaneous translation “speech to speech”.
Разумно верификацию устной речи владельца терминалов 1 и 13 связи осуществлять следующим образом:  It is reasonable to verify the oral speech of the owner of the communication terminals 1 and 13 as follows:
- владелец озвучивает заложенный в программу и/или произвольный текст;  - the owner voices the program and / or arbitrary text embedded in the program;
- озвученный и введенный в запоминающее устройство 5, 17 соответствующего терминала связи аналоговый сигнал в речевой форме анализируют по характерным акустико-лингвистическим признакам и программно адаптируют их применительно к эталонному текстовому аналогу речи, заложенному в памяти (базе данных) этого терминала;  - the analogue signal voiced and entered into the storage device 5, 17 of the corresponding communication terminal in speech form is analyzed by characteristic acoustic-linguistic features and programmatically adapt them as applied to the reference textual speech analogue stored in the memory (database) of this terminal;
- сохраняют информацию об отсутствующих в эталонной базе данных терминала характерных акустико-лингвистических признаках владельца;  - save information about the characteristic acoustic-linguistic features of the owner that are absent in the reference database of the terminal;
- затем владелец озвучивает произвольный текст и проверяет его письменную форму, отображаемую на дисплее терминала связи;  - then the owner voices an arbitrary text and checks its written form displayed on the display of the communication terminal;
- после чего осуществляют зацикливание этих двух методов верификации речи владельца между собой в операционной системе терминала, для чего владелец терминала озвучивает текст с дисплея терминала связи, аналоговую версию которого программно преобразуют в письменную форму и сравнивают с исходным текстом на дисплее; - after which these two methods of verifying the speech of the owner among themselves in the operating system are looped terminal, for which the owner of the terminal reads the text from the display of the communication terminal, the analog version of which is programmatically converted into a written form and compared with the source text on the display;
- при совпадении первоначального и полученного из аналоговой версии произнесенного владельцем текста процесс верификации данного текста завершается;  - if the original and received from the analogue version of the text pronounced by the owner coincide, the verification process of this text ends;
- при несовпадении указанных текстов программно обеспечивают переход к следующему тексту для верификации, заложенному в памяти этого терминала связи, и дублируют вышеописанный процесс верификации.  - if these texts do not match, the software provides the transition to the next verification text stored in the memory of this communication terminal and duplicates the verification process described above.
Совершенно очевидно, что процесс верификации в заявленных изобретениях можно осуществлять и иными известными из уровня техники методами и средствами (см. , например, патенты RU N° 2200369 и NQ 2166207). It is obvious that the verification process in the claimed inventions can be carried out by other methods and means known from the prior art (see, for example, patents RU N ° 2200369 and N Q 2166207).
Заявленная полезная модель может быть широко использована в среде владельцев мобильных телефонов, в рамках реализации функций преобразования разговорной речи на языке владельца телефона (терминала) в озвученную разговорную речь и/или письменную информацию (текст) на языке его иностранного собеседника.  The claimed utility model can be widely used among mobile phone owners, as part of the implementation of the functions of converting conversational speech in the language of the owner of the phone (terminal) into voiced conversational speech and / or written information (text) in the language of his foreign interlocutor.
Для этого, как ранее указывалось, преобразователь устной речи владельца терминала настраивается на характерные акустико- лингвистические особенности голоса владельца, путем аудиовоспроизведения владельцем специальных и/или произвольных текстов, появляющихся на дисплее терминала связи в процессе верификации характерных признаков голоса владельца. Алгоритм процесса верификации подробно раскрыт в предыдущем описании и графически отображен на фиг.4.  To this end, as previously indicated, the owner’s oral speech transducer is tuned to the characteristic acoustic-linguistic features of the owner’s voice by means of the audio reproduction by the owner of special and / or arbitrary texts appearing on the display of the communication terminal during verification of the characteristic features of the owner’s voice. The verification process algorithm is described in detail in the previous description and is graphically displayed in FIG. 4.
Кодовое преобразование письменного текста с языка владельца терминала в письменный текст на языке собеседника проводится с помощью программ электронного машинного перевода, преимущественно, Translation Memory, например, компании «Trados». Из максимально полных и постоянно пополняемых баз переводов хранящихся, например, в системе «Интернет» с использованием мощных процессоров также находящихся в данной системе может проводиться выборка текстов, максимально совпадающих с текстом перевода. При этом сначала проводится поиск предложения целиком или группы предложений, выделенных паузой при произнесении текста. Если предложения целиком или группы предложений в задействованных базах переводов нет, то проводится разбиение предложения или их группы на две, три и более частей, вплоть до отдельных слов и слогов до момента обнаружения в задействованной базе данных идентичного фонема (аналога). Однако, вышеуказанное отсутствующее предложение в целом в дальнейшем должно быть дополнено в исходную базу переводов. The code conversion of the written text from the language of the owner of the terminal into the written text in the language of the interlocutor is carried out using electronic machine translation programs, mainly Translation Memory, for example, the company "Trados". From the most complete and constantly updated translation databases stored, for example, in the Internet system using powerful processors also located in this system, texts can be selected that match the translation text as closely as possible. In this case, a search is made for the whole sentence or a group of sentences highlighted by a pause when pronouncing the text. If there is no whole sentence or sentence group in the involved translation databases, then a sentence or a group of sentences is divided into two, three or more parts, up to individual words and syllables until an identical phoneme (analogue) is found in the involved database. However, the above missing sentence as a whole should be further supplemented in the original translation database.
Второе преобразование кодовой текстовой формы с промежуточного языка (преимущественно, английского) в кодовую текстовую форму на языке собеседника (владельца второго терминала), если собеседник не владеет английским языком, проводится аналогично первому письменному преобразованию с использованием баз переводов.  The second conversion of a code text form from an intermediate language (mainly English) to a code text form in the language of the interlocutor (owner of the second terminal), if the interlocutor does not speak English, is carried out similarly to the first written conversion using translation databases.
В процессе преобразования кодовой текстовой формы сообщения на третьем, выходном языке в выходной аудиосигнал в виде устной речи на языке владельца 2-го терминала, может осуществляться преобразование голоса диктора программы озвучивания текста с целью приближения акустико-лингвистических особенностей голоса диктора к соответствующим характерным признакам голоса владельца 1-го терминала.  In the process of converting a code text form of a message in a third, output language into an output audio signal in the form of spoken language in the language of the owner of the 2nd terminal, the voice of the speaker of the voiceover program can be converted in order to approximate the acoustic-linguistic features of the voice of the speaker to the corresponding characteristic features of the voice of the owner 1st terminal.
Промышленная применимость  Industrial applicability
Таким образом, заявленное техническое решение может быть широко использовано в области электроники, в частности в системах (устройствах) для перевода фраз с первого языка на второй, в частности, но не исключительно, к таким системам, которые вырабатывают речевой аудиосигнал на выходе (на выходном языке) из речевого аудиосигнала на входе (на входном языке). Thus, the claimed technical solution can be widely used in the field of electronics, in particular in systems (devices) for translating phrases from the first language into the second, in particular, but not exclusively, to such systems, which generate a speech audio signal at the output (in the output language) from the speech audio signal at the input (in the input language).
Таким образом, вышеизложенные сведения свидетельствуют о выполнении при использовании заявленного технического решения следующей совокупности условий:  Thus, the above information indicates the fulfillment of the following set of conditions when using the claimed technical solution:
- объекты, воплощающие заявленное техническое решение, при их осуществлении предназначены для использования в области электроники для реализации известными мобильными терминалами связи функции синхронного перевода речевой информации с одного языка на другой.  - objects that embody the claimed technical solution, when implemented, are intended for use in the field of electronics for the implementation by well-known mobile communication terminals of the function of simultaneous translation of voice information from one language to another.
- для заявленных объектов в том виде, как они охарактеризованы в независимом пункте нижеизложенной формулы, подтверждена возможность их осуществления с помощью вышеописанных в заявке или известных из уровня техники на дату приоритета средств и методов;  - for the declared objects as described in the independent clause of the formula below, the possibility of their implementation using the means and methods described above or known from the prior art on the priority date is confirmed;
- объекты, воплощающие заявленное техническое решение, при их осуществлении способны обеспечить достижение усматриваемого заявителем технического результата.  - objects that embody the claimed technical solution, when implemented, are able to ensure the achievement of the technical result perceived by the applicant.
Следовательно, заявленное техническое решение соответствует требованию условия патентоспособности «промышленная применимость».  Therefore, the claimed technical solution meets the requirements of the patentability condition "industrial applicability".

Claims

ФОРМУЛА ПОЛЕЗНОЙ МОДЕЛИ USEFUL MODEL FORMULA
1. Электронная приемо-передающая система с функцией синхронного перевода устной речи с одного языка на другой, включающая, по меньшей мере, один приемо-передающий терминал связи входящего аналогового аудиосигнала в речевой форме, который содержит: энергонезависимое запоминающее устройство, преимущественно, флэш-память; средства ввода речевой формы аналогового аудиосигнала на входном языке в терминал связи, функционально являющийся передающим; средства аналого-цифрового преобразования и обработки речевой формы аналогового аудиосигнала в кодовую текстовую форму на входном языке; средства перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке; средства цифро-аналогового преобразования и обработки кодовой формы текста на выходном языке в аналоговый аудиосигнал на этом же языке в речевой форме, а также средства вывода речевой формы аналогового аудиосигнала на выходном языке через терминал связи, функционально являющийся принимающим, отличающаяся тем, что терминал связи, функционально являющийся передающим, оснащен средством верификации устной речи владельца терминала относительно ее письменной формы, структурируемой посредством данного терминала связи; структура средств перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке организована двухуровневой; причем первый уровень входит в состав терминала связи, функционально являющегося передающим и оснащен средством преобразования кодовой формы текста на входном языке в кодовую форму текста на общепринятом в мировой практике промежуточном языке, преимущественно, английском; а второй уровень входит в состав терминала связи, функционально являющегося принимающим и оснащен средством преобразования кодовой формы текста на промежуточном языке в кодовую форму текста на выходном языке; кроме того, структура средств перевода кодовой формы текста на входном языке в кодовую форму текста на выходном языке, во-первых, программно организована с возможностью осуществления перевода текста в текст, как на первом, так и на втором из вышеуказанных этапов, посредством машинного поиска отдельных текстовых форм в виде словосочетаний, предложений или групп предложений из базы данных переводов, предварительно выполненных профессиональными переводчиками и хранящимися в мобильной сети, например, «Интернет»; а, во-вторых, конструктивно-технологически организована с возможностью использования такой базы данных переводов мобильной сети, которая является постоянно пополняемой, преимущественно в интерактивном режиме, и в которой упомянутые текстовые формы, запрашиваемые для перевода, но отсутствующие в базе переводов, выставляются с учетом частоты их использования в открытый доступ и предлагаются, для перевода профессиональным переводчикам, например, на коммерческой основе. 1. Electronic transceiver system with the function of simultaneous translation of oral speech from one language to another, including at least one transceiver communication terminal of an incoming analog audio signal in a speech form, which contains: non-volatile storage device, mainly flash memory ; speech input means of an analog audio signal in the input language to the communication terminal, which is functionally transmitting; means for analog-to-digital conversion and processing of the speech form of an analog audio signal into a code text form in the input language; means for translating the code form of the text in the input language into the code form of the text in the output language; means for digital-to-analog conversion and processing of the code form of the text in the output language into an analog audio signal in the same language in speech form, as well as means for outputting the speech form of an analog audio signal in the output language through a communication terminal that is functionally receiving, characterized in that the communication terminal, functionally transmitting, equipped with a means of verifying the spoken language of the owner of the terminal regarding its written form, structured by means of this communication terminal; the structure of the means of translating the code form of the text in the input language into the code form of the text in the output language is organized two-level; moreover, the first level is a part of the communication terminal, functionally transmitting and equipped with a means of converting the code form of the text in the input language into the code form of the text in the intermediate language generally accepted in the world practice, mainly English; and the second level is part of the communication terminal, functionally receiving and equipped with a means of converting the code form of the text in the intermediate language into the code form of the text in the output language; in addition, the structure of the means of translating the code form of the text in the input language into the code form of the text in the output language is, firstly, programmatically organized with the ability to translate text into text, both in the first and second of the above steps, by machine searching for individual text forms in the form of phrases, sentences or sentence groups from a translation database previously executed professional translators and stored on the mobile network, for example, "Internet"; and, secondly, it is structurally and technologically organized with the possibility of using such a database of mobile network translations, which is constantly updated, mainly in an interactive mode, and in which the mentioned text forms requested for translation but not in the translation database are set taking into account the frequencies of their use in open access are also offered for translation by professional translators, for example, on a commercial basis.
2. Электронная приемо-передающая система по п.1 , отличающаяся тем, что в качестве передающего и принимающего терминала функционально используется один и тот же терминал связи.  2. The electronic transceiver system according to claim 1, characterized in that the same communication terminal is functionally used as the transmitting and receiving terminal.
3. Электронная приемо-передающая система по п.1 , отличающаяся тем, что в качестве передающего и принимающего терминала функционально используются два пространственно удаленных один от другого конструктивно идентичных терминала связи виртуально скоммутированные посредством глобальной системы мобильной связи стандарта GSM и сети «Интернет».  3. The electronic transceiver system according to claim 1, characterized in that as the transmitting and receiving terminal are functionally two spatially remote from one another structurally identical communication terminals virtually switched by means of a global mobile communication system of the GSM standard and the Internet.
4. Электронная приемо-передающая система по п.1 , отличающаяся тем, что в передающем и принимающем терминалах предусмотрены дополнительные альтернативные средства ввода- вывода передаваемой информации в текстовой форме на соответствующих языках.  4. The electronic transceiver system according to claim 1, characterized in that the transmitting and receiving terminals provide additional alternative means of input-output of the transmitted information in text form in the respective languages.
5. Электронная приемо-передающая система по п.1 , отличающаяся тем, что в качестве терминала связи используется мобильное электронное устройство, преимущественно, сотовый телефон, адаптированное к глобальной системе мобильной связи стандарта GSM и сети «Интернет». 5. The electronic transceiver system according to claim 1, characterized in that as the communication terminal uses a mobile electronic device, mainly a cellular a phone adapted to the global mobile communications system of the GSM standard and the Internet.
6. Электронная приемо-передающая система по п.1 , отличающаяся тем, что в качестве терминала связи используется мобильное электронное устройство, преимущественно, персональный компьютер типа «ноутбук», адаптированное к сети «Интернет».  6. The electronic transceiver system according to claim 1, characterized in that a mobile electronic device, mainly a laptop type personal computer adapted to the Internet, is used as a communication terminal.
PCT/RU2010/000818 2010-12-31 2010-12-31 Electronic receiving and transmitting system with the function of synchronous translation of verbal speech from one language into another WO2012091608A1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
PCT/RU2010/000818 WO2012091608A1 (en) 2010-12-31 2010-12-31 Electronic receiving and transmitting system with the function of synchronous translation of verbal speech from one language into another

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/RU2010/000818 WO2012091608A1 (en) 2010-12-31 2010-12-31 Electronic receiving and transmitting system with the function of synchronous translation of verbal speech from one language into another

Publications (1)

Publication Number Publication Date
WO2012091608A1 true WO2012091608A1 (en) 2012-07-05

Family

ID=46383364

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/RU2010/000818 WO2012091608A1 (en) 2010-12-31 2010-12-31 Electronic receiving and transmitting system with the function of synchronous translation of verbal speech from one language into another

Country Status (1)

Country Link
WO (1) WO2012091608A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083847A (en) * 2019-05-10 2019-08-02 中译语通科技股份有限公司 A kind of conference system for realizing synchronous translation

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5490061A (en) * 1987-02-05 1996-02-06 Toltran, Ltd. Improved translation system utilizing a morphological stripping process to reduce words to their root configuration to produce reduction of database size
RU2070734C1 (en) * 1986-10-03 1996-12-20 Бритиш Телекоммьюникейшнз Паблик Лимитед Компани Device translating phrases of several words from one language to another one
US6161082A (en) * 1997-11-18 2000-12-12 At&T Corp Network based language translation system
US6266642B1 (en) * 1999-01-29 2001-07-24 Sony Corporation Method and portable apparatus for performing spoken language translation
RU2008137398A (en) * 2008-09-19 2010-03-27 Юрий Константинович Низиенко (RU) METHOD FOR ORGANIZING SYNCHRONOUS TRANSLATION OF ORAL SPEECH FROM ONE LANGUAGE TO ANOTHER MEANS OF ELECTRONIC TRANSMISSION SYSTEM AND ELECTRONIC TRANSLATION FOR ITS IMPLEMENTATION

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2070734C1 (en) * 1986-10-03 1996-12-20 Бритиш Телекоммьюникейшнз Паблик Лимитед Компани Device translating phrases of several words from one language to another one
US5490061A (en) * 1987-02-05 1996-02-06 Toltran, Ltd. Improved translation system utilizing a morphological stripping process to reduce words to their root configuration to produce reduction of database size
US6161082A (en) * 1997-11-18 2000-12-12 At&T Corp Network based language translation system
US6266642B1 (en) * 1999-01-29 2001-07-24 Sony Corporation Method and portable apparatus for performing spoken language translation
RU2008137398A (en) * 2008-09-19 2010-03-27 Юрий Константинович Низиенко (RU) METHOD FOR ORGANIZING SYNCHRONOUS TRANSLATION OF ORAL SPEECH FROM ONE LANGUAGE TO ANOTHER MEANS OF ELECTRONIC TRANSMISSION SYSTEM AND ELECTRONIC TRANSLATION FOR ITS IMPLEMENTATION

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110083847A (en) * 2019-05-10 2019-08-02 中译语通科技股份有限公司 A kind of conference system for realizing synchronous translation

Similar Documents

Publication Publication Date Title
US7593842B2 (en) Device and method for translating language
EP2571023B1 (en) Machine translation-based multilingual human-machine dialog
RU2419142C2 (en) Method to organise synchronous interpretation of oral speech from one language to another by means of electronic transceiving system
US9697201B2 (en) Adapting machine translation data using damaging channel model
US6625576B2 (en) Method and apparatus for performing text-to-speech conversion in a client/server environment
US8244540B2 (en) System and method for providing a textual representation of an audio message to a mobile device
US8862478B2 (en) Speech translation system, first terminal apparatus, speech recognition server, translation server, and speech synthesis server
CN101923858B (en) Real-time and synchronous mutual translation voice terminal
CN101008942A (en) Machine translation device and method thereof
CN112420050B (en) Voice recognition method and device and electronic equipment
CN113380221A (en) Chinese and English mixed speech synthesis method and device, electronic equipment and storage medium
JP2667408B2 (en) Translation communication system
US9218807B2 (en) Calibration of a speech recognition engine using validated text
RU80603U1 (en) ELECTRONIC TRANSMISSION SYSTEM WITH THE FUNCTION OF SYNCHRONOUS TRANSLATION OF ORAL SPEECH FROM ONE LANGUAGE TO ANOTHER
WO2012091608A1 (en) Electronic receiving and transmitting system with the function of synchronous translation of verbal speech from one language into another
CN103474063B (en) Voice identification system and method
CN113781996B (en) Voice synthesis model training method and device and electronic equipment
KR20140079543A (en) Auto Interpreting and Translating apparatus
KR102376552B1 (en) Voice synthetic apparatus and voice synthetic method
CN111489742A (en) Acoustic model training method, voice recognition method, device and electronic equipment
US20170185587A1 (en) Machine translation method and machine translation system
KR20020054192A (en) A system and method for interpreting automatically a telephony guidance for a foreigner
WO2001042875A2 (en) Language translation voice telephony
Vijayakumar et al. ISAY: SMS Service Using ARM
CN113889112A (en) On-line voice recognition method based on kaldi

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 10861385

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 10861385

Country of ref document: EP

Kind code of ref document: A1