CN1559042A - 多语言转录系统 - Google Patents

多语言转录系统 Download PDF

Info

Publication number
CN1559042A
CN1559042A CNA028189922A CN02818992A CN1559042A CN 1559042 A CN1559042 A CN 1559042A CN A028189922 A CNA028189922 A CN A028189922A CN 02818992 A CN02818992 A CN 02818992A CN 1559042 A CN1559042 A CN 1559042A
Authority
CN
China
Prior art keywords
text data
component
audio
signal
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA028189922A
Other languages
English (en)
Inventor
L
L·阿格尼霍特里
M
T·F·M·麦格
N·定艾特罗瓦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1559042A publication Critical patent/CN1559042A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/4302Content synchronisation processes, e.g. decoder synchronisation
    • H04N21/4307Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen
    • H04N21/43072Synchronising the rendering of multiple content streams or additional data on devices, e.g. synchronisation of audio on a mobile phone with the video output on the TV screen of multiple content streams on the same device
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/433Content storage operation, e.g. storage operation in response to a pause request, caching operations
    • H04N21/4332Content storage operation, e.g. storage operation in response to a pause request, caching operations by placing content in organized collections, e.g. local EPG data repository
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4348Demultiplexing of additional data and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/435Processing of additional data, e.g. decrypting of additional data, reconstructing software from modules extracted from the transport stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/4402Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display
    • H04N21/440236Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving reformatting operations of video signals for household redistribution, storage or real-time display by media transcoding, e.g. video is transformed into a slideshow of still pictures, audio is converted into text
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/4508Management of client data or end-user data
    • H04N21/4532Management of client data or end-user data involving end-user characteristics, e.g. viewer profile, preferences
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/485End-user interface for client configuration
    • H04N21/4856End-user interface for client configuration for language selection, e.g. for the menu or subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/488Data services, e.g. news ticker
    • H04N21/4884Data services, e.g. news ticker for displaying subtitles
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/08Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division
    • H04N7/087Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only
    • H04N7/088Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital
    • H04N7/0884Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection
    • H04N7/0885Systems for the simultaneous or sequential transmission of more than one television signal, e.g. additional information signals, the signals occupying wholly or partially the same frequency band, e.g. by time division with signal insertion during the vertical blanking interval only the inserted signal being digital for the transmission of additional display-information, e.g. menu for programme or channel selection for the transmission of subtitles

Abstract

提供一种用于从原始语言至目标语言处理包含辅助信息分量的同步音频/视频信号的多语言转录系统。该系统从辅助信息分量中过滤文本数据、将文本数据翻译成目标语言并显示翻译的文本数据,同时播放同步信号的音频分量和视频分量。该系统还提供用于存储多个语言数据库的存储器,所述的语言数据库包括隐喻解释器、辞典以及可选地包括用于识别翻译文本的语音部分的语法分析器。辅助信息分量可以是与音频/视频信号相关的任何语言文本,即,视频文本、利用语音识别软件生成的文本、程序转录、电子节目指南信息、封闭字幕文本等。

Description

多语言转录系统
技术领域
本发明一般涉及多语言转录(transcription)系统,并且更具体地涉及从原始语言至目标语言处理包含辅助信息分量的同步的音频/视频信号的转录系统。辅助信息分量优选是与同步音频/视频信号合成的封闭字幕(closedcaptioned)文本信号。
背景技术
封闭字幕是一种设计来为聋人和有听力障碍的人提供接入电视的辅助技术,它与副标题(subtitle)的相似之处在于,它将电视信号的音频部分作为印刷字显示在电视屏幕上。与副标题的不同之处在于,封闭字幕隐藏为在电视信号内发送的编码数据,并且提供关于背景噪声和音响效果的信息,而副标题是电视信号的视频部分中的永久图像。一个希望看到封闭字幕的观看者必须使用机顶解码器或者利用装有内置解码器电路的电视。这些字幕被并入在电视信号的垂直消隐间隔中发现的行21数据区域。自从1993年7月以来,根据TDCA(Television Decoder Circuitry Act)的要求,所有在美国销售的具有13英寸或以上尺寸电视屏幕的电视机都必须装有内置解码器电路。
一些电视节目的字幕是实时的,即,在一个特殊事件或者一个新闻节目的实况广播期间,在显示所说的话的动作之后,字幕仅出现几秒。速记员收听广播并打字到一个将字幕格式成信号的特殊的计算机程序中,这些信号随后被输出以便与电视信号相混合。另外一些节目传送的字幕是在节目制作完成之后添加上的。字幕作者使用脚本和收听节目的音带,因此他们能够添加解释音响效果的语句。
除了帮助有听力障碍的人,封闭字幕还可以在不同的情形下应用。例如,在一个听不到节目的声音部分的嘈杂的环境中,即,在机场或者在火车站,封闭字幕非常有用。封闭字幕对人们学习英语或者学习阅读很有利。为此,1996年8月6日授给Wen F.Chang的美国专利号US 5543851(‘851专利)披露了一种处理其中具有字幕数据的电视信号的封闭字幕处理系统。在接收到电视信号之后,‘851专利的系统从电视信号中除去字幕数据,并将它提供给显示屏幕。用户随后选择显示的文本部分,并输入要求定义或翻译所选择文本的命令。整个字幕数据然后就被从屏幕上移走,并且每一个单独的词(word)的定义和/或翻译被确定和显示。
虽然‘851专利的系统利用封闭字幕来定义和翻译每一个单独的词,但由于这些词都是根据使用的方式从上下文中进行翻译的,所以这并不是一个有效的学习工具。例如,单个词在翻译时没有考虑与句子结构的关系,或者没有考虑它是否是表示隐喻(metaphor)的词组的一部分。另外,由于‘851专利的系统在显示翻译文本时除去了字幕文本,所以用户必须返回到前面已看过的节目部分来阅读此翻译。用户随后必须返回到显示文本模式,以继续观看节目,这在整个过程中一直持续。
发明内容
因此,本发明的一个目的是提供一种克服现有技术翻译系统的缺点的多语言转录系统。
本发明的另一个目的是提供一种系统和方法,用于将例如封闭字幕的与同步音频/视频信号相关的辅助信息翻译为目标语言,以便在播放音频/视频信号的同时显示翻译的信息。
本发明的更进一步的目的是提供一种用于翻译与同步音频/视频信号相关的辅助信息的系统和方法,该辅助信息被分析以除去多义性(ambiguity),诸如隐喻和俚语(slang)等,并识别语音部分(parts of speech)以提供一种有效的用于学习新语言的工具。
为了实现上述目的,提供一种多语言转录系统,该系统包括:用于接收同步音频/视频信号和相关的辅助信息分量的接收器;用于将信号分离成音频分量、视频分量和辅助信息分量的第一过滤器;在需要时,用于从所述辅助信息分量中提取文本数据的同一过滤器或第二过滤器;用于以接收文本数据的原始语言分析所述文本数据的微处理器;该微处理器被编程以运行将文本数据翻译成目标语言并利用相关的视频分量格式化所翻译的文本数据的软件;显示器,用于在显示相关视频分量的同时显示所翻译的文本数据;和放大器,用于播放所述信号的相关音频分量。该系统还提供用于存储多个语言数据库的存储装置,所述的语言数据库包括隐喻解释器(metaphorinterpretor)、辞典(thesaurus)并且还可选地包括用于识别翻译文本的语音部分的语法分析器。更进一步,该系统提供一个文本-语言合成器,用于合成表示所翻译的文本数据的声音。
辅助信息分量能够包括任何与音频/视频信号相关的语言文本,例如,视频文本、利用语音识别软件生成的文本、程序转录(program transcript)、电子节目指南信息、封闭字幕文本等。与辅助信息分量相关的音频/视频信号能够是模拟信号、数字流或者现有技术中公知的能够包含多种信息分量的任何其他信号。
本发明的多语言转录系统可以实施在独立的设备中,例如电视机、与电视机或计算机耦合的机顶盒、服务器或者驻留在计算机上的计算机可执行程序。
根据本发明的另一方面,提供了一种用于处理音频/视频信号和相关的辅助信息分量的方法,该方法包括以下步骤:接收信号;将信号分离成音频分量、视频分量和辅助信息分量;需要时,从辅助信息分量中分离出文本数据;以接收所述信号的原始语言分析文本数据;将文本数据翻译成目标语言,将所翻译的文本数据与相关的视频分量同步;和在显示所述信号的相关视频分量和播放该信号的相关音频分量的同时,显示所翻译的文本数据。将认识到,文本数据能够从原始接收到的信号中分离出来而不必将信号分离成不同的分量,或者文本数据可以通过语音-文字转换来生成。另外,该方法还用于分析原始文本数据和翻译的文本数据,确定是否存在一个隐喻或者俚语,并将该隐喻或俚语利用表示预期含意的标准术语来替换。进一步,该方法用于确定文本数据的语音部分的分类,并且利用显示的翻译的文本数据显示语音分类部分。
附图说明
通过结合附图对本发明的下列具体描述中,本发明的上述和其他目的、特性和优点将会变得更加清楚,其中:
图1是表示根据本发明的多语言转录系统的方框图;
图2是根据本发明的用于处理包含辅助信息分量的同步音频/视频信号的方法的流程图。
具体实施方式
下面将借助附图描述本发明的优选实施例。在以下描述中,将不详细描述公知的功能或结构,以避免利用不必要的细节妨碍本发明。
参考图1,示出了根据本发明的用于处理包含相关辅助信息分量的同步音频/视频信号的系统10。系统10包括用于接收同步音频/视频信号的接收器12,该接收器可以是用于接收广播电视信号的天线、用于从有线电视系统或视频盒式记录器接收信号的耦合器、用于接收卫星传输的卫星抛物面天线和下变频器、或者用于通过电话线、DSL线、电缆线或无线连接接收数字数据流的调制解调器。
所接收的信号随后被发送到用于将接收的信号分离成音频分量22、视频分量18和辅助信息分量16的第一过滤器14。辅助信息分量16和视频分量18然后被发送到从辅助信息分量16和视频分量18中提取文本数据的第二过滤器20。另外,音频分量22被发送到微处理器24,微处理器24的功能将在下面介绍。
辅助信息分量16包括合成在音频/视频信号中的转录文本,例如,视频文本、利用语音识别软件生成的文本、程序转录、电子节目指南信息、封闭字幕文本。通常,文本数据与广播、数字流中相应的音频和视频在时间上相关或同步。视频文本是显示在显示器的前景(foreground)中的叠加文本或覆盖文本,而图像作为背景。例如,一个电视新闻节目的广播员名字通常作为视频文本出现。视频文本也可以采用在显示图像中嵌入文本的形式,例如,一个街道符号可以通过OCR(optical character recognition光学字符识别)类型软件程序从视频图像中识别和提取出来。另外,携带辅助信息分量16的音频/视频信号可以是模拟信号、数字流以及现有技术中公知的其他能够包含多种信息分量的信号。例如,音频/视频信号可以是具有辅助信息分量嵌入到用户数据字段中的MPEG流。更进一步,辅助信息分量可以作为例如时间标记的从具有信息的音频/视频信号中分离出的离散的信号进行发送,以便将辅助信息与音频/视频信号相关。
仍参考图1,将理解,第一过滤器14和第二过滤器20可以是单个整体过滤器或者是具有分离上述信号和根据需要从辅助信息分量中提取文本的能力的任何公知的过滤设备或部件。例如,在广播电视信号情况下,将具有第一过滤器来分离音频和视频并消除载波,而第二过滤器用作A/D转换器和多路分用器来从视频中分离出辅助信息。另一方面,在数字电视信号情况下,此系统可以由用于分离信号和从中提取文本数据的单个多路分用器组成。
文本数据26和视频分量18一起随后被发送到微处理器24。然后,以接收音频/视频信号的原始语言利用微处理器24中的软件来分析文本数据26。微处理器24与例如存储器的存储装置28交互作用,以执行文本数据26的几个分析。存储装置28可以包括协助微处理器24分析文本数据26的几个数据库。一个这样的数据库是隐喻解释器30,用于将在提取的文本数据26中发现的隐喻利用表示预期含意的标准术语来替换。例如,如果短语“once ina blue moon”出现在提取的文本数据26中,将利用标准术语“非常罕见”来替换,从而防止此隐喻在随后被翻译成另一种外语时变得无法理解。其他这样的数据库包括用于将频繁出现的术语利用具有类似含意的不同术语来替换的辞典数据库32和用于告知用户该术语的意义的文化/历史数据库34。例如,在从日语翻译过来时,对用户强调该术语是称呼(address)长辈的“正式”方式或者是称呼同龄人的合适表达方式。
分析文本数据的难度(difficulty level)可以利用用户的个人优先级(preference level)来设置。例如,本发明系统的一个新用户可以将难度设置为“低”,其中当一个词使用辞典数据库来替换时,一个简单的词被插入。与难度设置为高时的情况相反,对于被翻译的词可以插入一个多音节词或者复杂的短语。另外,当掌握一定程度之后,一个特定用户的个人优先级可以自动增加难度。例如,在用户已经历一个特定词或短语预定次数之后,系统将自适应地学会增加难度,其中预定次数可以由用户设置或预置为缺省值。
当分析和处理提取的文本数据26以便利用隐喻和可以校正语法、成语、口语等的任何其他数据库排除多义性之后,文本数据26被利用由翻译软件组成的翻译器36翻译成目标语言,该翻译器可以是系统中一个独立部件或者是被微处理器24控制的软件模块。更进一步,被翻译的文本可以利用通过其语音部分(即,名词,动词等)形式和一个句子中的句法关系来描述被翻译文本的语法分析器38来处理。翻译器36和语法分析器38可以依赖于语言-语言字典数据库37进行处理。
将理解:由与不同数据库30、32、34、37相关的微处理器24所执行的分析可以对翻译文本(即,外语)进行操作,也可以在翻译之前对提取的文本数据进行操作。例如,可以查询隐喻数据库,以便利用一个隐喻替换翻译文本中的传统文本。另外,提取的文本数据能够在翻译之前利用语法分析器38进行处理。
然后,被翻译的文本数据46被格式化并且与相关的视频进行相关,而且与原始接收信号的视频分量18一起被发送到显示器40,以便在通过音频装置42(即,放大器)播放音频分量22的同时与相应的视频一起进行显示。因此,为使翻译的文本数据46和有关的音频与视频同步,在传输中可以进行适当的延迟。
可选择地,原始接收信号的音频分量22可以被静音(mute),并且被翻译的文本数据46可以利用文本-语音合成器44进行处理,以便合成表示被翻译的文本数据46的声音,从而基本上将所述节目“配音(dub)”成目标语言。文本-语音合成器的三种可能的模式包括:(1)仅将用户指出的词发音;(2)将所有翻译的文本数据发音;以及(3)仅将利用用户设置的个人优先级所确定的具有一定难度的词发音,例如多音节词。
更进一步,为了方便一种新语言的学习,通过语法分析器38和微处理器24与文化/历史数据库34相互作用而产生的结果可以和相关的视频分量18以及翻译的文本数据46一起同时在显示器40上显示。
本发明的多语言转录系统10可以被实施在独立电视机中,其中所有的系统部件都驻留在电视机中。该系统也能够被实施为耦合到电视机或计算机的机顶盒,其中接收器12、第一过滤器14、第二过滤器20、微处理器24、存储装置28、翻译器36、语法分析器38以及文本-语音变换器44都包含在机顶盒中,而显示装置40和音频装置42利用电视机或计算机来提供。
用户对本发明的多语言转录系统10的启动和交互作用能够通过一个与电视机一起使用的遥控相类似的遥控来实现。可选地,用户可以利用通过硬线或无线连接耦合到该系统的键盘来控制该系统。通过用户交互作用,用户能够确定何时应显示文化/历史信息、何时应激活文本-语音合成器以便进行配音以及应以何种难度来处理翻译,即,个人优先级。另外,用户可以输入国家代码来激活特定的外语数据库。
在本发明的多语言转录系统的另一个实施例中,此系统通过因特网Internet服务提供商(ISP)接入Internet。一旦文本数据被翻译,用户可以在搜索询问中利用翻译文本在Internet上进行搜索。一个类似的用于利用从音频/视频信号的辅助信息分量中得到的文本执行Internet搜索的系统公开在由Thomas McGee,Nevenka Dimitrova和Lalitha Agnihotri于2000年7月27号提出的申请序列号为NO.09/627188、题目为“TRANSCRIPT TRIGGERSFOR VIDEO ENHANCEMENT”(Docket No.US000198)的申请中,该申请与共同受让人拥有,并且该申请的内容在此被引用作为参考。一旦搜索被执行,搜索结果以一个web页面或者以web页面的一部分或者叠加在显示器图像上的部分在显示装置40上进行显示。可选地,一个简单的统一资源定位符(URL)、信息消息或者web页面的非文本部分(诸如图像,音频和视频)被返回给用户。
尽管上面已相对一个优选的系统描述了本发明的优选实施例,但本发明的实施例能够利用在程序控制下操作的通用处理器或专用处理器来实现,或利用其他电路来实现,以执行一组或可编程指令,这些指令适用于将在下面参考图2描述的用于处理包含辅助信息分量的同步音频/视频信号的方法。
参考图2,其中描述了用于处理具有相关的辅助信息分量的同步音频/视频信号的方法。该方法包括以下步骤:接收信号102;将此信号分离成音频分量、视频分量以及辅助信息分量104;如果需要的话,从辅助信息分量中提取文本数据106;以接收所述信号的原始语言分析文本数据108;将此文本数据流翻译成目标语言114;利用音频和视频分量将翻译文本相关和格式化;以及在显示所述信号的视频分量和播放所述信号的音频分量的同时,显示所翻译的文本数据120。另外,该方法还用于分析原始文本数据和翻译的文本数据、确定是否存在隐喻或俚语110并利用表示预期含意的标准术语来替换该隐喻或俚语112。更进一步,该方法确定一个特殊术语是否重复116,并且在该术语被确定为重复时,在该术语第一次出现(occurrence)之后,利用在所有出现中具有相类似含意的不同术语来替换该术语118。可选地,该方法用于确定文本数据的语音部分的分类并且和显示的翻译文本数据一起显示语音分类部分。
尽管参照优选实施例具体描述了本发明,但这些仅仅代表示例性应用。因此,对于本领域的技术人员来说,应该理解,在不脱离由所附权利要求书限定的本发明的精神和范围的情况下,本领域普通技术人员可以对其进行形式和细节的各种修改。例如,辅助信息分量可以是在观看期间包括用于将辅助信息分量和音频/视频信号同步的时间标记信息的一个单独发送的信号,或者可替换地,辅助信息分量可以被提取而无需将原始接收的信号分离成其不同的分量。另外,辅助信息分量、音频和视频分量可以驻留在一个存储媒体的不同部分(如软盘、硬盘、CD-ROM等)中,其中所有的分量都包含时间标记信息,以使得在观看期间能够同步所有分量。

Claims (26)

1.一种用于处理音频/视频信号和包括在时间上与所述音频/视频信号相关的文本数据的辅助信息信号的方法,所述方法包括以下步骤:
以接收所述文本数据的原始语言顺序分析所述文本数据部分(108);
将所述文本数据部分顺序翻译成目标语言(104);和
显示所述翻译的文本数据部分,同时播放在时间上与每一部分相关的音频/视频信号(120)。
2.如权利要求1所述的方法,还包括以下步骤:
接收所述的音频/视频信号和所述的辅助信息信号(102);
将所述的音频/视频信号分离成音频分量和视频分量(104);和
从所述辅助信息信号中过滤出所述的文本数据(106)。
3.如权利要求1所述的方法,其中顺序分析所述文本数据部分的步骤包括以下步骤:
确定出现在所分析的所述文本数据部分中的一个术语是否重复(116),以及在该术语被确定为重复时,在该术语第一次出现之后利用在所有出现中具有类似含意的一个不同术语来替换该术语(118)。
4.如权利要求1所述的方法,其中顺序分析所述文本数据部分的步骤包括以下步骤:
确定在所考虑的所述文本数据部分中是否存在口语和隐喻之一(110),并利用表示预期含意的标准术语来替换所述的多义性(112)。
5.如权利要求1所述的方法,还包括以下步骤:
顺序分析所述翻译的文本数据部分;和
确定在所述翻译的文本数据部分中是否存在口语和隐喻之一(110),并利用表示预期含意的标准术语来替换所述多义性(112)。
6.如权利要求1所述的方法,其中顺序分析所述文本数据部分的步骤(108)还包括以下步骤:确定所考虑的所述文本数据部分中词的语音部分,并利用显示的翻译的文本数据来显示该语音部分(120)。
7.如权利要求1所述的方法,还包括以下步骤:通过查询文化与历史知识数据库来分析所述文本数据部分和所述翻译的文本数据部分,并显示分析结果(120)。
8.如权利要求2所述的方法,其中所述文本数据是封闭字幕、语音-文本转录或所述视频分量中出现的OCR叠加文本。
9.如权利要求1所述的方法,其中所述同步音频/视频信号是无线电/电视信号、卫星馈电、数字数据流或来自视频盒式记录器的信号。
10.如权利要求1所述的方法,其中所述音频/视频信号和所述辅助信息信号作为合成信号被接收,并且所述的方法进一步包括将所述的合成信号分离成音频分量、视频分量和辅助信息分量的步骤(104)。
11.如权利要求10所述的方法,其中从其他辅助数据中分离出所述文本数据(106)。
12.如权利要求10所述的方法,其中所述的音频分量、视频分量和辅助信息分量是同步的。
13.如权利要求1所述的方法,进一步包括以下步骤:设置个人优先级,以确定执行将所述的文本数据部分顺序翻译成目标语言的步骤的难度。
14.如权利要求13所述的方法,其中根据类似术语出现的预定次数自动增加难度。
15.如权利要求13所述的方法,其中根据预定的时间周期自动增加难度。
16.一种用于处理音频/视频信号和包括在时间上与所述音频/视频信号相关的文本数据的辅助信息分量的设备,所述设备包括:
一个或多个过滤器(14,20),用于将所述信号分离成音频分量(22)、视频分量(18)和相关的文本数据(26);
微处理器(24),用于以接收所述文本数据的原始语言对所述文本数据部分进行分析,该微处理器具有用于将所述文本数据部分翻译(36)成目标语言并将视频分量(18)和相关的翻译文本数据(46)进行格式化以便输出的软件;
显示器(40),用于显示所翻译的文本数据部分(46),同时显示视频分量(18);和
放大器(42),用于播放在时间上与每一部分相关的所述信号的音频分量(22)。
17.如权利要求16所述的设备,进一步包括:
接收器(12),用于接收所述信号;和
过滤器(20),用于从所述辅助信息分量中提取文本数据。
18.如权利要求16所述的设备,进一步包括:
存储器(28),用于存储多个语言数据库(37),其中所述的语言数据库包括隐喻解释器(30)。
19.如权利要求16所述的设备,其中所述语言数据库包括辞典(32)。
20.如权利要求18所述的设备,其中所述的存储器(28)还存储与所述语言数据库(37)相互对照的多个文化/历史知识数据库(34)。
21.如权利要求16所述的设备,其中所述微处理器(24)进一步包括语法分析器软件(38),用于通过陈述一个句子中其语音部分、形式和句法关系来描述所述文本数据部分。
22.如权利要求16所述的设备,其中所述微处理器(24)确定在所考虑的所述文本数据部分和所述翻译的文本数据部分中是否存在口语和隐喻之一,并利用表示预期含意的标准术语来替换所述的多义性。
23.如权利要求16所述的设备,其中所述微处理器(24)设置个人优先级来确定将所述文本数据部分翻译成目标语言的难度。
24.如权利要求23所述的设备,其中所述微处理器(24)根据类似术语出现的预定次数自动增加难度。
25.如权利要求23所述的设备,其中所述微处理器(24)根据预定的时间周期自动增加难度。
26.一种接收器,用于处理同步音频/视频信号,所述同步音频/视频信号包含在时间上与所述音频/视频信号相关的辅助信息分量,所述接收器包括:
输入装置(12),用于接收所述信号;
多路分用装置(14),用于将所述信号分离成音频分量(22)、视频分量(18)和辅助信息分量(16);
过滤装置(20),用于从所述辅助信息分量(16)中提取文本数据(26);
微处理器(24),用于以接收所述信号的原始语言来分析所述文本数据(26);
翻译装置(36),用于将所述文本数据(26)翻译成目标语言;和
输出装置,用于将所翻译的文本数据(46)、所述信号的视频分量(18)与音频分量(22)输出到包括显示装置(40)和音频装置(42)的一个设备。
CNA028189922A 2001-09-28 2002-09-10 多语言转录系统 Pending CN1559042A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/966,404 US20030065503A1 (en) 2001-09-28 2001-09-28 Multi-lingual transcription system
US09/966,404 2001-09-28

Publications (1)

Publication Number Publication Date
CN1559042A true CN1559042A (zh) 2004-12-29

Family

ID=25511345

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA028189922A Pending CN1559042A (zh) 2001-09-28 2002-09-10 多语言转录系统

Country Status (7)

Country Link
US (1) US20030065503A1 (zh)
EP (1) EP1433080A1 (zh)
JP (1) JP2005504395A (zh)
KR (1) KR20040039432A (zh)
CN (1) CN1559042A (zh)
TW (1) TWI233026B (zh)
WO (1) WO2003030018A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102789385A (zh) * 2012-08-15 2012-11-21 魔方天空科技(北京)有限公司 视频文件播放器和视频文件播放的处理方法
CN103366501A (zh) * 2013-07-26 2013-10-23 东方电子股份有限公司 电力自动化主站分布式智能语音报警系统
CN104516876A (zh) * 2013-09-30 2015-04-15 株式会社东芝 语音翻译系统和语音翻译方法
CN104704851A (zh) * 2012-10-23 2015-06-10 三星电子株式会社 节目推荐装置和节目推荐程序
CN106328176A (zh) * 2016-08-15 2017-01-11 广州酷狗计算机科技有限公司 一种生成歌曲音频的方法和装置
CN109657252A (zh) * 2018-12-25 2019-04-19 北京微播视界科技有限公司 信息处理方法、装置、电子设备及计算机可读存储介质
CN110335610A (zh) * 2019-07-19 2019-10-15 北京硬壳科技有限公司 多媒体翻译的控制方法及显示器

Families Citing this family (72)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8416925B2 (en) 2005-06-29 2013-04-09 Ultratec, Inc. Device independent text captioned telephone service
FR2835642B1 (fr) * 2002-02-07 2006-09-08 Francois Teytaud Procede et dispositif pour faire comprendre une langue
WO2003077540A1 (en) * 2002-03-11 2003-09-18 Koninklijke Philips Electronics N.V. A system for and method of displaying information
DE60235651D1 (de) * 2002-03-27 2010-04-22 Mitsubishi Electric Corp Kommunikationsvorrichtung und kommunikationsverfahren
US6693663B1 (en) 2002-06-14 2004-02-17 Scott C. Harris Videoconferencing systems with recognition ability
GB2390274B (en) * 2002-06-28 2005-11-09 Matsushita Electric Ind Co Ltd Information reproducing apparatus
JP3938033B2 (ja) * 2002-12-13 2007-06-27 株式会社日立製作所 通信端末およびそれを用いたシステム
EP1616272A1 (en) * 2003-04-14 2006-01-18 Koninklijke Philips Electronics N.V. System and method for performing automatic dubbing on an audio-visual stream
ATE395788T1 (de) * 2003-08-25 2008-05-15 Koninkl Philips Electronics Nv Echtzeit-media-wörterbuch
US20050075857A1 (en) * 2003-10-02 2005-04-07 Elcock Albert F. Method and system for dynamically translating closed captions
US20050086702A1 (en) * 2003-10-17 2005-04-21 Cormack Christopher J. Translation of text encoded in video signals
US8515024B2 (en) 2010-01-13 2013-08-20 Ultratec, Inc. Captioned telephone service
US20130304453A9 (en) * 2004-08-20 2013-11-14 Juergen Fritsch Automated Extraction of Semantic Content and Generation of a Structured Document from Speech
US7584103B2 (en) * 2004-08-20 2009-09-01 Multimodal Technologies, Inc. Automated extraction of semantic content and generation of a structured document from speech
US7406408B1 (en) * 2004-08-24 2008-07-29 The United States Of America As Represented By The Director, National Security Agency Method of recognizing phones in speech of any language
KR101041810B1 (ko) * 2004-08-27 2011-06-17 엘지전자 주식회사 영상기기 및 그의 자동 캡션 수행 방법
CN100385934C (zh) * 2004-12-10 2008-04-30 凌阳科技股份有限公司 以字幕对应时间作为影音播放起讫点的控制方法与影音播放装置
JP2006211120A (ja) * 2005-01-26 2006-08-10 Sharp Corp 文字情報表示機能を備えた映像表示システム
US8352539B2 (en) * 2005-03-03 2013-01-08 Denso It Laboratory, Inc. Content distributing system and content receiving and reproducing device
US11258900B2 (en) 2005-06-29 2022-02-22 Ultratec, Inc. Device independent text captioned telephone service
RU2444072C2 (ru) * 2005-11-21 2012-02-27 Конинклейке Филипс Электроникс, Н.В. Система и способ для использования возможностей контента и метаданных цифровых изображений для нахождения соответствующего звукового сопровождения
US20070118372A1 (en) * 2005-11-23 2007-05-24 General Electric Company System and method for generating closed captions
JP4865324B2 (ja) * 2005-12-26 2012-02-01 キヤノン株式会社 情報処理装置及び情報処理装置の制御方法
US20070174326A1 (en) * 2006-01-24 2007-07-26 Microsoft Corporation Application of metadata to digital media
US7711543B2 (en) * 2006-04-14 2010-05-04 At&T Intellectual Property Ii, Lp On-demand language translation for television programs
US7831423B2 (en) * 2006-05-25 2010-11-09 Multimodal Technologies, Inc. Replacing text representing a concept with an alternate written form of the concept
JP5167256B2 (ja) * 2006-06-22 2013-03-21 マルチモーダル・テクノロジーズ・エルエルシー コンピュータ実装方法
US8045054B2 (en) * 2006-09-13 2011-10-25 Nortel Networks Limited Closed captioning language translation
JP4271224B2 (ja) * 2006-09-27 2009-06-03 株式会社東芝 音声翻訳装置、音声翻訳方法、音声翻訳プログラムおよびシステム
US20080284910A1 (en) * 2007-01-31 2008-11-20 John Erskine Text data for streaming video
US20080279535A1 (en) * 2007-05-10 2008-11-13 Microsoft Corporation Subtitle data customization and exposure
CN101437149B (zh) * 2007-11-12 2010-10-20 华为技术有限公司 一种提供多语种节目的方法、系统及装置
US20090150951A1 (en) * 2007-12-06 2009-06-11 At&T Knowledge Ventures, L.P. Enhanced captioning data for use with multimedia content
DE102007063086B4 (de) * 2007-12-28 2010-08-12 Loewe Opta Gmbh Fernsehempfangsvorrichtung mit Untertiteldecoder und Sprachsynthesizer
US20100082324A1 (en) * 2008-09-30 2010-04-01 Microsoft Corporation Replacing terms in machine translation
US20100106482A1 (en) * 2008-10-23 2010-04-29 Sony Corporation Additional language support for televisions
CN101477473B (zh) * 2009-01-22 2011-01-19 浙江大学 硬件支持的数据库指令解释执行方法
US8527500B2 (en) * 2009-02-27 2013-09-03 Red Hat, Inc. Preprocessing text to enhance statistical features
US20100265397A1 (en) * 2009-04-20 2010-10-21 Tandberg Television, Inc. Systems and methods for providing dynamically determined closed caption translations for vod content
US10891659B2 (en) 2009-05-29 2021-01-12 Red Hat, Inc. Placing resources in displayed web pages via context modeling
US8281231B2 (en) * 2009-09-11 2012-10-02 Digitalsmiths, Inc. Timeline alignment for closed-caption text using speech recognition transcripts
US20110276327A1 (en) * 2010-05-06 2011-11-10 Sony Ericsson Mobile Communications Ab Voice-to-expressive text
US8799774B2 (en) 2010-10-07 2014-08-05 International Business Machines Corporation Translatable annotated presentation of a computer program operation
US8959102B2 (en) 2010-10-08 2015-02-17 Mmodal Ip Llc Structured searching of dynamic structured document corpuses
US8549569B2 (en) 2011-06-17 2013-10-01 Echostar Technologies L.L.C. Alternative audio content presentation in a media content receiver
US9116654B1 (en) 2011-12-01 2015-08-25 Amazon Technologies, Inc. Controlling the rendering of supplemental content related to electronic books
US20130308922A1 (en) * 2012-05-15 2013-11-21 Microsoft Corporation Enhanced video discovery and productivity through accessibility
US9679608B2 (en) 2012-06-28 2017-06-13 Audible, Inc. Pacing content
US10109278B2 (en) * 2012-08-02 2018-10-23 Audible, Inc. Aligning body matter across content formats
WO2014059039A2 (en) * 2012-10-09 2014-04-17 Peoplego Inc. Dynamic speech augmentation of mobile applications
JPWO2014141413A1 (ja) * 2013-03-13 2017-02-16 株式会社東芝 情報処理装置、出力方法およびプログラム
US9576498B1 (en) * 2013-03-15 2017-02-21 3Play Media, Inc. Systems and methods for automated transcription training
WO2014198035A1 (en) * 2013-06-13 2014-12-18 Google Inc. Techniques for user identification of and translation of media
US20150011251A1 (en) * 2013-07-08 2015-01-08 Raketu Communications, Inc. Method For Transmitting Voice Audio Captions Transcribed Into Text Over SMS Texting
US9678942B2 (en) * 2014-02-12 2017-06-13 Smigin LLC Methods for generating phrases in foreign languages, computer readable storage media, apparatuses, and systems utilizing same
US10878721B2 (en) 2014-02-28 2020-12-29 Ultratec, Inc. Semiautomated relay method and apparatus
US20180270350A1 (en) 2014-02-28 2018-09-20 Ultratec, Inc. Semiautomated relay method and apparatus
US20180034961A1 (en) 2014-02-28 2018-02-01 Ultratec, Inc. Semiautomated Relay Method and Apparatus
US10389876B2 (en) 2014-02-28 2019-08-20 Ultratec, Inc. Semiautomated relay method and apparatus
US10796089B2 (en) * 2014-12-31 2020-10-06 Sling Media Pvt. Ltd Enhanced timed text in video streaming
US10007730B2 (en) 2015-01-30 2018-06-26 Microsoft Technology Licensing, Llc Compensating for bias in search results
US10007719B2 (en) * 2015-01-30 2018-06-26 Microsoft Technology Licensing, Llc Compensating for individualized bias of search users
US10397645B2 (en) * 2017-03-23 2019-08-27 Intel Corporation Real time closed captioning or highlighting method and apparatus
US10395659B2 (en) * 2017-05-16 2019-08-27 Apple Inc. Providing an auditory-based interface of a digital assistant
US10582271B2 (en) * 2017-07-18 2020-03-03 VZP Digital On-demand captioning and translation
JP6977632B2 (ja) * 2018-03-12 2021-12-08 株式会社Jvcケンウッド 字幕生成装置、字幕生成方法及びプログラム
CN108984788A (zh) * 2018-07-30 2018-12-11 珠海格力电器股份有限公司 一种录音文件整理、归类系统及其控制方法与录音设备
US11539900B2 (en) 2020-02-21 2022-12-27 Ultratec, Inc. Caption modification and augmentation systems and methods for use by hearing assisted user
CN111683266A (zh) * 2020-05-06 2020-09-18 厦门盈趣科技股份有限公司 一种视频同声翻译配置字幕方法及终端
CN111901538B (zh) * 2020-07-23 2023-02-17 北京字节跳动网络技术有限公司 一种字幕生成方法、装置、设备及存储介质
US20220303320A1 (en) * 2021-03-17 2022-09-22 Ampula Inc. Projection-type video conference system and video projecting method
KR102563380B1 (ko) 2023-04-12 2023-08-02 김태광 글쓰기 훈련 시스템

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4864503A (en) * 1987-02-05 1989-09-05 Toltran, Ltd. Method of using a created international language as an intermediate pathway in translation between two national languages
US5797011A (en) * 1990-10-23 1998-08-18 International Business Machines Corporation Method for controlling the translation of information on a display screen from a source language to a target language
JPH0567144A (ja) * 1991-09-07 1993-03-19 Hitachi Ltd 前編集支援方法およびその装置
NZ299101A (en) * 1992-09-04 1997-06-24 Caterpillar Inc Computer-based document development system: includes text editor and language editor enforcing lexical and grammatical constraints
US5805772A (en) * 1994-12-30 1998-09-08 Lucent Technologies Inc. Systems, methods and articles of manufacture for performing high resolution N-best string hypothesization
US5543851A (en) * 1995-03-13 1996-08-06 Chang; Wen F. Method and apparatus for translating closed caption data
US6002997A (en) * 1996-06-21 1999-12-14 Tou; Julius T. Method for translating cultural subtleties in machine translation
JPH10234016A (ja) * 1997-02-21 1998-09-02 Hitachi Ltd 映像信号処理装置及びそれを備えた映像表示装置及び記録再生装置
JPH10271439A (ja) * 1997-03-25 1998-10-09 Toshiba Corp 動画像表示システムおよび動画データ記録方法
EP0972254A1 (en) * 1997-04-01 2000-01-19 Yeong Kuang Oon Didactic and content oriented word processing method with incrementally changed belief system
DE19740119A1 (de) * 1997-09-12 1999-03-18 Philips Patentverwaltung System zum Schneiden digitaler Video- und Audioinformationen
US6077085A (en) * 1998-05-19 2000-06-20 Intellectual Reserve, Inc. Technology assisted learning
JP2000092460A (ja) * 1998-09-08 2000-03-31 Nec Corp 字幕・音声データ翻訳装置および字幕・音声データ翻訳方法
US6275789B1 (en) * 1998-12-18 2001-08-14 Leo Moser Method and apparatus for performing full bidirectional translation between a source language and a linked alternative language
US6223150B1 (en) * 1999-01-29 2001-04-24 Sony Corporation Method and apparatus for parsing in a spoken language translation system
US6282507B1 (en) * 1999-01-29 2001-08-28 Sony Corporation Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US20020069047A1 (en) * 2000-12-05 2002-06-06 Pinky Ma Computer-aided language learning method and system
US7221405B2 (en) * 2001-01-31 2007-05-22 International Business Machines Corporation Universal closed caption portable receiver
AU2002255679A1 (en) * 2001-03-02 2002-09-19 Breakthrough To Literacy, Inc. Adaptive instructional process and system to facilitate oral and written language comprehension
US6738743B2 (en) * 2001-03-28 2004-05-18 Intel Corporation Unified client-server distributed architectures for spoken dialogue systems
US7013273B2 (en) * 2001-03-29 2006-03-14 Matsushita Electric Industrial Co., Ltd. Speech recognition based captioning system
US6542200B1 (en) * 2001-08-14 2003-04-01 Cheldan Technologies, Inc. Television/radio speech-to-text translating processor
WO2003021391A2 (en) * 2001-08-30 2003-03-13 Umpleby Stuart A Method and apparatus for translating between two species of one generic language

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102789385A (zh) * 2012-08-15 2012-11-21 魔方天空科技(北京)有限公司 视频文件播放器和视频文件播放的处理方法
CN104704851A (zh) * 2012-10-23 2015-06-10 三星电子株式会社 节目推荐装置和节目推荐程序
CN104704851B (zh) * 2012-10-23 2018-11-02 三星电子株式会社 节目推荐装置和节目推荐方法
CN103366501A (zh) * 2013-07-26 2013-10-23 东方电子股份有限公司 电力自动化主站分布式智能语音报警系统
CN104516876A (zh) * 2013-09-30 2015-04-15 株式会社东芝 语音翻译系统和语音翻译方法
CN106328176A (zh) * 2016-08-15 2017-01-11 广州酷狗计算机科技有限公司 一种生成歌曲音频的方法和装置
CN106328176B (zh) * 2016-08-15 2019-04-30 广州酷狗计算机科技有限公司 一种生成歌曲音频的方法和装置
CN109657252A (zh) * 2018-12-25 2019-04-19 北京微播视界科技有限公司 信息处理方法、装置、电子设备及计算机可读存储介质
CN110335610A (zh) * 2019-07-19 2019-10-15 北京硬壳科技有限公司 多媒体翻译的控制方法及显示器

Also Published As

Publication number Publication date
US20030065503A1 (en) 2003-04-03
WO2003030018A1 (en) 2003-04-10
TWI233026B (en) 2005-05-21
JP2005504395A (ja) 2005-02-10
EP1433080A1 (en) 2004-06-30
KR20040039432A (ko) 2004-05-10

Similar Documents

Publication Publication Date Title
CN1559042A (zh) 多语言转录系统
KR101990023B1 (ko) 외국어학습을 위한 청크단위 분리 규칙과 핵심어 자동 강세 표시 구현 방법 및 시스템
CN111968649B (zh) 一种字幕纠正方法、字幕显示方法、装置、设备及介质
JP4459267B2 (ja) 辞書データ生成装置及び電子機器
JP3844431B2 (ja) 発話認識に基づいたキャプションシステム
EP1727368A2 (en) Apparatus and method for providing additional information using extension subtitles file
US20080195386A1 (en) Method and a Device For Performing an Automatic Dubbing on a Multimedia Signal
EP1903453A2 (en) A method of parsing an electronic text file
US9576581B2 (en) Metatagging of captions
CN101131691A (zh) 翻译隐藏式字幕的领域自适应便携机器翻译设备及其方法
US20040107102A1 (en) Text-to-speech conversion system and method having function of providing additional information
JP4100243B2 (ja) 映像情報を用いた音声認識装置及び方法
KR102300589B1 (ko) 수화통역 시스템
KR101932340B1 (ko) 원어민 동영상의 자막인지 및 해석기능을 갖는 영어 학습시스템을 이용한 영어 교육방법
KR101990019B1 (ko) 하이브리드 자막 효과 구현 단말 및 방법
JP4175141B2 (ja) 音声認識機能を有する番組情報表示装置
Eizmendi Automatic speech recognition for live TV subtitling for hearing-impaired people
KR20090074607A (ko) 자막 정보를 이용하여 단어 학습용 디스플레이 제어방법 및이를 이용한 기기
JP2006195900A (ja) マルチメディアコンテンツ生成装置及び方法
JPH10136260A (ja) 字幕スーパー・タイミング発生装置および方法ならびに字幕スーパー処理装置および方法
RU12269U1 (ru) Телевизионное устройство для перевода сигналов звукового сопровождения с одного языка на другой
Patel et al. Automatic Caption Generator
Ahmer et al. Automatic speech recognition for closed captioning of television: data and issues
JP2002351490A (ja) 字幕へのタイミング情報付与方法
CN109325147A (zh) 一种信息处理方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20041229