CN1874574A - 音频输出装置、文档阅读方法和移动终端 - Google Patents

音频输出装置、文档阅读方法和移动终端 Download PDF

Info

Publication number
CN1874574A
CN1874574A CN200610089941.2A CN200610089941A CN1874574A CN 1874574 A CN1874574 A CN 1874574A CN 200610089941 A CN200610089941 A CN 200610089941A CN 1874574 A CN1874574 A CN 1874574A
Authority
CN
China
Prior art keywords
audio output
word
audio
electronic document
type
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN200610089941.2A
Other languages
English (en)
Other versions
CN100539728C (zh
Inventor
坪井和弘
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Kyocera Corp
Original Assignee
Kyocera Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Kyocera Corp filed Critical Kyocera Corp
Publication of CN1874574A publication Critical patent/CN1874574A/zh
Application granted granted Critical
Publication of CN100539728C publication Critical patent/CN100539728C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • G10L13/10Prosody rules derived from text; Stress or intonation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/14Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]

Abstract

一种音频输出装置包括:输出音频的音频输出单元;存储单元,存储预定单词和与单词相关联的类型;控制器,在利用语音合成从音频输出单元将电子文档输出为音频时,当电子文档包含存储单元中存储的单词时,根据与所述单词相关联的类型控制从音频输出单元输出的音频。

Description

音频输出装置、文档阅读方法和移动终端
技术领域
本发明涉及一种音频输出装置以及一种文档阅读方法。
本申请要求2005年5月30日提交的日本专利申请No.2005-158213的国外优先权,该申请的内容整体结合于此用作参考。
背景技术
近来,在诸如移动电话和个人计算机(PC)之类的信息通信终端(音频输出装置)中,注意力集中在用于分析电子文档(例如,电子邮件)中的字符串并且使用语音合成技术来将电子文档中的文本转换为语音的功能。包括这种功能的信息通信终端使得用户能够利用声音来检查诸如电子邮件之类的电子文档(消息)的内容。这增加了信息通信终端的便利性,例如这是由于使用户能够在移动电话或PC监视器上执行另一操作的同时,通过声音的方式检查诸如电子邮件之类的电子文档的内容。
然而,使用传统语音合成技术的文本到语音功能输出单调的声音,而无论电子文档的内容如何。这种声调的缺乏使得用户听起来不舒服。为了解决此问题,日本未审专利申请第一公开No.2004-289577公开了一种技术,利用这种技术,当从发送方移动通信终端(例如,移动电话)向接收方移动通信终端发送电子邮件时,根据其内容向电子邮件附加情感标识信息。
然而,前述技术具有这样的缺点:向电子邮件附加情感标识信息增加了电子邮件的数据大小,并且由于电子邮件的数据大小增加,可能对用户收取更多的电子邮件使用费用。此外,当向电子邮件的报头附加情感标识信息时,必须修改邮件服务系统以适应报头的这种改变,这需要相当大的网络修改。
另一问题在于:如果发送方移动通信终端不具备用于附加情感标识信息的功能,则接收方移动通信终端不能确定任何情感。
考虑到上述问题做出了本发明,并且本发明的目的是实现一种音频输出装置以及一种文档阅读方法,包括具有高度传统情感表达的文本到语音功能。
发明内容
为了实现上述目的,本发明提供了一种音频输出装置,包括:输出音频的音频输出单元;存储单元,存储预定单词和与单词相关联的类型;控制器,在从音频输出单元将电子文档输出为音频时,当电子文档包含存储单元中存储的单词时,根据与所述单词相关联的类型控制从音频输出单元输出的音频。
本发明的第一方面提供了一种音频输出装置,包括:输出音频的音频输出单元;存储单元,存储预定单词和与单词相关联的类型;控制器,在利用语音合成从音频输出单元将电子文档输出为音频时,当电子文档包含存储单元中存储的单词时,根据与所述单词相关联的类型控制从音频输出单元输出的音频。
附图说明
图1是图示了根据本发明实施例的移动通信终端的配置的方框图;
图2是根据本发明实施例的情感类型确定表的第一示例;
图3是根据本发明实施例的情感类型确定表的第二示例;
图4是根据本发明实施例的情感类型确定表的第三示例;
图5是根据本发明实施例的紧急等级确定表的示例;
图6是由根据本发明实施例的移动通信终端执行的电子邮件的文本到语音转换处理的流程图;以及
图7是根据本发明实施例的情感类型确定方法及紧急等级确定方法的示例。
具体实施方式
后文将参考附图描述本发明的实施例。
作为音频输出装置的示例,该实施例的解释描述了一种移动通信终端,例如移动电话等,其具备用于发送和接收电子邮件(消息)的功能。图1是图示了根据本发明实施例的移动通信终端的功能配置的方框图。如图1所示,该移动通信终端包括无线通信单元1、键输入单元2、显示单元3、存储单元4、控制器5、以及音频输出单元9。控制器5包括情感类型确定单元6、声音质量设置单元7、以及语音合成器8作为其功能配置元件。
无线通信单元1由控制器5控制,并且使用诸如码分多址(CDMA)之类的预定通信技术,以通过与移动通信基站的无线通信来交换语音信号和数据信号(例如,电子邮件)。键输入单元2包括拨号键按钮、功能键按钮、电源键按钮等,并且向控制器5输出这些按钮的操作状态作为操作信号。显示单元3例如包括液晶显示装置,其基于从控制器5输入的显示信号,显示各种类型的消息、电话号码、图像等。
存储单元4预先存储控制器5所执行的控制程序。另外,存储单元4被配置为在控制器5的控制之下,顺序存储各种类型的数据,例如电话号码和电子邮件地址,并且响应于来自控制器5的请求,向控制器5输出这些数据。存储单元4还存储情感类型确定表,例如图2至4所示的表。如图2至4所示,情感类型确定表为每一情感类型(友爱、欣喜、安慰、不悦、失望/不安、困苦、失望/烦恼、重要和麻烦)列出类别,其中为每一类别存储了单词和加权常数。存储单元4还存储紧急等级确定表,其存储涉及紧急等级的类别,其中为每一类别定义了单词和加权常数,如图5所示。
控制器5被配置为根据存储单元4中预先存储的预定控制程序、从键输入单元2输入的操作信号、无线通信单元1的通信状态等来控制移动通信终端的总体操作。作为基于控制程序的特征控制处理,控制器5使用情感类型确定单元6和语音合成器8来处理无线通信单元1接收到的电子邮件的正文的文本数据。
情感类型确定单元6将电子邮件的正文的文本数据与情感类型确定表相比较,从文本数据中提取与每一情感类型相对应的单词,确定向每一单词分配的加权常数的总和,根据总和确定情感类型,并且向声音质量设置单元7输出指示情感类型的情感类型信号。情感类型确定单元6将文本数据与存储单元4中存储的紧急等级确定表相比较,提取相应的单词,根据分配给单词的加权常数的总和来确定紧急等级,并且向声音质量设置单元7输出指示紧急等级的紧急等级信号。稍后将详细解释情感类型确定单元6的此处理操作。
基于从情感类型确定单元6发送的情感类型信号(即,情感类型),声音质量设置单元7设置用于阅读电子邮件的声音质量(音调、音量和声调),基于紧急等级信号(即,紧急等级)设置语音的阅读速度,并且向语音合成器8输出涉及声音质量的信息作为语音设置信息。
基于声音质量信息,语音合成器8将电子邮件的文本数据转换为合成语音数据,并且将代表该合成语音数据的音频信号输出到音频输出单元9。即,对合成语音数据进行合成,从而根据情感类型确定单元6所确定的紧急等级和情感类型来阅读电子邮件。音频输出单元9例如包括扬声器,其将从语音合成器9输入的音频信号转换为声音并且将其输出到外部。
接着,将使用图6的流程图来解释如上配置的移动通信终端中电子邮件的文本到语音转换处理。
在步骤S1中,移动通信终端(具体地,无线通信单元1)通过移动通信基站接收到来自另一移动通信终端的电子邮件。在该示例中,接收到的电子邮件(接收邮件)包括文本数据“在如此长的艰苦时期之后,我们终于迎来了有趣的约会。我为你准备了礼物,快点来吧。”。除了电子邮件的正文之外,文本数据也可包括电子邮件的标题。
在图7的步骤S2中,控制器5中的情感类型确定单元6根据存储单元4中存储的情感类型确定表和紧急等级确定表,从接收邮件的文本数据中提取与每一情感类型和紧急等级相对应的单词(在该情形中,提取了“艰苦”、“有趣”、“约会”、“礼物”和“快点”)。在步骤S3中,情感类型确定单元6确定分配给单词的加权常数的总和作为总和(计数值),并且确定情感类型和紧急等级。例如,在图2中,单词“有趣”对应于情感类型“友爱”的类别“喜爱”,并且“友爱”的加权常数是“20”;“有趣”也对应于与情感类型“欣喜”有关的类别“快乐”,并且加权常数是“70”。如图5所示,单词“快点”对应于紧急等级类别“急迫”,并且其加权常数是“1”。
情感类型确定单元6执行类似处理,以针对每个其他单词填写图7的表,并由此计算与情感类型和紧急等级相关的加权常数的总和。如图7所示,因为在该实施例中加权常数的最大总和与情感类型“欣喜”相关,所以情感类型确定单元6确定“欣喜”作为接收邮件的情感类型,并且确定“1”作为紧急等级。
情感类型确定单元6然后在步骤S4中确定是否可以确定情感类型。如果步骤S2中计算的加权常数的最大总和是已知的,则可以在步骤S3中确定情感类型。因此,在步骤S4中的确定为“是”,并且情感类型确定单元6向声音质量设置单元7输出代表“欣喜”的情感类型信号作为接收邮件的情感类型以及代表“1”的紧急等级信号作为其紧急等级。在步骤S5中,声音质量设置单元7根据情感类型“欣喜”设置语音的音调、音量和声调,根据紧急等级“1”设置阅读速度,并且向语音合成器8输出该信息作为声音质量设置信息。代表紧急等级的值越大,阅读速度就越快;值越小,阅读速度越慢。
在步骤S6中,基于声音质量设置信息,语音合成器8将接收邮件的文本数据转换为合成语音数据,并且将其作为音频信号输出到音频输出单元9。音频输出单元9将音频信号转换为声音,并将其输出到外部。这使得能够将接收邮件阅读为带情感的语音。
步骤S3中存在在总加权常数中不能确定最大值的情形;即,存在多个情感类型,它们具有总和相等且与其他类别相比总和最大的两个或多个类别。因为难以在所有情形中确定接收邮件的情感类型,所以情感类型确定单元6在步骤S4中确定不能对这种接收邮件确定情感类型,并且前进到步骤S7。
在步骤S7中,情感类型确定单元6检查与接收邮件相对应的发送历史是否存储在存储单元4中。即,在步骤S7中,确定接收邮件是否是对从该移动通信终端发送到另一移动通信终端的电子邮件(发送邮件)的回复邮件。
如果步骤S7中做出的确定为“否”(即,如果接收邮件不是对从该移动通信终端发送的发送邮件的回复邮件),则在步骤S8中,情感类型确定单元6向声音质量设置单元7输出指示不能确定情感类型的情感类型信号以及指示接收邮件的紧急等级的紧急等级信号。
当情感类型确定单元6确定不能为接收邮件确定情感类型时,在步骤S9中,声音质量设置单元7选择不表达情感的标准设置(缺省设置)作为语音设置信息,并且将其输出到语音合成器8。该缺省设置仅使用与情感类型相关的设置作为标准设置,其中根据接收邮件的紧急等级来设置紧急等级。在步骤S6中,基于缺省设置,语音合成器8将接收邮件的文本数据转换为合成语音数据,并将其作为音频信号输出到音频输出单元9。音频输出单元9将音频信号转换为声音,并将其输出到外部。因此,当确定不能为接收邮件确定情感类型并且接收邮件不是回复邮件时,不带情感表达来执行文本到语音转换。
另一方面,当步骤S7中做出的确定为“是”时,即,当接收邮件是对从该移动通信终端发送的邮件的回复邮件时,例如当接收邮件具有与发送邮件的历史中所保留的邮件相同的邮件标题时,在步骤S10中,情感类型确定单元6获得存储单元4的发送邮件文件夹中存储的发送邮件的文本数据作为相关消息,并且在步骤S11中,基于其文本数据确定发送邮件的情感类型和紧急等级。确定情感类型和紧急等级的处理与步骤S3中的处理相同,并且不进一步解释。在步骤S12中,情感类型确定单元6确定是否可以为发送邮件确定情感类型。
如果步骤S12中做出的确定为“是”,即,确定可以为发送邮件确定情感类型,则情感类型确定单元6向声音质量设置单元7输出指示发送邮件的情感类型的情感类型信号以及指示发送邮件的紧急等级的紧急等级信号。在步骤S13中,声音质量设置单元7根据发送邮件的情感类型设置音调、音量和声调,根据发送邮件的紧急等级设置阅读速度,并且将该信息作为声音质量设置信息输出到语音合成器8。
在步骤S6中,基于声音质量设置信息,语音合成器8将接收邮件的文本数据转换为合成语音数据,并将其作为音频信号输出到音频输出单元9,音频输出单元9将音频信号转换为声音并将其输出到外部。这使得能够将接收邮件阅读为带情感的语音。因此,即使不能为接收邮件确定情感类型,如果接收邮件是对从该移动通信终端发送的发送邮件的回复邮件,因为作为相关消息的发送邮件和回复邮件很有可能具有相同的情感类型,所以通过检查发送邮件的情感类型,可以向接收邮件赋予情感表达,并且可以执行文本到语音转换。
另一方面,当步骤S12中做出的确定为“否”时,即,如果确定不能为发送邮件确定情感类型,则情感类型确定单元6向声音质量设置单元7输出指示不能确定情感类型的情感类型信号以及指示接收邮件(回复邮件)的紧急等级的紧急等级信号。
当以这种方式确定不能为发送邮件确定情感类型时,在步骤S14中,声音质量设置单元7选择不表达情感的标准设置(缺省设置)作为语音设置信息,并将其输出到语音合成器8。该缺省设置仅使用与情感类型相关的设置作为标准设置,其中根据接收邮件的紧急等级设置紧急等级。在步骤S6中,基于缺省设置,语音合成器8将接收邮件的文本数据转换为合成语音数据,并将其作为音频信号输出到音频输出单元9,音频输出单元9将音频信号转换为声音并将其输出到外部。因此,当确定接收邮件为回复邮件并且不能为回复邮件和发送邮件确定情感类型时,不带情感表达来执行文本到语音转换。
在步骤S11至S14中,可以根据发送邮件的发送时间与对发送邮件进行回复而发送的回复邮件的接收时间之间的时间间隔来确定紧急等级,并且可以根据该紧急等级来改变阅读速度。例如,当所述时间间隔较长时,确定较低的紧急等级,并且将阅读速度设置为慢速度。相反,当所述时间间隔较短时,确定高紧急等级,并且将阅读速度设置为快速度。
如上面根据该实施例所述,因为接收电子邮件的信息通信终端(音频输出装置)确定该接收邮件的情感类型,所以可以执行带情感的文本到语音转换,而不需要向发送信息的通信终端提供用于附加情感类型信息的功能。另外,不需要每次在用户发送电子邮件时输入情感类型信息。此外,因为不使用电子邮件的报头,所以不必改变邮件服务系统,由此可以减小用户的邮件使用成本。根据该实施例,可以使包括能够表达情感的文本到语音功能的移动通信终端更方便。
本发明不限于上述实施例,可以想到如下修改。
虽然在前述实施例中,对与从电子邮件(电子文档)中提取的每个单词相关联的情感类型的加权常数进行计数,并且基于每一情感类型的加权常数的总和(计数值)的最大值来确定电子邮件的情感类型,这不应视为限制本发明。如下情形是可以接受的:针对每一情感类型,对电子邮件(电子文档)中使用的单词的出现率进行计数,并且根据具有最高计数值的情感类型来确定电子邮件的情感类型。
虽然前述实施例体现在移动通信终端中,但是这不应视为限制了本发明。本发明的电子邮件阅读单元也可以应用于诸如个人计算机之类使用通信单元发送和接收电子邮件的信息通信终端。
虽然使用情感类型确定表和紧急等级确定表(例如图2至4及图5中的表)来描述前述实施例,但是这些仅是示例,并且没有限制本发明。当然可以设置与之相对应的其他情感类型和其他单词等。
虽然在前述实施例中,基于电子邮件的情感类型和紧急等级来执行文本到语音转换,但是还可以在显示单元3上显示与情感类型和紧急等级相对应的字符、动画等。
虽然使用电子邮件的语音合成的示例来描述前述实施例,但是本发明不局限于此,并且可以应用于具有文本数据的任何其他电子文档。除了电子邮件之外,本发明可以类似地应用于使用短消息服务、一键通(PTT)技术等通过在线聊天等发送和接收的消息以及在因特网上浏览网站等时发送和接收的消息。
虽然上面描述并图示了本发明的优选实施例,但是应该理解,这些是本发明的示例,而不应视为限制。在不脱离本发明的精神或范围的前提下,可以做出添加、省略、替换和其他修改。因此,本发明不应视为受限于前面的描述,而是仅由所附权利要求的范围限定。

Claims (15)

1.一种音频输出装置,包括:
输出音频的音频输出单元;
存储单元,存储预定单词和与单词相关联的类型;
控制器,在利用语音合成从音频输出单元将电子文档输出为音频时,当电子文档包含存储单元中存储的单词时,根据与所述单词相关联的类型控制从音频输出单元输出的音频。
2.根据权利要求1所述的音频输出装置,其中
存储单元存储与不同类型相关联的多个单词,并且
当电子文档包含多个与不同类型相关联的任意单词时,控制器针对每一类型确定电子文档中使用的单词的出现率,并且根据具有最大出现率的类型来控制从音频输出单元输出的音频。
3.根据权利要求2所述的音频输出装置,其中,在确定出现率时,当存在多个具有最大出现率的类型时,控制器输出标准音频输出。
4.根据权利要求1所述的音频输出装置,其中
存储单元存储每一单词的类型的加权常数,并且
当电子文档包含多个与不同类型相关联的任意单词时,控制器针对每一类型计算电子文档中使用的单词的类型的加权常数的总和,并且根据具有最大总和的类型来控制从音频输出单元输出的音频。
5.根据权利要求1所述的音频输出装置,其中
存储单元存储情感类型作为与单词相关联的类型,并且
控制器根据情感类型,控制音频输出的声音质量。
6.根据权利要求1所述的音频输出装置,其中
存储单元存储紧急等级作为与单词相关联的类型,并且
控制器根据紧急等级,控制音频输出的阅读速度。
7.根据权利要求1所述的音频输出装置,其中还包括连接到通信网络并发送和接收消息的通信单元,
其中,当以音频输出是电子文档的第一消息时,控制器根据与第一消息相关的第二消息相关联的类型来控制从音频输出单元输出的音频。
8.根据权利要求1所述的音频输出装置,其中还包括连接到通信网络并发送和接收消息的通信单元,
其中,当以音频输出是电子文档的第一消息时,如果第一消息和第二消息通过发送/接收关系互相相关,控制器根据生成第一消息的时间与生成第二消息的时间之间的时间间隔来控制音频输出。
9.根据权利要求1所述的音频输出装置,其中,
在控制音频输出时,控制器至少控制声音的音调、音量和声调之一。
10.根据权利要求1所述的音频输出装置,其中还包括
显示电子文档的显示单元。
11.一种音频输出装置中的文档阅读方法,其中音频输出装置包括输出音频的音频输出单元,所述方法包括步骤:
预先存储预定单词以及与单词相关联的类型;以及
利用语音合成从音频输出单元以音频输出电子文档;其中,当电子文档包含在存储步骤中存储的任意单词时,根据与所述单词相关联的类型来控制从音频输出单元输出的音频。
12.一种移动终端,包括:
通信单元,连接到通信网络,并且发送和/或接收电子文档的数据;
语音合成器,用于将通信单元所发送和/或接收的电子文档中的文本转换为语音;
音频输出单元,输出由语音合成器转换的语音的音频;
存储单元,存储预定单词和与该单词相关联的类型;
控制器,在从音频输出单元将电子文档输出为音频时,当电子文档包含存储单元中存储的所述单词时,根据与所述单词相关联的类型控制从音频输出单元输出的音频。
13.根据权利要求12所述的移动终端,其中
存储单元存储情感类型作为与单词相关联的类型,并且
控制器根据情感类型,控制音频输出的声音质量。
14.根据权利要求12所述的移动终端,其中
存储单元存储紧急等级作为与单词相关联的类型,并且
控制器根据紧急等级,控制音频输出的阅读速度。
15.根据权利要求12所述的移动终端,其中还包括
显示电子文档的显示单元。
CN200610089941.2A 2005-05-30 2006-05-29 音频输出装置、文档阅读方法和移动终端 Expired - Fee Related CN100539728C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2005158213 2005-05-30
JP2005158213 2005-05-30

Publications (2)

Publication Number Publication Date
CN1874574A true CN1874574A (zh) 2006-12-06
CN100539728C CN100539728C (zh) 2009-09-09

Family

ID=36687733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200610089941.2A Expired - Fee Related CN100539728C (zh) 2005-05-30 2006-05-29 音频输出装置、文档阅读方法和移动终端

Country Status (4)

Country Link
US (1) US8065157B2 (zh)
CN (1) CN100539728C (zh)
FR (1) FR2887735B1 (zh)
GB (1) GB2427109B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102244788A (zh) * 2010-05-10 2011-11-16 索尼公司 信息处理方法、信息处理装置、场景元数据提取装置、丢失恢复信息生成装置和程序
CN103098124A (zh) * 2010-09-14 2013-05-08 索尼公司 用于文本到语音转换的方法和系统
US9117446B2 (en) 2010-08-31 2015-08-25 International Business Machines Corporation Method and system for achieving emotional text to speech utilizing emotion tags assigned to text data
CN105139848A (zh) * 2015-07-23 2015-12-09 小米科技有限责任公司 数据转换方法和装置
CN109697974A (zh) * 2017-10-19 2019-04-30 百度(美国)有限责任公司 使用卷积序列学习的神经文本转语音的系统和方法
WO2020073944A1 (zh) * 2018-10-10 2020-04-16 华为技术有限公司 语音合成方法及设备

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7983910B2 (en) * 2006-03-03 2011-07-19 International Business Machines Corporation Communicating across voice and text channels with emotion preservation
GB2447263B (en) * 2007-03-05 2011-10-05 Cereproc Ltd Emotional speech synthesis
US8484035B2 (en) * 2007-09-06 2013-07-09 Massachusetts Institute Of Technology Modification of voice waveforms to change social signaling
FR2947923B1 (fr) * 2009-07-10 2016-02-05 Aldebaran Robotics Systeme et procede pour generer des comportements contextuels d'un robot mobile
KR101160193B1 (ko) * 2010-10-28 2012-06-26 (주)엠씨에스로직 감성적 음성합성 장치 및 그 방법
US20130120429A1 (en) * 2011-11-16 2013-05-16 Nickolas S. Sukup Method of representing emotion in a text message
WO2013095019A1 (ko) * 2011-12-20 2013-06-27 인포뱅크 주식회사 정보처리 방법 및 시스템과 기록매체
US20150261859A1 (en) * 2014-03-11 2015-09-17 International Business Machines Corporation Answer Confidence Output Mechanism for Question and Answer Systems
US10176157B2 (en) 2015-01-03 2019-01-08 International Business Machines Corporation Detect annotation error by segmenting unannotated document segments into smallest partition
KR20210020656A (ko) * 2019-08-16 2021-02-24 엘지전자 주식회사 인공 지능을 이용한 음성 인식 방법 및 그 장치

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3404055B2 (ja) 1992-09-07 2003-05-06 松下電器産業株式会社 音声合成装置
US5860064A (en) 1993-05-13 1999-01-12 Apple Computer, Inc. Method and apparatus for automatic generation of vocal emotion in a synthetic text-to-speech system
US5918222A (en) * 1995-03-17 1999-06-29 Kabushiki Kaisha Toshiba Information disclosing apparatus and multi-modal information input/output system
JPH11231885A (ja) 1998-02-19 1999-08-27 Fujitsu Ten Ltd 音声合成装置
JP2000187435A (ja) 1998-12-24 2000-07-04 Sony Corp 情報処理装置、携帯機器、電子ペット装置、情報処理手順を記録した記録媒体及び情報処理方法
JP2001034282A (ja) * 1999-07-21 2001-02-09 Konami Co Ltd 音声合成方法、音声合成のための辞書構築方法、音声合成装置、並びに音声合成プログラムを記録したコンピュータ読み取り可能な媒体
US6332143B1 (en) 1999-08-11 2001-12-18 Roedy Black Publishing Inc. System for connotative analysis of discourse
US6275806B1 (en) * 1999-08-31 2001-08-14 Andersen Consulting, Llp System method and article of manufacture for detecting emotion in voice signals by utilizing statistics for voice signal parameters
US7222075B2 (en) * 1999-08-31 2007-05-22 Accenture Llp Detecting emotions using voice signal analysis
JP2001154681A (ja) * 1999-11-30 2001-06-08 Sony Corp 音声処理装置および音声処理方法、並びに記録媒体
JP4465768B2 (ja) * 1999-12-28 2010-05-19 ソニー株式会社 音声合成装置および方法、並びに記録媒体
US6934684B2 (en) * 2000-03-24 2005-08-23 Dialsurf, Inc. Voice-interactive marketplace providing promotion and promotion tracking, loyalty reward and redemption, and other features
FR2807188B1 (fr) 2000-03-30 2002-12-20 Vrtv Studios Equipement pour production automatique en temps reel de sequences audiovisuelles virtuelles a partir d'un message textuel et pour la diffusion de telles sequences
US6721734B1 (en) 2000-04-18 2004-04-13 Claritech Corporation Method and apparatus for information management using fuzzy typing
JP2002041411A (ja) 2000-07-28 2002-02-08 Nippon Telegr & Teleph Corp <Ntt> テキスト読み上げロボット、その制御方法及びテキスト読み上げロボット制御プログラムを記録した記録媒体
JP2002127062A (ja) 2000-08-18 2002-05-08 Nippon Telegr & Teleph Corp <Ntt> ロボットシステム、ロボット制御信号生成装置、ロボット制御信号生成方法、記録媒体、プログラムおよびロボット
US6975988B1 (en) * 2000-11-10 2005-12-13 Adam Roth Electronic mail method and system using associated audio and visual techniques
US6622140B1 (en) 2000-11-15 2003-09-16 Justsystem Corporation Method and apparatus for analyzing affect and emotion in text
JP2002268699A (ja) * 2001-03-09 2002-09-20 Sony Corp 音声合成装置及び音声合成方法、並びにプログラムおよび記録媒体
CN1378155A (zh) 2001-04-04 2002-11-06 英业达股份有限公司 以语音播放电子邮件的方法及系统
JP2002304188A (ja) * 2001-04-05 2002-10-18 Sony Corp 単語列出力装置および単語列出力方法、並びにプログラムおよび記録媒体
DE60108373T2 (de) * 2001-08-02 2005-12-22 Sony International (Europe) Gmbh Verfahren zur Detektion von Emotionen in Sprachsignalen unter Verwendung von Sprecheridentifikation
JP2003186897A (ja) * 2001-12-13 2003-07-04 Aruze Corp 情報アクセスシステム及び情報アクセス方法
JP2003233388A (ja) 2002-02-07 2003-08-22 Sharp Corp 音声合成装置および音声合成方法、並びに、プログラム記録媒体
JP2003302992A (ja) 2002-04-11 2003-10-24 Canon Inc 音声合成方法及び装置
US7076430B1 (en) * 2002-05-16 2006-07-11 At&T Corp. System and method of providing conversational visual prosody for talking heads
JP2004151527A (ja) 2002-10-31 2004-05-27 Mitsubishi Electric Corp 音声合成装置、スタイル判定装置、音声合成方法、スタイル判定方法、およびプログラム
JP2004272807A (ja) 2003-03-11 2004-09-30 Matsushita Electric Ind Co Ltd 文字列処理装置および文字列処理方法
JP2004289577A (ja) 2003-03-24 2004-10-14 Kyocera Corp 移動通信端末及び移動通信システム
JP2005275601A (ja) * 2004-03-23 2005-10-06 Fujitsu Ltd 音声による情報検索システム

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102244788A (zh) * 2010-05-10 2011-11-16 索尼公司 信息处理方法、信息处理装置、场景元数据提取装置、丢失恢复信息生成装置和程序
CN102244788B (zh) * 2010-05-10 2015-11-25 索尼公司 信息处理方法、信息处理装置和丢失恢复信息生成装置
US9117446B2 (en) 2010-08-31 2015-08-25 International Business Machines Corporation Method and system for achieving emotional text to speech utilizing emotion tags assigned to text data
US9570063B2 (en) 2010-08-31 2017-02-14 International Business Machines Corporation Method and system for achieving emotional text to speech utilizing emotion tags expressed as a set of emotion vectors
US10002605B2 (en) 2010-08-31 2018-06-19 International Business Machines Corporation Method and system for achieving emotional text to speech utilizing emotion tags expressed as a set of emotion vectors
CN103098124A (zh) * 2010-09-14 2013-05-08 索尼公司 用于文本到语音转换的方法和系统
CN103098124B (zh) * 2010-09-14 2016-06-01 索尼公司 用于文本到语音转换的方法和系统
CN105139848A (zh) * 2015-07-23 2015-12-09 小米科技有限责任公司 数据转换方法和装置
CN105139848B (zh) * 2015-07-23 2019-01-04 小米科技有限责任公司 数据转换方法和装置
CN109697974A (zh) * 2017-10-19 2019-04-30 百度(美国)有限责任公司 使用卷积序列学习的神经文本转语音的系统和方法
WO2020073944A1 (zh) * 2018-10-10 2020-04-16 华为技术有限公司 语音合成方法及设备
US11361751B2 (en) 2018-10-10 2022-06-14 Huawei Technologies Co., Ltd. Speech synthesis method and device

Also Published As

Publication number Publication date
FR2887735A1 (fr) 2006-12-29
GB2427109A (en) 2006-12-13
US8065157B2 (en) 2011-11-22
US20060271371A1 (en) 2006-11-30
FR2887735B1 (fr) 2008-08-01
CN100539728C (zh) 2009-09-09
GB0610408D0 (en) 2006-07-05
GB2427109B (en) 2007-08-01

Similar Documents

Publication Publication Date Title
CN1874574A (zh) 音频输出装置、文档阅读方法和移动终端
KR100394305B1 (ko) 전자 메일 처리 시스템, 처리 방법 및 처리 장치
US7583671B2 (en) Multi-modal auto complete function for a connection
US8370349B2 (en) Instant contact searching and presentation by category
KR100800663B1 (ko) 이동 통신 단말기의 메시지 송수신 방법
US8116740B2 (en) Mobile communication terminal and method
EP2291987B1 (en) Method and device for launching an application upon speech recognition during a communication
US8583807B2 (en) Apparatus and methods for providing enhanced mobile messaging services
US20080207271A1 (en) Methods and devices for abridged contact list creation based on communication history
US7369866B2 (en) Message processing for communication terminal
US20040266397A1 (en) Communication device with message management and method therefore
US20050143104A1 (en) Message transmitting scheme of mobile terminal
CN109842544B (zh) 一种信息处理的方法及相关设备
JP5031269B2 (ja) 文書表示装置及び文書読み上げ方法
KR20080006955A (ko) 이동통신 단말기의 문자메시지 변환 장치 및 방법
US20140059151A1 (en) Method and system for providing contact specific delivery reports
US20080162489A1 (en) Apparatus and method for exchanging information between devices
KR101085161B1 (ko) 이동 통신 단말기의 단문 메시지를 이용한 전자명함송/수신 방법
KR100754655B1 (ko) 휴대 단말기의 수신처 입력 방법
JP2004178459A (ja) 情報通信端末、情報通信方法、その方法を実現するためのプログラムおよび記録媒体
KR20220107402A (ko) 이메일 주소에 의해 이메일을 분류하는 서버 및 이를 위한 제어 방법
KR100884652B1 (ko) 통신 단말기의 통신 데이터 관리 방법
US20080119171A1 (en) E-mail alert method and apparatus thereof

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090909

Termination date: 20180529