CN1739309A - 利用语音转文本辅助的多媒体和文本消息传送 - Google Patents

利用语音转文本辅助的多媒体和文本消息传送 Download PDF

Info

Publication number
CN1739309A
CN1739309A CNA2004800023281A CN200480002328A CN1739309A CN 1739309 A CN1739309 A CN 1739309A CN A2004800023281 A CNA2004800023281 A CN A2004800023281A CN 200480002328 A CN200480002328 A CN 200480002328A CN 1739309 A CN1739309 A CN 1739309A
Authority
CN
China
Prior art keywords
message
text
input
text message
null field
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004800023281A
Other languages
English (en)
Other versions
CN100409700C (zh
Inventor
J·W·诺思库特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Mobile Communications AB
Original Assignee
Sony Ericsson Mobile Communications AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Ericsson Mobile Communications AB filed Critical Sony Ericsson Mobile Communications AB
Publication of CN1739309A publication Critical patent/CN1739309A/zh
Application granted granted Critical
Publication of CN100409700C publication Critical patent/CN100409700C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72436User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for text messaging, e.g. SMS or e-mail
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages

Abstract

一种用于在移动电话上创建多媒体语音和文本消息的系统和方法,其中MMS消息的语音部分是文本部分的逐字再现或文本部分的个性化描述。移动电话包括响应语音和文本输入进行消息传送的功能。消息编辑者访问移动电话的消息传送功能305并口述消息310。口述的消息经记录并转换成文本消息310。如果该消息是个性化的,则消息编辑者记录上下文与所述文本消息相关的第二口述消息325。现在,将所述文本部分与所述第二口述消息组合成MMS消息330并利用移动电话的消息传送功能发送给接收者335。还公开了一种用于在移动电话上创建MMS消息的系统和方法,它利用固定消息和语音至文本协助功能来编辑所述固定消息。消息编辑器访问移动电话的消息传送功能105并通过语音或文本输入消息部分110。移动电话将输入与数据库比较,并显示接近匹配所述输入的文本消息的列表115。所述消息编辑器选择显示的文本消息之一120。然后将该消息显示在文本编辑功能中125,以便可以完成对它的编辑。

Description

利用语音转文本辅助的多媒体和文本消息传送
背景技术
移动电话最常用的一个功能是消息传送,短消息服务(SMS)的文本消息传送或多媒体消息服务(MMS)消息传送。用户常常使用这种服务来代替向另一方拨打电话。此外,MMS提供将可闻和可视附件包含到消息中的功能。
消息传送之所以合乎需要,是因为它不向拨打电话那样可能会打搅对方。接收方可以在开会时小心地接收消息,而不致干扰与会的其它人。
通过移动电话使用SMS或MMS消息传送的最大缺点在于,由于移动电话小键盘尺寸相对较小,输入消息可能困难。再者,数字小键盘提供的文本输入方式并不方便。有可供移动电话使用的协助文本输入的小键盘附件,但它们太小而难以有效地加以管理。
因此需要一种简化SMS或MMS消息的创建并将其发送给另一方的系统或方法。
发明的公开
移动电话制造商常常将“固定(canned)”消息包含在电话的存储器中。这些固定消息是经常重复使用的消息。用户只需浏览固定消息列表,便可选择一个来发送。浏览和选择固定消息的操作可能比从头编辑相同消息耗时少。用户还可以将他们自己创建的消息附加到固定消息列表中。
固定消息在提供消息起点方面很有用,但不能总是提供消息的具体细节。例如,一条固定消息可以是“于_在_见我”,其中第一个空白可以指时间(例如今天、今晚、明天),而第二个空白可以指地点(例如家、办公室、学校)。显然,单条固定消息无法涵盖所需消息的所有置换内容。为每个置换内容创建固定消息也是不现实的。最有效的解决方案是使用可加以编辑以适应用户即时需求的通用固定消息。
但是如上所述,编辑固定消息存在同样的移动电话数据输入的问题。一种解决方案是结合语音转文本处理来支持SMS和MMS消息的编辑。
本发明的一个实施例描述一种用于在移动电话上创建多媒体语音和文本消息的系统和方法,其中MMS消息的语音部分是文本部分的逐字再现。移动电话包括响应语音和文本输入进行消息传送的功能。消息编辑者访问移动电话的消息传送功能并口述消息。口述消息经记录并转换成文本消息。最后,文本部分和口述部分组合成MMS消息并使用移动电话的消息传送功能发送给接收者。
本发明的另一个实施例描述一种在移动电话上创建多媒体语音和文本消息的系统和方法,其中所述MMS消息的语音部分和文本部分是不同的。这允许消息编辑者对文本部分或语音部分进行个性化处理。所述消息编辑者访问移动电话的消息传送功能并口述消息。口述消息经记录并转换成文本消息。此时,消息编辑者记录上下文与所述文本消息相关的第二口述消息。接着将所述文本与所述第二口述消息组合成MMS消息并利用移动电话的消息传送功能发送给接收者。
本发明的再一个实施例描述一种用于在移动电话上创建MMS消息的系统和方法,它利用固定消息和语音转文本辅助来编辑所述固定消息。消息编辑者访问移动电话的消息传送功能并通过语音或文本方式输入部分消息。所述移动电话将输入与数据库比较,并显示接近匹配所述输入内容的文本消息的列表。这些文本消息包含至少一个空白字段,以填充具体信息来使该消息完整。所述消息编辑者选择所显示的文本消息之一。此消息随后显示在文本编辑功能中,以便可以使其完整。
编辑所选文本消息是通过语音转文本辅助功能来实现的。为所选文本消息中的第一个/下一个字段接收语音输入。该语音输入被转换成文本输入。将所述文本输入与数据库进行比较以尝试查找匹配项。
如果存在匹配项,则判断该匹配项是否对应于单词(短语)、图像或二者。如果匹配项是单词(短语),则在空白字段中填入该单词(短语)。如果匹配项是图像,则在空白字段中填入该图像。如果匹配项对应于单词(短语)和图像二者,则消息编辑者选择该单词(短语)或图像,并以选择的内容填充空白字段。执行检查,以查看所述固定消息中是否还有其它空白字段。如果还有其它空白字段,则控制返回到语音输入步骤,并重复该过程。否则,结束所述编辑过程。
如果没有匹配项,则移动电话显示数据库中最接近的匹配项,并询问消息编辑者是否要使用所述最接近的匹配项。
如果使用最接近的匹配项,则在空白字段中填入该最接近的匹配项。执行检查,以查看所述固定消息中是否还有其它空白字段。如果还有其它空白字段,则控制返回到语音输入步骤,并重复该过程。否则,结束所述编辑过程。
如果不使用上述最接近的匹配项,则移动电话提示消息编辑者将当前文本输入添加到数据库中。所述当前输入置于空白字段中。执行检查,查看所述固定消息中是否还有其它空白字段。如果还有其它空白字段,则控制返回到语音输入步骤,并重复该过程。否则,结束所述编辑过程。
附图简介
图1是描述根据固定消息创建并发送SMS或MMS消息的流程图。
图2是描述利用语音和/或预先的文本输入编辑固定消息的过程的流程图。
图3是描述使用语音转文本协助功能创建并发送SMS或MMS消息的流程图。
本发明的最佳实施方式
图1是描述根据固定消息创建并发送SMS或MMS消息的流程图。用户(消息编辑者)访问移动电话的消息传送功能105。此操作通常通过导航编程到移动电话中的图形用户界面(GUI)菜单结构来完成。或者,移动电话可以编程为响应语音输入以激活消息传送功能。消息编辑者随后将消息110口述入移动电话的麦克风中,使移动电话屏幕显示最接近所述口述消息的固定消息的列表115。
为此,首先将口述消息转换成文本,并将其与固定文本消息的数据库比较。或者,可以将口述消息与与文本解释相关联的口述“固定”消息的数据库比较。对于任何一种方式,其结果均是接近匹配消息编辑者的口述消息的文本消息的显示列表。
用户随后从列出的固定消息中进行选择120。此消息随后单独显示在可以对其进行编辑的屏幕上125。一旦编辑操作完成,则会提示消息编辑者在该文本消息中添加语音标记或图像130。如果既未将语音标记添加到该消息中,也未将图像添加到该消息中,则将该消息作为SMS消息发送给接收者135(纯文本)。否则,将文本和语音和/或图像结合到MMS消息中,并利用移动电话的MMS功能发送给接收者140。
步骤110(将消息口述输入电话)和115(显示固定消息列表)需要语音转文本处理。该语音转文本处理通过移动电话中的数字信号处理器(DSP)来实现。DSP以可操作方式与移动电话的麦克风、显示屏以及可以是基于文本的、基于声音的或基于二者的固定消息数据库耦合。DSP可以通过将其处理操作限制于与声音或音素相对的单词或短语来加以简化。在包括电力消耗的处理要求方面,这是一个不很稳健的实现方案,但同时是一个大大减轻繁琐程度的系统。但是,也可以实现更复杂的提供更强语音转文本处理能力的DSP。
如上所述,创建并发送SMS或MMS消息的最有效率的折中方案是利用“固定”消息模板作为起点。这些消息需要以具体数据填充空白字段来完成。这些字段可以通过文本输入或语音输入来填充。语音输入使用前述语音转文本处理功能。
图2是描述利用语音和/或预示文本输入来编辑固定消息的图1步骤125处理流程图。因为文本和语音输入的处理过程非常相似,所以下文将根据具体需要参考语音或文本进行描述。此外,编辑固定消息的过程可以是处理文本和/或语音输入的混合操作。
一旦选择了固定消息模板(图1步骤120),则进入文本编辑器。这意味着由移动电话显示固定消息,以便可以对其进行编辑。文本编辑器移动光标到固定消息中的第一空白字段205,并等待语音或文本输入210。将该语音或预示文本输入与输入数据库比较215,220,希望发现匹配项。
如果输入是语音输入,则利用语音转文本处理将语音输入转换成文本,以便与基于文本的数据库比较。或者,可以将该语音输入与基于声音的数据库比较。该数据库中的每个声音(单词或短语)与该单词或短语的文本表示相关联,这样,在发现语音匹配时,可返回响应文本。该数据库还可以包含指向图像的指针。例如,单词“鸟”可以表示文本或可以表示鸟的图像。
如果在数据库中发现精确的匹配项,则判断该匹配项是否指单词(或短语)、图像或二者。如果单词和图像都对应于该数据输入,则提示消息编辑者选择230要将哪一项用于当前消息。当作出选择时,将选择的内容置于235固定消息字段中。执行检查240,以查看当前消息中是否还有其它空白字段。如果是这样,则将控制权返回到步骤205,以便消息编辑者可以提供固定消息下一空白字段的输入。如果当前消息中不再有空白字段,则执行检查以判断消息编辑者是否希望进一步对消息进行编辑245。如果是这样,则消息编辑者通过文本或语音输入来对该消息进行编辑250,然后才结束编辑过程255。如果不再需要进行额外的消息编辑,则结束编辑过程255。
如果执行步骤215,220之后未找到匹配项,则搜索数据库以查找数据库中最接近的匹配项260,并检查该最接近的匹配项是否在容许的限度内265。数据库显示所有容许的匹配项270,并要求消息编辑者选择最接近的匹配项之一275。如果选择了最接近的匹配项之一,则控制权转到步骤235,以所选内容填充空白字段。如果消息编辑者拒绝上述最接近的匹配项,则将输入添加到所述数据库中280。如果该输入是语音输入并且有声音数据库,则将其作为录音添加到声音数据库中,并创建文本关联。语音输入还转换成文本,并添加到文本数据库中。然后将新输入作为文本置于当前空白字段285中,并且控制权转给步骤240以如上所述进行处理。
如果执行步骤265之后没有在容许限度内的匹配项,则执行另一检查,以查看消息编辑者是否要将当前输入添加到所述数据库中290。如果是这样,控制权转给步骤280,在此步骤中提示消息编辑者将新输入添加到所述数据库中,处理如上所述继续。如果消息编辑者不满意当前输入,且他不希望将其输入到数据库中,则控制权返回到步骤210,并接收新的语音或文本输入。
数据库可以单独由用户控制来添加、删除或修改现有输入项。还可以创建指向图像或声音的指针作为数据库输入项。此外,如果消息接收者在移动电话电话簿中且碰巧该电话簿条目带图像标记,则可以在接收者进行语音输入时使该图像弹出。这将提供一种验证移动电话是否正确解释消息编辑者的语音输入项的手段。
如上所述,可以通过词汇表限制为与声音或音素相对照的单词或短语的子集来简化语音转文本功能。实际效果是降低实现语音转文本处理所需的MIP、存储器和功率要求。为此,可以将该语音转文本功能限制于固定消息编辑器应用。这将使数字信号处理器(DSP)搜索表(数据库)缩减到少量的固定短语。还减少了逻辑上符合这些短语的上下文的单词的数量。同样地,减少了关联的图像和声音的数量。这种减少相应使语音转文本算法所需的训练减少。算法训练可以在制造过程期间执行(即在移动电话到达最终用户之前)。该训练要识别由固定消息应用索引的表(数据库)项。这减少了执行该应用所需MIP的数量。此外,仅在固定消息应用处于激活状态时,才需要激活语音转文本算法。这避免了不使用时在后台运行消耗功率的程序。
本发明的另一个实施例是一种不使用“固定”消息模板的实施方案。图3是描述使用语音转文本辅助功能创建并发送SMS或MMS消息的流程图。在此实施例中,创建消息,并将语音标记或图像与该文本消息相结合以形成MMS消息。然后将得到的MMS消息传送给接收者。语音标记可以是文本消息的逐字表示,以便让接收者选择是阅读还是收听消息。或者,该语音标记可以是伴随文本消息的个性化消息。
将语音标记或图像添加到消息中的选项大大提高了消息传送实用性。例如,标准的文本消息可以附上告知接收者收听并给予回复的语音标记。个性化消息的实例是具有文本成分和语音成分的MMS消息,其中语音标记可以说“约翰,阅读此消息,然后打电话给我讨论”。或者,语音标记可以包含具有询问“约翰,你喜欢这首新歌吗?”的文本成分的内容(例如MP3片段)。同样地,图像可以在MMS消息中要求给予回应的文本成分一起发送,这样的文本成分如“约翰,你觉得这幅图如何?”。
此过程也可通过访问移动电话的消息传送功能来开始305。利用小键盘文本输入或语音转文本的语音输入来创建文本消息310。如果选择语音输入方法,则记录消息编辑者的语音并将其转换成文本。
如果消息编辑者只希望创建文本消息的逐字副本,则将文本消息和语音记录组合成MMS消息315。然后将该MMS消息传送给接收者320。
如果消息编辑者希望对文本消息进行个性化处理,则他口述并记录有关该文本消息的注释325。将该文本消息与个性化语音记录组合成MMS消息330并发送给接收者335。
本说明书公开了本发明的一些特定实施例。本领域的技术人员容易认识到,本发明可以应用于其它环境中。实际上,许多实施例和实施方案均是可行的。所附权利要求根本不用于将本发明范围局限于上述特定实施例。此外,“用于…的装置”的任何表述用于唤起对元素和权利要求作装置加功能的理解,而未明确使用表述“用于…的装置”的任何元素不应理解为装置加功能,即使该权利要求以其它方式包括了单词“装置”。

Claims (15)

1.一种在移动电话上创建消息的方法,所述移动电话包括响应语音和文本输入进行消息传送的功能,所述方法包括如下步骤:
访问所述消息传送功能(305);
利用语音输入口述消息(310);
将所述口述消息转换成文本消息(310);
记录上下文与所述文本消息相关的第二口述消息(325);以及
将所述文本消息与所述第二口述消息组合成MMS消息(330)。
2.一种在移动电话上创建消息的方法,所述移动电话包括响应语音和文本输入进行消息传送的功能,所述方法包括如下步骤:
访问所述消息传送功能(105);
利用语音输入输入部分消息(110);
显示接近匹配所述输入的文本消息的列表(115),其中所述文本消息包含至少一个空白字段;
选择所述显示的文本消息之一(120);以及
编辑所述选择的文本消息(125)。
3.如权利要求2的方法,其特征在于还包括:可选地向所述编辑的文本消息添加语音标记(130)以及将所述语音标记与所述编辑的文本消息组合,以形成MMS消息(135)。
4.如权利要求2的方法,其特征在于还包括:可选地向所述编辑的文本消息添加图像(130)以及将所述图像与所述编辑的文本消息组合,以形成MMS消息(135)。
5.如权利要求2的方法,其特征在于编辑所述选择的文本消息的步骤包括:
(a)显示所述选择的文本消息(205);
(b)为所述选择的文本消息中的空白字段接收语音输入(210);
(c)将所述语音输入转换成文本输入;
(d)查找所述转换的语音输入与文本数据库之间的匹配项(215);
如果存在匹配项(220),则
(e)判断所述匹配项是否对应于单词、图像或二者(225);
如果只对应于单词或只对应于图像,则
(f)以所述单词或图像填充所述空白字段(235);
如果对应于二者,则
(g)选择所述单词或所述图像(230),并以所选内容填充所述空白字段;
(h)检查是否还有其它空白字段(240);
如果还有其它空白字段,则
(i)返回到步骤(b),否则结束所述编辑过程(255);
如果不存在匹配项,则
(j)查找所述数据库中最接近的匹配项(260);
(k)提示是否要使用该最接近的匹配项(275);
如果使用最接近的匹配项,则
(l)以所述最接近的匹配项填充所述空白字段(235);
(m)检查是否还有其它空白字段(240)以及如果还有其它空白字段,则返回到步骤(b),否则结束所述编辑过程(255);
如果不使用所述最接近的匹配项,则
(o)提示将当前文本输入添加到数据库中(280);
(p)以所述当前文本输入填充所述空白字段(285);
(q)检查是否还有其它空白字段(240)以及如果还有其它空白字段,则返回到步骤(b),否则结束所述编辑过程(255)。
6.如权利要求5的方法,其特征在于还包括:检查是否所述找到的最接近的匹配项是否对应于容许限度内的文本输入(265)。
7.如权利要求6的方法,其特征在于:如果所述找到的最接近的匹配项不对应于容许限度内的所述文本输入,则提示将当前文本输入添加到所述数据库中(290)。
8.如权利要求5的方法,其特征在于还包括:在所有空白字段都填充完时,进一步编辑所述消息(245、250)。
9.一种在移动电话上创建消息的系统,所述移动电话包括响应语音和文本输入进行消息传送的功能,所述系统包括:
用于访问所述消息传送功能的装置(105);
用于利用语音输入输入部分消息的装置(110);
用于显示接近匹配所述输入的文本消息的列表的装置,其中所述文本消息包含至少一个空白字段(115);
用于选择所述显示的文本消息之一的装置(120);以及
用于编辑所述选择的文本消息的装置(125)。
10.如权利要求9所述的系统,其特征在于还包括:用于向所述编辑的文本消息添加语音标记(130)的装置以及用于将所述语音标记与所述编辑的文本消息组合,以形成MMS消息(135)的装置。
11.如权利要求9所述的系统,其特征在于还包括:用于向所述编辑的文本消息添加图像(130)的装置以及用于将所述图像与所述编辑的文本消息组合,以形成MMS消息(135)的装置。
12.如权利要求9所述的系统,其特征在于:用于编辑所述选择的文本消息的所述装置包括:
用于显示所选文本消息的装置(205);
用于为所述选择的文本消息中的空白字段接收语音输入(210)的装置;
用于将所述语音输入转换成文本输入的装置;
用于查找所述转换的语音输入与文本数据库之间的匹配项(215)的装置;
用于判断所述匹配项是否对应于所述数据库中的单词、图像或二者(225)的装置;
用于从所述数据库中选择单词或图像(230)的装置;
用于以单词或图像填充所述空白字段(235)的装置;
用于查找所述数据库中与所述语音到文本转换输入最接近的匹配项(260)的装置;
用于提示用户是否要使用该最接近的匹配项(275)的装置;
用于以所述最接近的匹配项填充所述空白字段(235)的装置;
用于将所述语音到文本转换输入添加到所述数据库中(280)的装置;
用于以所述语音到文本转换输入填充所述空白字段(285)的装置;
用于检查所选文本中是否还有其它空白字段(240)的装置;
用于将控制返回给所述为所述选择的文本消息中的空白字段接收语音输入的装置;以及
用于结束所述编辑过程(255)的装置。
13.如权利要求12所述的系统,其特征在于还包括:用于检查所述找到的最接近的匹配项是否对应于容许限度内的文本输入(265)的装置。
14.如权利要求13所述的系统,其特征在于还包括:用于在所述找到的最接近的匹配项不对应于容许限度内的所述文本输入时,提示将当前文本输入添加到所述数据库中(290)的装置。
15.如权利要求12所述的系统,其特征在于还包括:用于在填充完所有空白字段时,进一步编辑所述消息(245、250)的装置。
CNB2004800023281A 2003-03-06 2004-01-05 利用语音转文本辅助的多媒体和文本消息传送 Expired - Fee Related CN100409700C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/248,982 US20040176114A1 (en) 2003-03-06 2003-03-06 Multimedia and text messaging with speech-to-text assistance
US10/248,982 2003-03-06

Publications (2)

Publication Number Publication Date
CN1739309A true CN1739309A (zh) 2006-02-22
CN100409700C CN100409700C (zh) 2008-08-06

Family

ID=32926020

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004800023281A Expired - Fee Related CN100409700C (zh) 2003-03-06 2004-01-05 利用语音转文本辅助的多媒体和文本消息传送

Country Status (6)

Country Link
US (1) US20040176114A1 (zh)
EP (1) EP1600018B1 (zh)
JP (1) JP4651613B2 (zh)
CN (1) CN100409700C (zh)
DE (1) DE602004012071T2 (zh)
WO (1) WO2004080095A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102377869A (zh) * 2010-08-23 2012-03-14 联想(北京)有限公司 一种移动终端及通信方法
CN103109521A (zh) * 2010-09-21 2013-05-15 索尼爱立信移动通讯有限公司 增强消息的系统和方法
CN103369477A (zh) * 2013-07-02 2013-10-23 华为技术有限公司 显示媒体信息方法、装置、客户端,图形控件显示方法和装置
CN103546623A (zh) * 2012-07-12 2014-01-29 百度在线网络技术(北京)有限公司 用于发送语音信息及其文本描述信息的方法、装置与设备

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB0213021D0 (en) * 2002-06-07 2002-07-17 Hewlett Packard Co Telephone communication with silent response feature
FI113995B (fi) * 2002-12-11 2004-07-15 Nokia Corp Menetelmä ja laitteisto parannellun ääniviestin toteuttamiseksi
US8229086B2 (en) * 2003-04-01 2012-07-24 Silent Communication Ltd Apparatus, system and method for providing silently selectable audible communication
US7277951B2 (en) 2003-04-22 2007-10-02 Voice Genesis, Inc. Omnimodal messaging system
US8161116B2 (en) * 2003-05-23 2012-04-17 Kirusa, Inc. Method and system for communicating a data file over a network
US20050149327A1 (en) * 2003-09-11 2005-07-07 Voice Signal Technologies, Inc. Text messaging via phrase recognition
US20050137878A1 (en) * 2003-09-11 2005-06-23 Voice Signal Technologies, Inc. Automatic voice addressing and messaging methods and apparatus
US20050154587A1 (en) * 2003-09-11 2005-07-14 Voice Signal Technologies, Inc. Voice enabled phone book interface for speaker dependent name recognition and phone number categorization
EP1517495A1 (en) * 2003-09-18 2005-03-23 Hewlett-Packard Development Company, L.P. Email delivery in telecommunications networks
GB0322516D0 (en) * 2003-09-25 2003-10-29 Canon Europa Nv Cellular mobile communication device
GB2433002A (en) * 2003-09-25 2007-06-06 Canon Europa Nv Processing of Text Data involving an Ambiguous Keyboard and Method thereof.
US20050266829A1 (en) * 2004-04-16 2005-12-01 Lg Elcectronics, Inc. Speech-to-text messaging system and method
US20070054678A1 (en) * 2004-04-22 2007-03-08 Spinvox Limited Method of generating a sms or mms text message for receipt by a wireless information device
DE602005013760D1 (de) * 2004-05-03 2009-05-20 Research In Motion Ltd System und verfahren zur interrupt-steuerung auf einer in der hand gehaltenen einrichtung
US7583974B2 (en) * 2004-05-27 2009-09-01 Alcatel-Lucent Usa Inc. SMS messaging with speech-to-text and text-to-speech conversion
KR100605959B1 (ko) * 2004-06-21 2006-08-02 삼성전자주식회사 음성을 이용한 번호입력방법
US7551751B2 (en) * 2004-08-30 2009-06-23 Pitney Bowes Inc. Watermarking images with wavepackets encoded by intensity and/or phase variations
JP4527493B2 (ja) * 2004-10-20 2010-08-18 ソフトバンクモバイル株式会社 移動体通信端末
US8374846B2 (en) 2005-05-18 2013-02-12 Neuer Wall Treuhand Gmbh Text input device and method
US8117540B2 (en) 2005-05-18 2012-02-14 Neuer Wall Treuhand Gmbh Method and device incorporating improved text input mechanism
US8036878B2 (en) 2005-05-18 2011-10-11 Never Wall Treuhand GmbH Device incorporating improved text input mechanism
US9606634B2 (en) * 2005-05-18 2017-03-28 Nokia Technologies Oy Device incorporating improved text input mechanism
CN1901041B (zh) * 2005-07-22 2011-08-31 康佳集团股份有限公司 语音字典形成方法、语音识别系统及其方法
US8275399B2 (en) 2005-09-21 2012-09-25 Buckyball Mobile Inc. Dynamic context-data tag cloud
US9042921B2 (en) * 2005-09-21 2015-05-26 Buckyball Mobile Inc. Association of context data with a voice-message component
US8077838B2 (en) * 2005-09-28 2011-12-13 Cisco Technology, Inc. Method and voice communicator to provide a voice communication
US20070100619A1 (en) * 2005-11-02 2007-05-03 Nokia Corporation Key usage and text marking in the context of a combined predictive text and speech recognition system
WO2007135475A1 (en) * 2006-05-24 2007-11-29 Al Hallami, Omran Voice transmission application via short message service (sms), multimedia messaging service (mms) and/or general packet radio service (gprs)
US20080004056A1 (en) * 2006-06-01 2008-01-03 Paul Suzman Methods and systems for incorporating a voice-attached, tagged rich media package from a wireless camera-equipped handheld mobile device into a collaborative workflow
US20080016158A1 (en) * 2006-07-13 2008-01-17 Comverse Ltd. Method for appending a signature to a size limited text message
US20080282154A1 (en) * 2006-09-11 2008-11-13 Nurmi Mikko A Method and apparatus for improved text input
GB2443461A (en) * 2006-11-02 2008-05-07 George Rath Mobile phone
TW200822676A (en) * 2006-11-08 2008-05-16 Benq Corp Method and communication device for transmitting message
US7742774B2 (en) * 2007-01-11 2010-06-22 Virgin Mobile Usa, L.P. Location-based text messaging
US8494490B2 (en) 2009-05-11 2013-07-23 Silent Communicatin Ltd. Method, circuit, system and application for providing messaging services
US8229409B2 (en) 2007-02-22 2012-07-24 Silent Communication Ltd. System and method for telephone communication
JP2008270914A (ja) * 2007-04-16 2008-11-06 Ntt Docomo Inc 制御装置、移動通信システム及び通信端末
TWI360109B (en) * 2008-02-05 2012-03-11 Htc Corp Method for setting voice tag
EP2133772B1 (en) * 2008-06-11 2011-03-09 ExB Asset Management GmbH Device and method incorporating an improved text input mechanism
US8145484B2 (en) * 2008-11-11 2012-03-27 Microsoft Corporation Speech processing with predictive language modeling
US9292565B2 (en) * 2010-06-30 2016-03-22 International Business Machines Corporation Template-based recognition of food product information
CN103150645A (zh) * 2013-02-26 2013-06-12 深圳市中兴移动通信有限公司 录音方式添加日志的方法和装置
CN104375997A (zh) * 2013-08-13 2015-02-25 腾讯科技(深圳)有限公司 一种为即时通讯音频信息添加备注信息的方法和装置
US20150172285A1 (en) * 2013-12-17 2015-06-18 Mei Ling LO Method for Accessing E-Mail System
US9854439B2 (en) 2014-02-07 2017-12-26 First Principles, Inc. Device and method for authenticating a user of a voice user interface and selectively managing incoming communications
US9860200B1 (en) 2014-08-27 2018-01-02 Google Llc Message suggestions
US9449442B2 (en) * 2014-10-23 2016-09-20 Vivint, Inc. Interface of an automation system
US9978370B2 (en) * 2015-07-31 2018-05-22 Lenovo (Singapore) Pte. Ltd. Insertion of characters in speech recognition
CN105869654B (zh) 2016-03-29 2020-12-04 阿里巴巴集团控股有限公司 音频消息的处理方法及装置
US10922668B2 (en) * 2016-09-23 2021-02-16 Ncr Corporation Point-of-sale (POS) bot
EP3970057A1 (en) 2019-10-15 2022-03-23 Google LLC Voice-controlled entry of content into graphical user interfaces

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0476759A (ja) * 1990-07-18 1992-03-11 Brother Ind Ltd スペルチェック機能付き文書処理装置
JPH09185615A (ja) * 1995-12-27 1997-07-15 Toshiba Corp かな漢字変換方法
JP2000148748A (ja) * 1998-11-13 2000-05-30 Nec Corp 仮名漢字変換及び画像検索表示システム
US6865191B1 (en) * 1999-08-12 2005-03-08 Telefonaktiebolaget Lm Ericsson (Publ) System and method for sending multimedia attachments to text messages in radiocommunication systems
DE19959903A1 (de) * 1999-12-07 2001-06-13 Bruno Jentner Modul zur Unterstützung der Text-Mitteilungs-Kommunikation in Mobilfunknetzen
DE10004260A1 (de) * 2000-02-02 2001-08-09 Bosch Gmbh Robert Verfahren zum Übertragen von Nachrichten in einem Telekommunikationsnetzwerk
JP3789274B2 (ja) * 2000-02-09 2006-06-21 株式会社ケンウッド 移動体通信端末
JP4423522B2 (ja) * 2000-06-26 2010-03-03 ソニー株式会社 ハンズフリーヘッドセット
JP2002101178A (ja) * 2000-09-21 2002-04-05 Sony Corp 携帯通信端末および画面表示方法
EP1350377A4 (en) * 2000-12-14 2005-01-12 Xcitel Ltd METHOD AND SYSTEM FOR PROCESSING MULTIPLE-PART MESSAGES BY CELLULAR TELEPHONE USERS
WO2002058359A1 (de) * 2001-01-18 2002-07-25 Siemens Aktiengesellschaft Verfahren und mobiltelekommunikationsgerät zur datenübertragung in einem mobilfunknetz
WO2002077975A1 (en) * 2001-03-27 2002-10-03 Koninklijke Philips Electronics N.V. Method to select and send text messages with a mobile
US6990180B2 (en) * 2001-04-05 2006-01-24 Nokia Mobile Phones Limited Short voice message (SVM) service method, apparatus and system
DE10235548B4 (de) * 2002-03-25 2012-06-28 Agere Systems Guardian Corp. Verfahren und Vorrichtung für die Prädiktion einer Textnachrichteneingabe
US20040176139A1 (en) * 2003-02-19 2004-09-09 Motorola, Inc. Method and wireless communication device using voice recognition for entering text characters
US7159191B2 (en) * 2003-03-03 2007-01-02 Flextronics Sales & Marketing A-P Ltd. Input of data

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102377869A (zh) * 2010-08-23 2012-03-14 联想(北京)有限公司 一种移动终端及通信方法
CN103109521A (zh) * 2010-09-21 2013-05-15 索尼爱立信移动通讯有限公司 增强消息的系统和方法
CN103109521B (zh) * 2010-09-21 2015-05-06 索尼爱立信移动通讯有限公司 增强消息的系统和方法
CN103546623A (zh) * 2012-07-12 2014-01-29 百度在线网络技术(北京)有限公司 用于发送语音信息及其文本描述信息的方法、装置与设备
CN103369477A (zh) * 2013-07-02 2013-10-23 华为技术有限公司 显示媒体信息方法、装置、客户端,图形控件显示方法和装置
CN103369477B (zh) * 2013-07-02 2016-12-07 华为技术有限公司 显示媒体信息方法、装置、客户端,图形控件显示方法和装置
US10637806B2 (en) 2013-07-02 2020-04-28 Huawei Technologies Co., Ltd. User interface for a chatting application displaying a visual representation of a voice message with feature information indicating a mood
US10880244B2 (en) 2013-07-02 2020-12-29 Huawei Technologies Co., Ltd. Method, apparatus, and client for displaying media information, and method and apparatus for displaying graphical controls
US11700217B2 (en) 2013-07-02 2023-07-11 Huawei Technologies Co., Ltd. Displaying media information and graphical controls for a chat application

Also Published As

Publication number Publication date
CN100409700C (zh) 2008-08-06
JP2006523988A (ja) 2006-10-19
US20040176114A1 (en) 2004-09-09
JP4651613B2 (ja) 2011-03-16
EP1600018B1 (en) 2008-02-27
EP1600018A1 (en) 2005-11-30
WO2004080095A1 (en) 2004-09-16
DE602004012071D1 (en) 2008-04-10
DE602004012071T2 (de) 2008-06-12

Similar Documents

Publication Publication Date Title
CN100409700C (zh) 利用语音转文本辅助的多媒体和文本消息传送
US7500193B2 (en) Method and apparatus for annotating a line-based document
US8977555B2 (en) Identification of utterance subjects
US7870142B2 (en) Text to grammar enhancements for media files
US9812120B2 (en) Speech synthesis apparatus, speech synthesis method, speech synthesis program, portable information terminal, and speech synthesis system
US20020072915A1 (en) Hyperspeech system and method
WO2009051613A1 (en) Methods of searching using captured portions of digital audio content and additional information separate therefrom and related systems and computer program products
US20080208574A1 (en) Name synthesis
JP5094120B2 (ja) 音声認識装置及び音声認識方法
US20080059170A1 (en) System and method for searching based on audio search criteria
WO2008115285A2 (en) Content selection using speech recognition
US20140358903A1 (en) Search-Based Dynamic Voice Activation
JP2013088477A (ja) 音声認識システム
WO1999036905A1 (fr) Appareils de distribution, emission et reception d'informations, et procede de distribution d'informations
JP2005524119A (ja) テキストスピーチシステムにて使用する強化音声データを含むテキストデータのコード化方法、デコード化方法、ttsシステムを含む携帯電話
US20090055167A1 (en) Method for translation service using the cellular phone
KR100380829B1 (ko) 에이전트를 이용한 대화 방식 인터페이스 운영 시스템 및방법과 그 프로그램 소스를 기록한 기록 매체
Agarwal et al. Voice Browsing the Web for Information Access
US20080133240A1 (en) Spoken dialog system, terminal device, speech information management device and recording medium with program recorded thereon
JP2008108076A (ja) 音声メッセージ出力装置
JP2004287756A (ja) 電子メール作成装置及び電子メール作成方法
JPH11272712A (ja) データベース構築支援装置
KR100837542B1 (ko) 정보 통신망을 이용한 음악 콘텐츠 제공 방법 및 그 시스템
TW591486B (en) PDA with dictionary search and repeated voice reading function
CN116343743A (zh) 一种基于xtts的语音合成方法及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080806

Termination date: 20180105