英语听力:微软展示即时语音翻译系统最新成果
"http://you.video.sina.com.cn/api/sinawebApi/outplayrefer.php/vid=89684689_2_O0mzRiJrB2SP+Eh0HTWxve0D+PcXuvDoj2u9u1utJw1PE1XaapSQZNUD5iHfFqwbrz0xHcZkeP8wkkR5Zag/s.swf2012年10月25日,由微软研究院主办的“21世纪的计算学术研讨会”在天津举行。微软首席研究官瑞克·拉希德(Rick Rashid)博士在会上展示了语音机器翻译实时演示(Speech to Speech Translation),瑞克博士一边讲述英文,系统就将英文立即翻译成中文。
这是目前微软研究院所即时语音翻译系统的最新研究成果,这一系统不仅可以达到即时语音识别、双语翻译,更牛的是可以做到即时发音,效果已经接近同声传译。
在演示中,微软研究院主席瑞克·拉希德解释了其工作原理和语音识别领域取得的进步,并向在场的记者做了即时英译汉口译演示。在演示过程中,发言人的英语单词几乎全部被识别(识别率从整个视频来看维持在80%-90%之间),随后开始做即使英译汉演示,最后做汉语译文发音演示。
更奇妙的是,微软研究院的这一系统还可以模拟发言人的口音,在经过大约1个小时的机器磨合之后,就可以完成这一功能。所以说,如果是英国人来使用,那么系统的汉语发音将带有伦敦腔。
早期的研究工作抛弃了传统的语音翻译系统模式,转而支持统计型模型,使得机器在捕捉人类声乐能力上具有更好地表现。随着计算机技术的改进,进一步提高了软件对语音数据的识别处理能力,但错误率仍然处于20%至25%之间。
大约两年前,微软研究院的研究人员和多伦多大学的研究者共同完成了这一创举。利用一种称为‘深层神经网络’的技术,模拟人脑行为,通过训练可以提高系统识别能力,语音识别效果比上一代产品更好。通过对比之前的产品,新一代产品的单词识别错误率下降了30%,也就是说以前的语音识别系统中,没识别4-5个单词就有一个错误的单词,现在可以降低到每7、8个单词才出现一个错误(大大提高了机器翻译的质量)。
许多不同的技术公司,如AT&T公司、谷歌(微博)公司都有相似的同声翻译软件开发项目。日本电报电话公司的NTT DoCoMo手机公司此前展示了一个智能手机应用系统,方便日本语使用者与外国人进行交谈,使之能利用自己的母语无障碍地交流。
近几十年来,因为机器翻译译文质量的问题,机器翻译一直不入流,不太受人重视。但是我们需要看到,在2005年,中国的翻译市场就有200亿人民币,但是各类翻译人员和翻译工资只能消化10%的市场,缺口巨大。另外,欧盟每年花在翻译20多种文件上的翻译支出就占到了整个欧盟行政支出的一半以上。有了高质量的机器翻译,不仅可以弥补翻译人手不够的问题,还可以创造更多商业机会。
页:
[1]