在刚刚结束的“Blizzard Challenge 2014”国际语音合成大赛上,科大讯飞通过承建的语音及语言信息处理国家工程实验室报送的参赛系统在25项测试指标中的11项位列第一,取得了综合排名第一的好成绩。这是科大讯飞自2006年首次参赛即夺冠以来,第九次蝉联该项赛事桂冠,持续巩固了讯飞智能语音技术的全球领先地位。
Blizzard Challenge是由美国和日本联合发起的国际上规模最大、最具影响力的语音合成大赛,历届大赛吸引了美国卡耐基-梅隆大学、英国爱丁堡大学、日本名古屋工业大学、IBM研究院、微软亚洲研究院等语音技术领域的世界一流研究机构与企业参加。
与历届相比,本次大赛首次将主要测试语种由英语转换到非英语语种,要求提交的语音合成系统包括印地语、阿萨姆语等六种印度语种,并增加了这些语种与英文混读情况下的合成测试,进一步增加比赛的难度。在评测过程中,组织方选择了5个语种基于统一测试平台进行主观测听,每个语种的测试指标包括相似度、自然度、可懂度、英文混读相似度和英文混读可懂度共5项指标。
在不到两个月的时间内,研究团队克服了时间紧、语种多、小语种资源受限等困难,充分发挥了科大讯飞的核心技术优势,采用基于统计声学模型的单元挑选与参数合成技术方案,并研发了基于深度神经网络的语音合成新方法,高质量完成了所有语种语音合成系统的构建。最终提交的参赛系统获得了印地语合成语音相似度与可懂度、印地语英语混读合成语音相似度与自然度等共计11个指标的第一名。
一直以来,科大讯飞的语音合成技术代表着世界最高水平,不仅中文语音合成技术超过了普通人说话水平,而且在英语等多语种语音合成上牢牢树立了国际领先地位。未来科大讯飞将积极开展人机对话、小说合成等热点领域的研究,着力提升语音合成的表现力和真实感,通过多语种语音处理、个性化、定制化等技术,进一步扩大应用范围,不断提升核心效果。
此次荣获国际语音合成大赛九连冠,进一步扩大了科大讯飞在多语种语音合成等关键技术领域的国际领先优势,对推动智能语音技术在社会各领域的深入应用、赢取国际竞争、开拓国际市场等方面具有重大而深远的战略意义。
(语音及语言信息处理国家工程实验室是由国家发改委于2011年批复成立,由科大讯飞和中国科学技术大学联合共建,是我国智能语音领域唯一的国家级研究平台。)