腾讯会议旗下天籁实验室参加由国际音频顶级会议ICASSP联合微软发起的 2023 语音信号质量增强挑战赛(SSIC),并荣获SSIC全部两个赛道的冠军,并在降噪、混响、卡顿、响度、音质修复等多个子项均达到了领先水平!
图示:比赛成绩
去年,天籁实验室在ICASSP DNS 2022 全频带实时个性化语音增强track 2比赛已获得总分第一。
ICASSP 2023 语音信号质量增强挑战赛(SSIC)主要面向如何在实时通信系统中提升语音的信号质量,除了噪声消除之外,还包括多种复杂声学条件下的混响、丢包、设备采集、前处理损伤失真等业界难题,整个比赛分为两个赛道,分别为实时和非实时处理,以ITU-T P.835和P.863.2标准衡量语音信号质量,涉及整个通信链路处理,高度还原实时音频通讯(RTC)中的真实挑战,吸引了全球学术界众多高校以及工业界团队的注意力,比赛难度创历史之最。
本次蝉联冠军,是天籁实验室在语音和音频方向多年研究能力的沉淀,也是团队服务腾讯会议3亿+用户的实力体现。
随着混合式办公的普及,实时音视频通信(RTC)中的质量问题受到越来越多的关注。比如在嘈杂的机场、工位或咖啡厅里进行线上会议,提升通信质量对于提高沟通效率、快速会聚共识非常重要。
经典的音频处理通常关注噪声与混响处理,由于通信场景的复杂性,挑战非常大,天籁实验室基于深度学习和AI算法,开拓性综合了前处理与后处理,为用户打造“听得清、听得真”的极致音频体验。
在成功消除300多种环境噪声基础上,天籁实验室首创性推出的基于声纹的个性化语音增强技术,进一步消除周围人声的干扰,凸显主讲人的声音信号。现在,该技术已成功应用在腾讯会议上。
在语音编解码方面,由腾讯会议天籁实验室与腾讯AI Lab联合研发的Penguins是腾讯首个自主知识产权的音频编解码解决方案。Penguins低码率高清语音编解码器,有效解决因弱网引起的延时、卡顿、听不清等问题,可将编码效率提升300%,实现6-10kps下高质量语音通话,覆盖宽带和超宽带语音业务。当前该技术已应用于腾讯会议驾驶模式中。
天籁实验室的研究成果也获得了众多权威认可,凭借在实时音频通信技术方面的前瞻性探索与丰富的应用实践,连续两年获得中国国际大数据产业博览会的“领先科技成果”奖。
未来,天籁实验室也会将SSIC比赛中的前沿技术和最新成果,应用到腾讯会议后续的音频质量提升中,进一步改善用户体验,打造“听得清、听得真”的极致体验。