业绩考核

OA系统

首页 >> 学生工作 >> 学生活动 >> 正文

武大电信学子勇夺2026年IEEE信号处理杯冠军

2026-05-12
  • 阅读:900

在刚刚落幕的第51届IEEE声学、语音与信号处理国际会议(ICASSP 2026)上传来喜讯:由我院黄公平教授指导,2023级4名本科生汤志翔、田衍欣、刘耕佑、邓咏怡和研究生朱瑜杰(学生导师)组成的“SuperZooooom”队,在2026年IEEE信号处理杯(Signal Processing Cup,简称SP Cup)决赛中凭借优秀的技术方案与稳定的现场发挥,从全球多支顶尖队伍中脱颖而出,荣获赛事冠军(Grand Prize

1778551862969062384.png

IEEE SP Cup由IEEE信号处理学会主办,是面向全球本科生的最高级别信号处理学科竞赛之一,也是信号处理领域最具含金量和声望的本科生赛事。SP Cup每年吸引全球约100支队伍报名,经过两个阶段的选拔,仅有三支队伍晋级决赛。历届参赛队伍覆盖悉尼大学、新南威尔士大学、加利福尼亚大学圣迭戈分校、首尔大学、以色列理工学院等全球顶尖高校,竞争激烈。本届竞赛以智能手机实时音视频变焦(Real-Time Audio-Visual Zooming on Smartphones)为主题,要求参赛团队设计一套可在移动端上实现视频画面与音频同步聚焦的系统,极具理论难度与工程挑战性。决赛于2026年5月4日至8日在ICASSP 2026大会期间举行,来自多个国家的入围队伍同台答辩。最终,我院“SuperZooooom”团队两阶段语音增强和变焦融合算法与高效硬件部署方案,赢得评审团一致认可,获得赛事第一名

1778551891800005774.png

指导教师黄公平教授介绍,该团队自2025年底起开始备赛,依托学院智能声学与语音处理实验室,完成了从算法设计到手机端实时推理的全链条开发。算法采用两阶段语音增强策略:第一阶段将空间信息融入神经网络,精准提取目标声源并抑制环境干扰;第二阶段则借助预训练的高效增强网络,修复残留噪声与伪影,全面提升音频质量。最终,根据视频的焦段调整缩放系数,将增强音频和环境声进行加权融合,实现音视频同步变焦效果。

我院智能声学与语音处理实验室长期致力于通过人工智能和声学技术的创新,推动语音交互和声学感知的智能化发展,赋能新一代通信和智能交互应用在本次ICASSP 2026上共有七篇高水平论文被正式录用并现场展示,涵盖麦克风阵列、语音增强、音效生成和音乐感知评估方向的最新进展。ICASSP语音、音频与信号处理领域最具影响力的国际顶级会议,这一成果充分彰显了我院在该领域的持续创新活力与国际影响力。

1778552014051085226.png

同时,实验室还在ICASSP 2026的多个Signal Processing Grand Challenge中表现抢眼,取得一系列佳绩:其中在RASE Challenge(雷达语音增强) 荣获冠军,在Predicting Lyric Intelligibility Challenge(预测歌词清晰度) 荣获第三名,在Music Source Restoration Challenge(音乐源修复) 荣获第三名,在x-to-audio alignment Challenge(文本音效对齐) 荣获第四名值得一提的是,在多项挑战赛中担当主力的是学院本科生,充分展现了我院学子扎实的专业功底、出色的工程实践能力与良好的团队协作精神。

1778551976777012349.png

此次我院团队夺冠,不仅提升了武汉大学在国际信号处理领域的影响力,也为后续本科生参与高水平学科竞赛积累了宝贵经验,充分彰显了我院在“科教融合、以赛促学”方面的突出优势。后续将继续深入推进本科生科研训练计划,鼓励更多学子勇攀科研高峰,在更为广阔的国际舞台上展现武大电信人的风采。

(通讯员:汤志翔、田衍欣、刘耕佑;照片提供:邓咏仪;审核:黄公平,王睿卿)

学院地址: 湖北省武汉市武昌区八一路299号 (430072)

Address:No.299 Bayi Road,Wuhan,Hubei(P.R.C.:430072)

联系电话 (Tel) :(+86)27-68756275/68778537

传真 (Fax) :(+86)27-68778537

网址 (Http) : Http://eis.whu.edu.cn

联系邮箱 (Email) : eisyb@whu.edu.cn

武汉大学电子信息学院

官方微信公众号


© Copyright 2023 武汉大学电子信息学院 版权所有