业绩考核

OA系统

首页 >> 学术动态 >> 学术讲座 >> 正文

学术讲座公告--语音分离及其泛化

2025-04-18
  • 阅读:530


报告时间:2025年4月27日(周日)上午9:00

报告地点:武汉大学电子信息学院(于刚·宋晓楼)B621会议室

报告题目:语音分离及其泛化

报告人:王中秋 副教授

邀请人:黄公平 教授

 

报告摘要:

让计算机听清人类语音在人工智能和人机语音交互等领域具有重大需求。在日常包含多个声源的嘈杂环境中,麦克风记录的通常是一个混合信号,它不仅包含目标说话人的语音,也会包含干扰信号,比如环境噪音、混响和人声干扰。这些干扰信号会严重降低语音交互的质量、语音识别的性能、和听力损失患者对目标声源的感知能力。围绕如何从混合信号中精确分离出目标语音这一问题,本报告将介绍报告人在基于深度学习的语音分离技术上的研究进展,涵盖有监督、无监督、弱监督、半监督语音分离,单通道、多通道语音分离,目标说话人抽取,及如何提升它们在实录数据上的泛化能力。

 

报告人简介:

16.jpg

王中秋,博士,国家级青年人才,现任南方科技大学计算机科学与工程系副教授,曾在美国三菱电机研究院任访问研究员、在卡内基梅隆大学语言技术研究所任博士后研究员。王博士的研究课题集中于人工智能和计算听觉中对于声学信号的感知、理解与生成,迄今已在人工智能、语音及音频信号处理领域发表顶级期刊和会议论文60余篇,曾获信号处理旗舰会议ICASSP 2018最佳学生论文奖。详见https://zqwang7.github.io/

 

欢迎感兴趣的老师和同学们积极参与!


学院地址: 湖北省武汉市武昌区八一路299号 (430072)

Address:No.299 Bayi Road,Wuhan,Hubei(P.R.C.:430072)

联系电话 (Tel) :(+86)27-68756275/68778537

传真 (Fax) :(+86)27-68778537

网址 (Http) : Http://eis.whu.edu.cn

联系邮箱 (Email) : eisyb@whu.edu.cn

武汉大学电子信息学院

官方微信公众号


© Copyright 2023 武汉大学电子信息学院 版权所有