报告时间:2025年01月18日(周六)上午11:00
报告地点:武汉大学电子信息学院(信息学部西区综合楼)501会议室
报告题目:语音处理与生成统一模型研究进展
报 告 人:武执政 博士
邀 请 人:黄公平 教授
报告摘要:
随着语音生成技术的广泛应用,人机交互、AIGC等系统与产品对生成语音的表现力、安全可信等方面的要求也越来越苛刻。众所周知,语音信号包含语言和副语言信息。因此,要生成表现力强且安全可信的语音,需联合理解和精准建模语言和副语言信息,但这方面的研究尚属起步阶段。该报告将分享目将具有零样本学习能力、表现力强、安全可信的语音生成大模型相关的研究进展。
报告人简介:
武执政,香港中文大学(深圳)副教授、博导,国家级青年人才,连续多次入选斯坦福大学“全球前2%顶尖科学家。于南洋理工大学博士学位,曾在Meta(原Facebook)、苹果、爱丁堡大学、微软亚洲研究院等机构从事学术研究和技术领导工作。发起Merlin与Amphion开源系统、开源数据集Emilia,被超过300家单位采用并多次占据GitHub趋势榜榜首;组织语音伪造检测、语音合成、语音转换等国际评测,多次获最佳论文。担任IEEE/ACM TASLP、SPL等期刊编委、SLT2024大会主席。
欢迎感兴趣的老师和同学们积极参与!
学院地址: 湖北省武汉市武昌区八一路299号 (430072)
Address:No.299 Bayi Road,Wuhan,Hubei(P.R.C.:430072)
联系电话 (Tel) :(+86)27-68756275/68778537
传真 (Fax) :(+86)27-68778537
网址 (Http) : Http://eis.whu.edu.cn
联系邮箱 (Email) : eisyb@whu.edu.cn
武汉大学电子信息学院
官方微信公众号