武汉大学电子信息学院

首页 >> 学术动态 >> 学术讲座 >> 正文

学术讲座公告---语音生成大模型研究进展

2025-01-16

阅读：175

报告时间：2025年01月18日（周六）上午11：00
报告地点：武汉大学电子信息学院（信息学部西区综合楼）501会议室
报告题目：语音处理与生成统一模型研究进展
报告人：武执政博士

邀请人：黄公平教授

报告摘要：

随着语音生成技术的广泛应用，人机交互、AIGC等系统与产品对生成语音的表现力、安全可信等方面的要求也越来越苛刻。众所周知，语音信号包含语言和副语言信息。因此，要生成表现力强且安全可信的语音，需联合理解和精准建模语言和副语言信息，但这方面的研究尚属起步阶段。该报告将分享目将具有零样本学习能力、表现力强、安全可信的语音生成大模型相关的研究进展。

报告人简介：

武执政，香港中文大学（深圳）副教授、博导，国家级青年人才，连续多次入选斯坦福大学“全球前2％顶尖科学家。于南洋理工大学博士学位，曾在Meta（原Facebook）、苹果、爱丁堡大学、微软亚洲研究院等机构从事学术研究和技术领导工作。发起Merlin与Amphion开源系统、开源数据集Emilia，被超过300家单位采用并多次占据GitHub趋势榜榜首；组织语音伪造检测、语音合成、语音转换等国际评测，多次获最佳论文。担任IEEE/ACM TASLP、SPL等期刊编委、SLT2024大会主席。

欢迎感兴趣的老师和同学们积极参与!

学院地址: 湖北省武汉市武昌区八一路299号 (430072)

Address:No.299 Bayi Road,Wuhan,Hubei(P.R.C.:430072)

联系电话 (Tel) :(+86)27-68756275/68778537

传真 (Fax) :(+86)27-68778537

网址 (Http) : Http://eis.whu.edu.cn

联系邮箱 (Email) : eisyb@whu.edu.cn

武汉大学电子信息学院

官方微信公众号