业绩考核

OA系统

首页 >> 学术动态 >> 学术讲座 >> 正文

学术讲座公告---语音生成大模型研究进展

2025-01-16
  • 阅读:175


报告时间:20250118日(周六)上午1100
报告地点:武汉大学电子信息学院(信息学部西区综合楼)501会议室
报告题目:语音处理与生成统一模型研究进展
   人:武执政 博士

    人:黄公平 教授



报告摘要:

随着语音生成技术的广泛应用,人机交互、AIGC等系统与产品对生成语音的表现力、安全可信等方面的要求也越来越苛刻。众所周知,语音信号包含语言和副语言信息。因此,要生成表现力强且安全可信的语音,需联合理解和精准建模语言和副语言信息,但这方面的研究尚属起步阶段。该报告将分享目将具有零样本学习能力、表现力强、安全可信的语音生成大模型相关的研究进展。

 

报告人简介:

153.jpg

武执政,香港中文大学(深圳)副教授、博导,国家级青年人才,连续多次入选斯坦福大学全球前2%顶尖科学家。于南洋理工大学博士学位,曾在Meta(原Facebook)、苹果、爱丁堡大学、微软亚洲研究院等机构从事学术研究和技术领导工作。发起MerlinAmphion开源系统、开源数据集Emilia,被超过300家单位采用并多次占据GitHub趋势榜榜首;组织语音伪造检测、语音合成、语音转换等国际评测,多次获最佳论文。担任IEEE/ACM TASLPSPL等期刊编委、SLT2024大会主席。


欢迎感兴趣的老师和同学们积极参与!



学院地址: 湖北省武汉市武昌区八一路299号 (430072)

Address:No.299 Bayi Road,Wuhan,Hubei(P.R.C.:430072)

联系电话 (Tel) :(+86)27-68756275/68778537

传真 (Fax) :(+86)27-68778537

网址 (Http) : Http://eis.whu.edu.cn

联系邮箱 (Email) : eisyb@whu.edu.cn

武汉大学电子信息学院

官方微信公众号


© Copyright 2023 武汉大学电子信息学院 版权所有