武汉大学电子信息学院

首页 >> 学术动态 >> 学术讲座 >> 正文

学术讲座公告---音效生成与空间声场重现技术展望

2025-12-01

阅读：328

报告时间：2025年12月2号（周二）上午10：30

报告地点： 武汉大学电子信息学院于刚·宋晓楼A303会议室

报告题目：音效生成与空间声场重现技术展望

报告人：刘孟美小米技术委员会-大模型Plus

邀请人：黄公平教授

报告摘要：

在人工智能与多模态交互技术迅猛发展的当下，音频作为智能终端核心交互载体，正迎来从 “基础适配” 到 “个性化沉浸体验” 的跨越式升级，其中有声内容消费（有声书、播客等）与车载、耳机音频场景成为核心增长点，用户对高质量、个性化音频体验的需求愈发迫切。与此同时，小米 “人车家全生态” 战略持续深化，已构建覆盖手机、汽车、穿戴设备、智能家居的全场景硬件矩阵。在此背景下，本文报告：聚焦 “AI 音频生成 + 空间声学” 交叉赛道，启动通用音频生成与空间声场重现大模型研发，将音频体验从 “加分项” 升级为 “必选项”，打造软硬结合的独特用户体验。

报告人简介：

刘孟美，小米技术委员会-大模型Plus-多模态生成-音频声场方向负责人。自2013年毕业开始从事音频方向研究，2017年加入小米，开始负责麦克风阵列系统硬件测试及准入标准并形成多项企标及国标，迄今为止还在电视、音箱等麦克风阵列相关设备领域应用。2020年开始从事空间音频相关方向研究，从声音感知理解到生成，覆盖环绕声提取、双耳空间音频、车载放音、音乐律动、无麦K歌、沉浸式音效、人声分离/乐器分离、哼唱识别、AI人声增强、AI立体声转全景声、AI音效生成等算法的研究，发表多篇专利（30+），参与多项国标/行标/企标的制定。

欢迎感兴趣的老师和同学们积极参与！

学院地址: 湖北省武汉市武昌区八一路299号 (430072)

Address:No.299 Bayi Road,Wuhan,Hubei(P.R.C.:430072)

联系电话 (Tel) :(+86)27-68756275/68778537

传真 (Fax) :(+86)27-68778537

网址 (Http) : Http://eis.whu.edu.cn

联系邮箱 (Email) : eisyb@whu.edu.cn

武汉大学电子信息学院

官方微信公众号