近日,武汉大学电子信息学院2023级本科生徐沈胤、王一山以共同第一作者身份,在计算机视觉与模式识别领域顶级国际学术会议CVPR 2026上成功发表论文《MS²Gait: A Multi-Scale Spatio-Temporal Fusion Network for LiDAR-based Gait Recognition》。该论文由田昕教授和刘芮博士后指导,其前期工作依托国家级大学生创新训练项目《基于深度学习的步态识别系统》。
据悉,CVPR(IEEE/CVF Conference on Computer Vision and Pattern Recognition,IEEE国际计算机视觉与模式识别会议)是计算机视觉领域全球公认的顶级学术会议,与ICCV、ECCV并称计算机视觉"三大顶会",位列中国计算机学会CCF-A类推荐榜单。据最新谷歌学术指标统计,CVPR位列总榜第2,在计算机学科排名第1,h5-index为450。本届会议共收到有效投稿16092篇,录用4090篇,录用率为25.42%。
步态识别是一种通过人体行走模式进行身份认证的生物特征识别技术,具有远距离、非接触等特点,在智能安防、身份认证等场景中具有重要应用价值。相比传统基于摄像头的方法,LiDAR(激光雷达)点云数据具备不受光照影响、天然保护隐私等优势,近年来受到学界广泛关注。然而,现有点云步态识别方法存在两大核心瓶颈:一是无法有效建模身体各部位之间的远距离语义关联(如手臂与腿部的协同运动);二是时序建模较为简单,难以应对不同行走节奏和采集帧率造成的时序异质性。

针对上述问题,该论文提出了MS²Gait框架,包含两大核心模块:
1、层次化空间特征提取器(HSFE):设计了四种互补的特征交互策略,实现了跨尺度、跨身体部位的语义关联建模,并通过几何感知多分辨率特征融合模块(GMFF)对齐不同尺度的特征表示;
2、基于相似度的时序增强(STET):通过多样性驱动的关键帧选择减少时序冗余,结合多尺度余弦相似度聚合动态加权帧的贡献,有效抑制噪声、提升对运动一致性模式的建模能力。

在大规模LiDAR步态数据集SUSTech1K和FreeGait上的实验表明,MS²Gait分别取得了93.5%和83.1%的Rank-1识别精度,达到当前最优水平,尤其是在携包、打伞等非步态干扰场景下,表现出极强鲁棒性。
该研究论文的两位共同第一作者徐沈胤和王一山,均为我院23级试点班本科生。徐沈胤,来自人工智能试点班,预备党员。在校期间曾获于刚·宋晓奖学金、烽火通信奖学金,并先后获评三好学生、优秀共青团员、优秀青年志愿者等荣誉称号。在学科竞赛方面,曾荣获中国国际大学生创新大赛全国金奖、全国大学生数学建模竞赛全国二等奖、华中杯大学生数学建模挑战赛一等奖等。王一山,来自逐光创新人才试点班,预备党员。在校期间曾获国家奖学金、郑格如一等奖学金,并先后获评三好学生、理论学习先进个人、优秀共青团员等荣誉称号。在学科竞赛方面,曾荣获全国大学生英语竞赛国家级一等奖、全国大学生集成电路创新创业大赛国家级一等奖、全国大学生光电设计竞赛国家级三等奖等。
两位同学在科研创新上取得的突出成果,是学院近年来持续深化拔尖创新人才培养体系的生动体现。学院坚持以国家战略需求和前沿科技发展为引领,以差异化试点班建设激活本科生科研创新内生动力。其中,人工智能试点班聚焦人工智能核心技术,系统强化机器学习、智能感知等关键领域培养,依托跨学科课程体系与国际化教学范式,致力于培养兼具理论功底与现代创新思维的专业人才。逐光创新人才试点班立足光电信息学科优势,推行高师生比、全程化、科研浸润式导师制,依托国家级工程实践教育中心等高端平台,引导学生在高水平竞赛和科研创新中锤炼真本领、增长硬实力。这种多维度培养机制为学子探索科技前沿、服务国家科技自立自强提供了坚实平台支撑,也彰显了学院在拔尖创新人才培养上的卓越探索。
(通讯员:刘芮)


学院地址: 湖北省武汉市武昌区八一路299号 (430072)
Address:No.299 Bayi Road,Wuhan,Hubei(P.R.C.:430072)
联系电话 (Tel) :(+86)27-68756275/68778537
传真 (Fax) :(+86)27-68778537
网址 (Http) : Http://eis.whu.edu.cn
联系邮箱 (Email) : eisyb@whu.edu.cn
武汉大学电子信息学院
官方微信公众号