2026年3月13日晚19时,williamhill英国第六十九期研究生学术论坛在崇真楼南楼A4030成功举办。本次论坛由2023级研究生张思莹、李创、谈华丰、汤鸿睿、谢耀冲、桂文涛以及陆飞主讲,williamhill英国研究生会学术部主办,学院王晨老师出席了该论坛。
张思莹同学分享的主题为“XGBoost Ionospheric Prediction Integrating Feature Reconstruction and Intelligent Optimization”。针对传统机器学习模型在电离层TEC预测中复杂度高、可解释性弱等问题,提出一种融合特征重构与参数优化的XGBoost方法。首先引入SHAP算法解析多源特征贡献权重,明确特征间物理关联从而优化特征组合。其次采用ICEEMDAN方法进行信号分解重构,实现高阶耦合特征解耦与信噪分离,提升可学习性。然后构建XGBoost模型,通过集成树结构与正则化策略捕获TEC非线性关系与局部突变特征。最后借助鲸鱼优化算法实现超参数自适应优化。
李创同学分享的主题为“Cross-Modal Dependable Subjective Learning for Sketch Person Re-identification”。在缺乏相机图像的情况下,基于草图的行人重识别(Sketch Re-ID)可借助于凭记忆绘制的草图来实现对嫌疑人的检索。然而,草图中的主观性往往会带来显著的风格差异,使得提取可靠的跨模态特征变得困难。为了应对该挑战,我们提出了跨模态可信主观学习框架。它包含一个灵活特征聚合模块,该模块通过实例归一化消除风格噪声,并通过注意力增强的残差学习捕捉可靠的主观语义;以及一个可识别目标质心损失,用于增强跨模态的判别力和对齐能力。在MARKET-SKETCH-1K和PKU Sketch Re-ID数据集上的实验表明,我们的方法有效捕捉了一致的主观线索,并在多种草图风格下实现了优异的性能。
谈华丰同学分享的主题为“High-Fidelity Digital Humans Based on Attention and Expert Mixture Network”。本研究针对动态人体渲染中非刚性运动难以准确建模的问题,提出一种基于单目视频的高保真动态人体重建方法。该方法能够捕捉多样化人体姿态,并实现新视角下的逼真三维渲染。首先,引入专家混合网络对复杂运动模式进行分解,通过多专家子网络精细建模人体非刚性变形;其次,设计融合残差结构与通道注意力机制的阴影预测网络,以增强模型对光照与阴影变化的表达能力;同时结合纹理损失与梯度差分边缘感知损失,引导模型恢复细粒度褶皱与纹理细节。在ZJU-MoCap数据集上,新视角合成任务达到PSNR 30.44、SSIM 0.9690、LPIPS* 31.07,新姿态合成任务达到PSNR 30.53、SSIM 0.9698、LPIPS* 29.95;在PeopleSnapshot数据集上平均PSNR 30.83、SSIM 0.9796、LPIPS 0.0205。该方法推理速度可达40FPS,模型仅3.92MB,在保证高精度的同时兼顾计算效率。
汤鸿睿同学分享的主题为“EFCRF: Edge Feature-guided Cross-modal Registration Framework for Images and Point Clouds”。图像与点云配准是自动驾驶与机器人感知融合的关键,但由于模态差异,现有方法在复杂场景下常面临特征不一致的难题。为此,本文提出了一种边缘特征引导的跨模态配准框架(EFCRF)。该框架首先通过定制的边缘提取模块,显式捕捉图像与点云的几何边界,融合生成具备结构感知的跨模态描述符;其次,采用由粗到精的配准策略,从全局的“超像素-超点”粗匹配,逐步细化至高精度的密集“像素-点”关联。此外,本文创新性地引入了边缘引导课程学习(EGCL)机制,依据场景边缘复杂度实现“由易到难”的训练调度,显著增强了模型的收敛稳定性。在KITTI与nuScenes数据集上的实验表明,该方法的配准准确率均突破99%,各项误差指标全面优于现有最优方法,充分验证了边缘结构建模在复杂跨模态配准中的卓越鲁棒性。
谢耀冲同学分享的主题为“Shape-Texture Aware Multi-Source Domain Adaptation for Industrial Anomaly Detection”。在工业异常检测中,检测表面纹理缺陷与形状形变是保障产品质量的关键。尤其在皮革制品异常检测中,工业数据集内丰富且相互耦合的纹理与形状特征,再加上异常样本极度稀缺,导致传统检测方法出现性能下降、泛化能力受限等问题。为应对这一挑战,本文提出一种多源域自适应异常检测网络MDANet。该网络基于域对抗学习框架构建,形成端到端的通用检测范式。针对工业缺陷检测任务的多样性,网络引入置信度掩码,以适配三类典型场景:仅形状特征检测、仅纹理特征检测,以及二者结合的检测。同时,采用最优传输机制实现动态权重分配,使模型能够敏感感知目标域数据中形状与纹理特征的占比,并灵活调整学习重心。此外,主干网络深度融合了多尺度特征融合模块(MFM)与全局注意力模块(GAM):前者通过高低分辨率特征的交互传播,增强模型对大面积缺陷与细微瑕疵的响应能力;后者在解码阶段对多级语义信息进行智能权重分配,显著提升特征表示精度。
桂文涛同学分享的主题为“DiffusionNet-Based 3D Garment Model Retrieval”。三维服装模型在虚拟试衣、数字服装设计和智能检索等领域具有重要应用,但传统方法在复杂拓扑结构和多样化服装形态下存在特征表达能力不足的问题。为此,本文研究基于DiffusionNet的三维服装模型检索方法,通过引入残差扩散模块、注意力机制和多尺度特征融合策略,提升模型的特征表示能力。同时提出跨模态检索方法,实现二维服装图像与三维模型的统一特征映射。最后设计并实现三维服装模型检索系统。
陆飞同学分享的主题为“A Sequence-to-Sequence Tracking Method Based on Mixed Attention and Knowledge Distillation”。传统跟踪器特征提取与特征交互过程通常分离从而难以有效捕捉目标特定的特征,而结构复杂、参数量庞大的骨干网络进一步降低了推理效率,部分跟踪器采用序列生成预测结果需对边界框坐标离散化处理易放大预测误差影响跟踪精度。针对上述问题,本文设计了基于混合注意力的骨干网络用于联合的特征提取和关系建模。同时,采用知识蒸馏技术结合渐进式剪枝策略在保持性能的前提下显著压缩模型规模,提高跟踪效率。此外,本文设计了一种混合匹配策略来提高量化过程的容错性。得益于上述组件,本文在五个基准数据集上取得了优异的性能。
