5.3 专题论坛三:聚类分析前沿论坛

发布者:徐计发布时间:2025-07-02浏览次数:10

聚类分析作为无监督学习的重要方法,在数据挖掘、模式识别、生物信息学、社交网络分析等领域发挥着关键作用。随着大数据和人工智能技术的快速发展,聚类算法在可扩展性、鲁棒性、解释性以及跨领域应用等方面面临新的机遇与挑战。本次论坛旨在汇聚学术界的青年科学家,共同探讨聚类分析的最新研究进展、技术突破及未来趋势



李春光北京邮电大学人工智能学院副教授、博导。2011年入选微软亚洲研究院“铸星计划”,2012/122013/112019/122020/02两次赴美国约翰霍普金斯大学访学。研究兴趣为高维数据分析与学习及其应用,主持/参与完成国家自然科学基金项目5项;累计发表学术论文70余篇,完成译著1部,谷歌学术引用3200余次;获2019IEEE VCIP最佳学生论文奖,曾担任ICPR2020 / CVPR2021领域主席,获评机械工业出版社华章分社“2024年度译者”;现为CCF-AI / CCF-CV / CSIG-MV专委执委,IEEE资深会员。

【报告题目】

自表达深度子空间聚类:一种原则化框架

【报告摘要】

在过去十年中,自表达模型被证明是检测高维空间中低维子空间结构的有效工具,基于自表达模型的子空间聚类算法被验证是解决高维数据聚类问题的有效方法。本报告首先将介绍自表达模型的基本概念、正确性理论保证以及可扩展求解算法。在此基础上,本报告将给出一种原则化的自表达深度子空间聚类框架;理论分析表明,在温和的条件下该框架能够避免灾难性特征坍缩,而且所学习到的表征分布趋于形成一组正交子空间。此外,本报告还将介绍一种基于堆叠自表达模型而构造的“白盒”深度架构,用于对高维数据中低维非线性流形进行渐进线性化。


刘勇中国人民大学,长聘副教授,博士生导师,国家级高层次青年人才。长期从事机器学习基础理论研究,共发表论文100余篇,其中以第一作者/通讯作者发表顶级期刊和会议论文近50篇,涵盖机器学习领域顶级期刊JMLRIEEE TPAMIArtificial Intelligence和顶级会议ICMLNeurIPS等。曾获中国人民大学“杰出学者”、中国科学院“青年创新促进会”成员、中国科学院信息工程研究所“引进优青”等称号。主持/参与国家自然科学面上/基金青年、科技部重点研发、北京市科技计划中央引导地方专项、北京市面上项目等项目。

【报告题目】

聚类泛化分析及应用

【报告摘要】

在机器学习领域,无监督聚类作为数据探索和模式发现的核心技术,其泛化能力直接关系到聚类结果在实际应用中的可靠性与有效性。然而,相较于监督学习的广泛理论研究,无监督聚类的泛化分析问题长期处于研究边缘,缺乏系统性的理论框架与深入探讨。本报告围绕聚类泛化分析及应用展开深入探讨。首先,将聚焦经典 K-means 算法及聚类问题的一般性理论,通过严谨的数学推导与分析,揭示聚类模型泛化性能的关键影响因素;然后着眼于多视角聚类应用场景,探索聚类泛化分析在复杂数据结构下的应用潜力与优化策略,旨在为相关领域研究与应用提供理论支撑与实践指导。


   胡鹏,四川大学计算机学院教授,博士生导师,国家级青年人才。主要研究方向为多模态学习和多媒体分析。2019-2020年在新加坡科技研究局(A*STAR)担任研究员。已在Nature子刊、TPAMIIJCVTIPCVPRICCVNeurIPSICMLICLR等国际期刊/会议上发表学术论文80余篇,包括多篇ESI高被引/热点论文。研究成果获得中国图象图形学学会(CSIG)自然科学一等奖、四川省自然科学二等奖、中国人工智能学会教学成果激励计划一类成果等。主持国家自然基金(面上、青年)项目、国家重点研发计划课题、四川省重点研发基金项目等。担任CSIG青工委副秘书长、VALSE执委会副主席等;担任NeurIPSICMLCVPRACM MM等多个重要国际学术会议的领域主席;担任The Visual Computer期刊编委;担任TPAMIIJCVTIPTKDE等多个国际重要SCI期刊审稿人。

【报告题目】

具有噪声关联的多视图聚类:从错误负对到错误关联

【报告摘要】

多视图聚类作为一种融合多源信息的无监督学习范式,在图像、文本、生物信息等领域展现出广泛应用潜力。然而,现实应用中由于网络延迟、采样频率不一致等因素,视图间往往存在配对错误,即“噪声关联”,这将显著削弱模型对跨视图语义一致性的建模能力,成为制约聚类性能的关键瓶颈。本报告将围绕这一挑战,系统梳理当前研究中聚焦于噪声关联的三类典型问题:1) 训练阶段中错误负对引发的模型次优问题;2) 测试阶段中部分视图错配带来的推理失效问题;3) 训练数据中视图错误关联造成的噪声过拟合问题。本报告将介绍近年来的代表性方法,总结现有技术的共性思路与关键差异,并探讨开放环境下多视图聚类的未来发展方向与研究机遇。


文杰哈尔滨工业大学(深圳)副教授,博士生导师,IEEE/CCF/CSIG高级会员,深圳市视觉目标检测与判识重点实验室副主任。2019年获评“中国博士后创新人才支持计划”。主持国基面上、国基青年、广东省青年提升(省优青)、广东省粤深青年基金、深圳市基础研究面上等十多个项目。研究多模态/多视图学习,在TPAMINIPSICMLCVPR等期刊和会议上发表论文百余篇,谷歌学术引用6700多次,8篇一作/通讯论文入选ESI高被引论文,获AAAI 2023优秀论文奖。担任IEEE TIPIEEE TIFSPattern Recognition期刊Associate Editor,担任Information Fusion期刊领域编辑(Area Editor),担任NeurIPSICMLACMMM等会议领域主席。

【报告题目】

部分视图缺失下的不完备多视图聚类

【报告摘要】

多视图聚类作为多视图/多模态数据分析的核心技术,通过融合来自不同来源或特征的互补信息,可显著提升复杂数据的表征能力。传统多视图聚类建模往往依赖高质量完备多视图数据。然而,实际应用中普遍存在的视图缺失现象(如传感器故障、数据采集限制等)导致传统多视图聚类方法应用受限,这引出了"不完备多视图聚类"这一具有重要理论价值与应用挑战的研究课题。本报告将从“数据未缺失有限信息挖掘”和“缺失数据复原”两个角度介绍团队在“部分视图缺失下不完备多视图聚类”问题上的研究进展,探讨该方向还存在的一些待解决的关键问题。报告相关工作的代码详见主页:https://sites.google.com/view/jerry-wen-hit/publications


  王思为目前任智能博弈与决策实验室助理研究员。主要研究方向为大规模多模态数据分析、大模型多Agent等。于NeurIPSICMLCVPRICCVIEEE TPAMITIPTKDE等人工智能顶级会议和期刊发表论文20余篇,学术引用5000余次,4ESI高被引论文。担任CCF-A类会议NeurIPSICMLICLRCVPRICCVAAAIIJCAIACMMM领域主席和一区期刊Pattern Recognition编委,主持、参与多项科技委项目、科技部项目、国家自然科学基金项目。个人学术主页:https://wangsiwei2010.github.io/

【报告题目】

多视图聚类的复杂性视角

【报告摘要】

当前,多视图聚类分析广泛地被应用在机器学习、数据挖掘等相关领域并取得了成功。相比较于单视图,多视图聚类意图通过视图之间的协同实现任务表现上的涌现。然而,现有方法大多侧重于学习算法构建,很少从视图角度上关注多视图聚类的复杂性。本报告拟基于复杂性科学和多视图聚类的学科交叉,汇报课题组最近几年针对不平衡、缺失条件下复杂多视图聚类方法的探索。




【论坛组织者】白亮,山西大学智能信息处理研究所所长,教授,博士生导师,国家优秀青年基金获得者。主要研究方向为机器学习与聚类分析,相关研究成果发表在AIIEEE TPAMIIEEE TKDEDMKDICMLKDDAAAI等国际重要学术期刊和会议,主持国家自然科学基金重点项目、科技部新一代人工智能重大项目课题等,博士论文获得了中国人工智能学会优秀博士学位论文奖,作为主要完成人2次获得山西省科学技术奖(自然科学类)一等奖。