李泽超,南京理工大学计算机科学与工程学院/人工智能学院/软件学院教授、副院长(主持工作),研究兴趣主要是多模态智能分析、计算机视觉等,主持国家杰出青年科学基金、新一代人工智能国家科技重大专项课题、国家自然科学基金联合基金重点项目、江苏省攀登项目、江苏省杰青项目等;入选国家“万人计划”青年拔尖人才;发表CCF A类期刊和会议论文70余篇,获得江苏省科学技术一等奖2项、中国电子学会自然科学一等奖1项;获得ACM MM Asia 2020和2024两年度最佳论文奖等;担任IEEE TPAMI, TNNLS, TMM, TCSVT等期刊编委。
【报告题目】
面向具身智能的视觉定位
【报告摘要】
近年来,具身智能成为了备受关注的重要方向,受到了学术界和工业界的广泛关注。具身智能将人工智能融入机器人等物理实体,赋予它们感知、学习和与环境动态交互的能力。感知任务包括对象识别、位置定位、场景理解等。开放场景的视觉定位不确定性大,极具挑战性。本报告着重介绍了研究团队在面向具身智能的开放场景视觉识别与定位方面的研究工作,包括上下文解耦的鲁棒视觉定位、语义分割、知识迁移、多模态融合等工作,最后介绍在实际业务开放场景上的应用情况。
张长青,天津大学智能与计算学部教授、博士生导师,国家级青年人才,其主要研究方向为机器学习、计算机视觉、智能医疗。2017-2018年在北卡罗拉纳大学教堂山分校担任研究员。在Nature Communications/IEEE TPAMI/IJCV/ICML/NeurIPS/ICLR等期刊和国际会议上发表论文50余篇。Google Scholar引用1.3万余次。研究成果获得天津市自然科学一等奖、重庆市自然科学一等奖、中国图象图形学学会自然科学奖一等奖、ICME最佳论文等奖励,入选百度发布的全球高潜力AI华人青年学者榜单、斯坦福大学发布的全球Top 2%顶尖科学家榜单、爱思唯尔“中国高被引学者”。受邀担任Pattern Recognition编委、中国图象图形学报编委、顶级会议ICLR/IJCAI领域主席。
【报告题目】
大模型的不确定性刻画与应用
【报告摘要】
医生面对复杂病情时倾向于要求更多检查,但AI系统常直接输出高置信度的诊断建议;科研人员查找权威文献以支撑研究,大模型用citation的格式为根本不存在的文献背书。这种差异揭示了智能系统的核心缺陷:当前模型缺乏对不确定性的准确刻画能力,导致其无法像人类一样感知风险。本报告将(1)介绍传统神经网络中如何刻画不确定性,以及如何利用不确定性提高模型的准确性与可靠性;(2)针对传统不确定性刻画方法在大语言模型上纷纷失效,揭示造成这种困境的原因,并给出解决思路。通过理论结合实践,为学术界与工业界提供不确定性刻画与应用的新视角,推动不确定性研究在大模型时代迈向更深更广的应用。
徐偲,西电计科院副教授、博士生导师,主要研究方向是可信多模态学习,获得人工智能领域顶级会议AAAI-24的最佳论文奖(唯一第一作者)、陕西省自然科学奖一等奖(3/6)、“陕西省优秀博士学位论文”、西安电子科技大学“校长奖”,获评“第十届中国科协青年人才托举工程”。在IEEE TPAMI等中科院一区期刊/CCF A类学术会议发表论文33篇,其中一作/通讯21篇。主持国家自然科学基金面上、青年项目、陕西省自然科学基础研究计划重点项目-前沿探索项目等。
【报告题目】
可信多模态学习及其在社会媒体场景的应用探索
【报告摘要】
近年来,多模态学习取得了显著进展,在医疗、机器人和自动驾驶等领域得到了广泛应用。然而,多模态数据的质量容易受到噪声、缺失等多种因素的影响,从而导致模型在遇到低质量多模态数据时可能会给出灾难性的错误预测。可信多模态学习为解决这一问题提供了新的机遇,其核心理念是赋予模型自我认知的能力,使其能够合理评估每次决策的不确定性。本报告将结合课题组的研究工作,介绍可信多模态学习领域的主要问题和研究进展,以及课题组将其在推荐系统、金融预测等社会媒体场景的初步应用,并讨论面临的挑战及未来工作的展望。
讲习班主席:岳晓冬,教授、博导,现任上海大学未来技术学院(人工智能研究院)副院长、卓越工程师学院副院长。研究方向为机器学习与不确定性决策,发表论文100余篇,其中50余篇中科院或中国计算机学会1-2区期刊、会议论文。主持/完成4项国家自科基金项目,骨干参与/完成3项国家级重点、重大项目。现为IEEE计算智能学会成员,国际信任函数与应用学会成员,中国人工智能学会粒计算与知识发现专委会副主任、机器学习专委会委员,上海市计算机学会人工智能专委会副主任。担任IJAR等多个高水平学术期刊领域编辑及编委。长期担任AAAI等学术会议程序委员会成员,曾任ICME2012、DSAA2014等会议出版主席,Belief2020与IJCRS2022会议副主席。荣获中国计算机学会科技进步一等奖、上海市优秀教学成果二等奖。