为促进广大人工智能工作者深入交流和探讨人工智能的前沿技术和最新进展,2021年11月28日,由中国人工智能学会主办,天津市人工智能学会协办,中国人工智能学会青年工作委员会和天津大学承办的《人工智能前沿科技报告会》通过线上的方式举行。会议特邀复旦大学姜育刚教授、中国科学技术大学周文罡教授、中科院大学叶齐祥教授、上海交通大学卢策吾教授、厦门大学纪荣嵘教授、天津大学韩亚洪教授、吴偶教授、张长青副教授和朱鹏飞副教授共同分享人工智能前沿进展,通过专家报告了解当前人工智能领域最新技术,推进所在领域研究发展。

        报告会首先由天津大学胡清华教授致欢迎辞。接着,天津大学朱鹏飞副教授和张长青副教授主持报告会,分别介绍了九位报告人的学术成果及其报告题目。九位报告人分别详细讲解了各自在人工智能顶级会议及期刊上发表的部分研究工作,并回答了参会人员提出的相关问题。线上共有2700多人次参会,学术讨论氛围十分热烈。

天津大学胡清华教授致欢迎辞

        复旦大学姜育刚教授以“视频目标识别与篡改检测”为题,讲解了视频内容理解中的目标识别与篡改检测两个方向,介绍复旦大学视觉与学习团队在大规模视频数据集构建、快速视频识别、视频数据篡改鉴别等方面的工作进展。

复旦大学姜育刚教授作报告

        天津大学韩亚洪教授以“受限场景下的视觉与学习”为题,以全天候交通/监控目标检测应用为例介绍混合场景适应的目标检测、小样本长尾分布目标检测的研究进展,并对“数据+模型”双重受限条件下的视觉模型跨场景部署的新框架进行讨论。

天津大学韩亚洪教授作报告

        天津大学张长青副教授以“可信多模态学习前沿研究进展”为题,介绍多模态机器学习中面向精准的融合技术和面向可信的融合技术,并重点介绍端到端的可信多模态融合技术,在多模态协同学习(兼听则明)时,对不同模态进行证据估计(信而有征),从而支持融合及决策的可靠性和稳定性。

天津大学张长青副教授作报告

        中国科学技术大学周文罡教授以“视频手语识别方法研究”为题,讲解了采用增广学习和先验建模的思想,开展视频手语识别的创新方法研究。在增广学习方面,提出了跨模态增广学习和回译增广学习方法;在先验建模方面,提出了句法规则先验建模方法、手型先验建模方法、自监督学习方法。在视频手语识别基准数据集上开展的定量和定性的实验分析,验证了上述方法的有效性。

中国科学技术大学周文罡教授作报告

        中科院大学叶齐祥教授以“一种耦合局部和全局特征的表示模型”为题,介绍了中国科学院大学联合鹏城实验室和华为提出的Conformer基网模型。Conformer模型可以在不显著增加计算量的前提下显著提升了基网表征能力,并且展现了成为一种视觉大模型基础网络的潜力。

中科院大学叶齐祥教授作报告

        上海交通大学卢策吾教授以“行为理解与具身智能”为题,介绍了“具身智能”的历史发展,讲解了团队提出的面向机器人本体的通用框架robotflow,同时介绍了在机器人抓取方面的最新工作GraspNet——首个达到人类抓取能力通用抓取算法。最后总结行为理解与具身智能(第一视角行为理解)的内在关系与发展趋势。

上海交通大学卢策吾教授作报告

        厦门大学纪荣嵘教授以“深度神经网络的压缩与加速研究”为题,针对神经网络的加速和冗余度问题,介绍了已有的加速和压缩方法并在其中覆盖纪荣嵘教授研究组近几年来在神经网络压缩与加速中所做的一些工作与成果。

厦门大学纪荣嵘教授作报告

        天津大学吴偶教授以“样本学习难度的度量理论与方法”为题,从机器学习的一个理论基石——偏差方差平衡理论出发来度量样本的学习难度,基于这个理论性的度量来分析一系列基于难度的样本赋权算法的本质特性。此外,吴偶教授的团队还提出了一个可行的度量方法,并通过一系列实验来验证该方法的有效性。

天津大学吴偶教授作报告

        天津大学朱鹏飞副教授以“无人机鲁棒环境感知前沿研究进展”为题,基于团队构建的VisDrone数据平台,提出了多任务时空近邻感知网络、图正则光流网络、多机协同感知网络、双光融合网络等模型,开发了人机协同数据平台、河道智能巡检系统、智能交通巡检边缘计算盒子等产品,并成功应用在自动驾驶、智慧城市等领域。

天津大学朱鹏飞副教授作报告

        通过九位报告人的讲解,使得参会人员对于人工智能的最新研究进展和高水平研究工作有了更深入的了解和认识,为广大人工智能工作者提供了新思路和新方法,同时也激发了参会人员对于人工智能学术研究的热情。

编辑:乔弘宇