11月18日到20日,由中国计算机学会主办,CCF大数据专家委员会、西南交通大学、成都市新经济发展委员会承办,四川大学、电子科技大学、西南财经大学、成都市产业数字化促进会协办的第十届CCF大数据学术会议(CCF BIGDATA 2022)在成都成功举办。本次大会邀请了国内外大数据领域的著名专家学者,设有专题论坛和分组报告等多种形式的学术交流活动,其中,大数据广谱关联分析论坛于11月20日上午在线成功举办。
本次大数据广谱关联分析论坛由中国科学院计算技术研究所研究员沈华伟和郭嘉丰教授共同主持,邀请到中国科学院大学教授程学旗,悉尼科技大学教授操龙兵,香港科学技术大学教授熊辉,北京理工大学教授袁野,东南大学教授张敏灵作特邀报告。围绕大数据领域,五位专家学者通过线上方式发表了学术研究报告,探讨了在大数据时代科学研究的发展方向,为推动我国大数据技术与产业融合发展迈上新台阶,为数据强国建设奠定坚实基础提供了新的思考方向。
在论坛特邀报告环节,五位专家学者分别作了精彩的报告。程学旗教授报告的主题是“广谱关联计算的内涵与应用探索”,报告主要讲述了在数据关联关系愈加复杂的背景下,如何从网络空间大数据发现微弱目标、挖掘隐形线索,预测涌现态势。为适应人机物三元世界融合的数据空间,程教授重新定义了网络大数据分析范式,即提出了广谱关联计算:从超大规模高维稀疏大数据挖掘微弱、隐形的目标与线索。报告首先介绍了广谱关联计算的内涵、外延和方法,解释了概率图模型、耦合学习和异质信息网络等与广谱计算相关的概念,同时阐述了目前需要面对的一些难题。随后程教授总结了目前在广谱关联计算领域的实践工作以及面对的挑战和对未来的探索发展。
悉尼科技大学操龙兵教授报告的主题是“Complex Couplings and Interactions: Good, Bad and Ugly”,报告首先简单介绍了人工智能七十年的发展过程,分别讲解了深度模型、浅层模型和统计模型中的基本概念和形式化定义。随后操龙兵分别阐述了目前在深度神经网络模型、浅层模型和统计模型中存在的问题和挑战。在报告的讲述中,操龙兵提到在许多系统复杂性中,对于大数据领域,交互和耦合是更基本和更复杂的特性。最后,操龙兵简要介绍了对于上述潜在问题和挑战的初步想法并分享了目前的一些工作成果。
香港科学技术大学(广州)人工智能学域主任、讲座教授熊辉教授报告的主题为“基于移动大数据的双碳时代智慧城市建设”,报告围绕智能城市建设这一主题,分别从城市建设、城市治理和画像分析这三个层次上解释如何构建大数据驱动的智慧城市框架。随后,熊教授从上述三个层次分别介绍了所完成的一些工作,主要讲解了基于地理空间相关性感知的房地产评估技术、基于多层次异构信息的城市商业竞争关系分析技术和面向复杂情景的低碳出行路线规划技术、区域画像构建和可视化报告分析等。
北京理工大学教授袁野报告的主题为“从计算理论角度研究大图数据分析”,报告从计算复杂度理论角度探讨大图数据分析的可计算问题、可表达问题和可解释问题。针对大图数据分析的可计算问题,袁教授首先提出大图计算的难点在于大图结构的特点和图参数的选择这一观点,同时介绍了大图计算模型MapReduce和Pregel,展示了MapReduce和Pregel在不同图问题下的效果,提出了基于树分解的大图计算模型,总结了采用树分解分布并行计算大图算法的优点。针对可表达问题,报告中讲解了图和逻辑之间的关系。针对可解释性问题,袁教授将可解释性方法分为三类,分别为训练前解释数据、训练时搭建具有可解释性的模型和训练后解释得到的模型,最后,分析了经典的三个模型FBDDs、Perceptrons,MLDs的复杂度和可解释性。
东南大学教授张敏灵报告的主题为“多维分类的研究”,报告首先简单介绍多类分类问题和多标记分类问题,从而引出了多维分类问题。对于多维分类问题,张教授从一个样本的刻画上来解释了多维分类问题的基本设置及其与相关分类框架的关系,同时对比了多标记问题和多维分类问题,随后举例阐述如何从多维度上描述不同对象的语义信息。此外,报告介绍了多维分类问题中已有的方法,如基于贝叶斯网络的方法,基于分类器链的方法等。最后张教授分享了有关多维分类问题的两个研究成果,即基于最大化边际多维分类方法和基于稀疏标记编码多维分类方法。
论坛在激烈的讨论中顺利结束。中国科学院大学岗位教授沈华伟教授对本次在线论坛进行总结,指出本次论坛内容丰富、层次深刻,聚焦数字化时代发展的新形势,期待更多内涵丰富的CCF活动。