数据科学竞赛平台DataCastle于6月13日推出一场面向全球数据爱好者的竞赛——DataCastle国际大师赛,主题为探索复杂网络中的关键节点。截至目前,这场规模空前的比赛已经吸引了了国内外400余参赛者加入,主办方仍着力邀请国内外更多对复杂网络领域兴趣浓厚并有着深入研究的学者及团队参与其中,共同展开这场DataCastle平台迄今为止最高规格的大师对决。
从复杂网络的优化渗流到国际大师赛
长久以来,渗流理论的研究都集中于Erdös-Rényi网络和各种晶格网络;直到本世纪之初,随着真实网络的各种特征被一一发现,渗流理论在真实网络中的研究也吸引了众学者的关注。而复杂网络作为大量真实复杂系统的高度抽象,近年来成为国际学术界新兴的研究热点,自Watts和Strogat1998年提出小世界网络模型以及Barabasi和Albert1999年提出无标度网络模型以来,国际学术界掀起了对复杂网络研究的热潮,许多研究成果陆续问世。
为了更深入的研究复杂网络的优化渗流,DataCastle举办了此次国际大师赛,由DataCastle堡主、大数据权威学者周涛教授亲自策划赛题,并力邀渗流领域的国际顶级科学家成立大赛学术委员会(Academic Board Member,简称ABM)对大赛进行学术指导。
目前,ABM名单包括微软亚洲研究院高级研究员、清华大学客座教授、中国科学院计算所客座研究员陈卫;中科院百人计划、中科院理论物理研究所研究员周海军;东京工业大学创新研究所特任教授、成均馆大学能源科学系教授Petter Holme;纽约市立大学物理博士Flaviano Morone;美国物理协会会员、纽约市立大学教授Hernan Makse等。
本次大师赛面向全球数据极客同步开放,最终Top50的竞赛团队将有机会进行访问交流、与ABM深度合作。
挖掘网络中的阿喀琉斯之踵
社交网络以及其他各式网络,在社会经济、自然科学等领域中发挥着越来越大的作用,而其中一个很核心的问题是了解一个节点在网络中发挥的作用。比如SARS的传播,可能一个超级传播者带来的影响比其他100甚至1000个人还多;一条谣言的传播,一个核心大号的转发可能带来巨大的影响。
这便是关键节点的探寻,关键节点可以是维持互联网连通性的中心站点、是引起大规模级联失效的发电站、是触发生物链连锁反应的海獭、是导致全球经济危机的美国次贷危机....
因此我们需要有一种直击阿喀琉斯之踵的能力,从生物的大规模基因调控网络中,找到导致疾病的重要基因;从大规模的社交网络中,找到传播谣言/疾病的最重要的节点;从大规模的企业投资关系网络中,找到可能导致金融风险的重要企业。
这便是如何寻找网络中的关键节点,这实际上也是从现在到未来最有可能导致商业模式革新的一个重要方向。这个问题,也叫做复杂网络最优渗流,是网络科学领域的一个经典问题。
参与其中,挑战优美的科学
本次国际大师赛旨在探讨关键节点的挖掘,我们已知现有的挖掘关键节点的方法包括结构化的指标(度、H指数、核数、接近中心性、介数中心性、Katz中心性)、迭代寻优(特征向量中心性、累计提名、PageRank、HITs)、节点移除/收缩(最短距离法、生成树法、残余接近中心性、节点收缩法)、以及基于动力学的研究(路径统计的方法、时间敏感的方法)等。
我们相信,仍有更好的方法等待我们去挖掘。
大赛自六月十三日开赛以来,大赛已吸引到国内外370多个团队参与,作品提交250余次。让我们倍感欣喜的是,成绩最好的团队取得了1.067的分值(分值越小越好),远比通过H指数[L. Lü, et al., Nat. Comm. 6 (2016) 10168] 取得的分值(1.987)以及通过核数 [M. Kitsak, et al., Nat. Phys. 6 (2010) 888] 取得的分值(2.906)好。
此外,Datacastle技术组针对大师赛尝试了一个简单的贪心算法:去除一个极大度数节点(或者排名前n的最大度数节点),然后计算最大剩余集团,再去除在最大剩余集团中的极大度数节点(或者排名前n的最大度数节点),依次迭代。如此,这个简单的贪心算法可以取得一个非常不错的分值(大约1.25)。
40亿年前产生单细胞生物,3到4亿年前出现智慧生物,400万年前出现智慧的人,历史的车轮将我们推向科技的风口浪尖,数学、物理、计算机三种思维方式作为推动科技进步的原动力期待着不断地被探索和发现。
DataCastle国际大师赛抛出一道综合了三种思维方式的科学难题,我们期待通过这次研究性比赛,涌现出一批优秀的参赛团队,寻求最前沿且精确结果,足以让这个星球上最顶尖的科学家都为之震撼。
更希望通过这次竞赛发现一些“优美”的解决方案,找到一种结合数学、物理、计算机的最精髓的办法,为这道经典难题交出一份迄今为止最美丽的答卷。
DataCastle数据科学竞赛平台简介
DataCastle作为中国知名的数据科学竞赛平台,致力于通过参赛者参赛提供的算法和策略解决社会各个领域的难题,目前已有超过30000名数据科学从业者与学习者注册。大多数参赛者都是物理、计算机领域经验丰富的研究人员。平台目前已成功举办了金融、交通、天气、人力资源等领域的20余场大数据竞赛,为机器学习、复杂网络分析、趋势预测、关系挖掘、图像识别、数据可视化等主流的数据科学问题的实际运用提供了更好的算法和解决方案。
免责声明:本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时,应及时向本网站提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明。本网站在收到上述法律文件后,将会依法尽快联系相关文章源头核实,沟通删除相关内容或断开相关链接。