The reasonable representation of network data plays an important role in the complexity reduction of network data mining. At present, researches on static network representation are rich, but the research on dynamic network representation is quite rare. This project focuses on the study of dynamic network representation learning with three critical problems, i.e. adaptivity, law of network evolution and stream computing, including: (1) By extending the classical transductive learning approach, our proposed model can not only efficiently generalize the new arriving nodes, but also adjust the model parameters automatically, which ensures the efficiency and effectiveness of network embedding in dynamic environment. (2) Considering the importance of network evolution pattern on dynamic network embedding, we propose pattern-preserved network embedding approach, which integrates the network evolution pattern from macroscopic , midscopic and microscopic aspects into the dynamic network embedding. (3) We study the dynamic network representation in the streaming environment, establish an elastic multi-scale dynamic network representation model, and propose an approach based on network decomposition and sampling technology, which ensures the linear time and space complexity. (4) In order to satisfy the application of entity disambiguation in the medical big data, we develop the entity disambiguation software system based on the research results on the network representation learning on the disease network data set, and apply the system in cooperative medical institutions.
有效的网络数据表示是降低网络大数据分析问题复杂性的关键。当前,静态网络表示学习研究成果丰富而动态较少。项目围绕动态网络表示学习的自适应性、演变模式保持和在线“流”式计算三个关键问题展开研究,包括:(1)研究动态场景下静态网络表示学习的近似扩展方法,提出高效的直推式动态网络表示学习模型;结合图卷积神经网络模型以及在线学习理论,提出具有自适应能力的归纳式动态网络表示学习模型;(2)考虑网络动态演变模式对网络表示能力的积极效用,分析多尺度(微观、介观和宏观)网络演变模式与规律,提出融合演变模式的动态网络表示模型与方法;(3)研究面向流环境下的网络表示学习模型,提出具有大规模并行数据处理能力的在线计算模型和计算方法,解决流环境下网络表示学习的在线计算难题;(4)面向医疗大数据实体消歧的应用需求,通过在伴病网络数据集上应用网络表示学习研究成果,研制医疗大数据实体消歧软件系统,并在真实应用场景验证。
本项目主要开展了大规模图的表征学习研究。重点解决了如下两方面的问题:(1)大规模动态图的高效嵌入方法:图嵌入的直推式(Transductive)学习特性,在对大规模动态图表征时,即使仅有部分节点发生改变,现有的嵌入方法需要对全部N个节点进行表征,面临O(N3)复杂性的矩阵分解过程,很难应用到大规模动态图场景。代表性成果包括:提出的理论上等价于经典Skip-gram模型的可解耦的动态网络嵌入表示学习方法,仅对模型中部分参数学习而达到整体优化的目的,使得表征结果随着图动态变化而自适应变化,解决了大规模图嵌入的动态性表征难题,被国际知名人工智能期刊JAIR副主编、加拿大滑铁卢大学教授Pascal Poupart评价为“著名工作(Notable work)”。(2)图神经网络表达能力提升机制:当前主流的图神经网络都是基于消息传递的信息聚合机制,但所有基于该机制的图神经网络模型的表达能力上界都被WL-test图同构测试能力所限制,迫切需要寻找突破这一理论性能瓶颈的有效机制。代表性成果包括:创新性提出将分子模拟抽象为图神经网络(哈密顿引擎),将生物学领域知识融合到图神经网络建模中,联合学习有机小分子的构型构象与生化性质,提升模型表达能力,大幅改进现有高通量筛选模型,为药物发现提供了新的解决方案。此项工作对于进一步优化基于3D信息的分子表征具有很大的借鉴价值。..发表论文33篇:包含CCF A论文22篇,CCF B类论文8篇。获得知识工程和数据挖掘领域国际知名会议CIKM2019和ADMA2020最佳论文提名奖和最佳论文奖。获的北京市自然科学奖二等奖(2021,排名2/3)、中国计算机学会自然科学奖二等奖(2020,排名2/2),相关研究成果多次受邀在ICPDS2021、IEEE-ASID2020、ADMA2019等重要国际学术会议做特邀报告。2022年,在本领域研究成果的基础上,申请人推动成立了“北大-阿里妈妈人工智能创新联合实验室”,任实验室主任,重点开展图表征学习的研究以及在阿里电商推荐系统中的应用。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
现代优化理论与应用
高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析
铁路大跨度简支钢桁梁桥车-桥耦合振动研究
动态社交网络表示学习理论与应用
基于属性表示学习的轨迹挖掘关键技术研究
基于对抗表示学习的知识迁移关键技术研究
基于异构文献网络表示学习的个性化引文推荐技术研究