With the prevalent of social media and mobile Internet applications, the problem of multi-label classification of the nodes in the heterogeneous information networks which consist of multiple types of relationships between nodes has became one of the most important research issues in the domain of data mining and social network analysis. The key difficulties of this issue lie in: there is only limited number of labeled nodes in the networks, and thus it is crucical to use both labeled and unlabeled data together to exploit the correlations of nodes and labels simultaneous to enhance the classification performance. To tackle this issue, we proposed the following research contents: (1) meta-path based heterogeneous information networks representation; (2) semi-supervised learning in heterogeneous information networks by analyzing node correlations; (3) semi-supervised learning of multi-label data by analyzing label dependencies; (4) the design of algorithm for multi-label classification in the heterogeneous information networks. The novelty of this proposal are: meta-path based representation model; probabilistic latent semantic analysis based semi-supervised learning algorihtm; multi-label classification of heterogeneous information networks by analyzing node correlations and label dependencies.
随着数字社会化新媒体和移动互联网应用的普及,如何识别不同社会网络中个体的兴趣爱好成为数据挖掘领域广泛关注的问题。该问题可以转换为多关系图中节点的多类标分类问题,其关键研究难点是:多关系图通常只有少量学习样本,而且节点之间、类标之间存在复杂关联关系,必须结合有类标和无类标节点信息学习节点之间、类标之间的关联性,从而构建高性能的分类模型。本课题围绕这个问题,研究基于概率语义分析方法的多关系图多类标分类模型,主要内容包括:(1)基于元路径的多关系图表示模型;(2)基于节点之间相关性的多关系图半监督学习模型;(3) 基于类标之间相关性的多类标半监督学习模型;(4) 面向多关系图的多类标分类算法设计。课题的创新在于:基于元路径的表示模型,基于概率语义分析方法的半监督学习方法;基于节点之间+类标之间相关性的多关系图的多类标分类方法。
整个项目期间,针对本工作的主要研究内容,发表了共19篇论文,其中期刊论文6篇,会议论文12篇。申请了3项专利,获得了5项软件著作权。.具体而言,相关的研究成果及其科学意义主要包括以下几个部分:1.在多关系图异构数据统一表征方面,项目负责人提出了基于相关性判别式学习、基于最优传输理论的半监督学习、构建转移概率图等方法,为异构多关系图数据表征提供有效解决方案。2.在多源数据协同学习方面,项目负责人提出了多源数据的集成学习算法,以实现多源数据的快速分类。3.在异构多关系图的关联理解方面,项目负责人提出了构建“异构网络图”,基于半监督异构网络图的异构多关系图数据分类算法。4.在异构多关系图应用拓展方面,结合异构多关系图数据应用问题的特点,成功地将算法应用于生成图像内容的语言问答序列、图像和文本数据多标记分类等领域问题中。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
多关系图的多类标分类关键技术研究
多尺度概率图模型与SAR图像分类的研究
树形子图的统一向量表示及其多类标分类关键技术研究
基于概率图模型和语义描述的人群行为分析