大规模社交网络分布式表示学习研究与应用

基本信息
批准号:61802424
项目类别:青年科学基金项目
资助金额:21.00
负责人:汪祥
学科分类:
依托单位:中国人民解放军国防科技大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:谭霜,邹丹,邓璐,朱俊星,全拥,刘强,陈睿,朱啸宇
关键词:
分布式表示学习社交网络网络表示学习短文本表示模型
结项摘要

Representation is one of the basic key problems of mining social network using machine learning methods. The recent innovation of distributed representation learning, which represents words, texts and users as low-dimensional dense vectors and maintains the semantic information of words, texts and structural relationship of users, points out a new way for the representation and analysis of large-scale social network. In social network, the number of nodes is extremely large, while the texts are very short and containing many new words and low-frequency words. But the current distributed representation model is mainly designed for the traditional long text and small networks. They ignore the massive social text information of nodes and distributed representation learning of user relations. This proposal takes the distributed representation learning of short text, user and user relationship in social networking as the research objects. We study the distributed multi-source fusion representation of short text based on the external knowledge, and the distributed representation of users using network structure and user texts based on the learnt word vectors. We also study the distributed representation of user relations based on the interactive information content and build an experimental system for representation learning and applications in large-scale social networks. Our studies are the basic foundation of large-scale social network analysis and mining.

表示问题是机器学习算法高效应用到社交网络分析挖掘的关键基础问题之一,近年来兴起的分布式表示学习将词语、文本、用户表示为低维稠密向量,并保存词语、文本的语义信息和用户的网络结构信息,为大规模社交网络的表示建模与快速计算指明了方向。但是,社交网络规模异常庞大而文本内容具有短文本、新词多、低频词多等特点,而当前分布式表示模型主要针对传统长文本和小规模网络进行设计,忽视了网络节点的丰富文本内容和用户关系的分布式表示学习。本项目以社交网络短文本、用户以及用户关系的分布式表示学习为研究对象,研究基于外部知识的多源融合短文本分布式表示模型,在训练得到的词向量基础上,研究基于网络信息流和博文内容的社交网络用户分布式表示模型和当前罕有研究的交互信息内容敏感的用户关系分布式表示模型,并构建大规模社交网络表示学习应用验证原型系统,为大规模社交网络分析挖掘奠定基础。

项目摘要

针对社交网络规模异常庞大而文本内容具有短文本、新词多、低频词多等特点,研究大规模社交网络分布式表示学习技术。首先,研究社交网络用户短文本与图片分布式表示模型Vec2vec,实现对社交网络内容的表示学习。其次,研究社交网络用户分布式表示模型及其应用技术,突破了基于实体表示聚合的知识图谱实体链接算法和基于用户命名模式的多视角的中文用户实体对齐技术等。再次,研究社交网络用户关系分布式表示模型,突破了基于预训练语言模型的用户关系联合抽取链接模型、基于用户关系交互的静态知识图谱表示推理模型等。最后,社交网络用户关系分析原型系统,实现对上述三项研究成果的应用检验。本项目的实施,将为大规模社交网络的高效计算奠定基础,研究成果可应用于舆情分析、网络营销推广、开源情报分析等应用中。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015

汪祥的其他基金

批准号:11461046
批准年份:2014
资助金额:36.00
项目类别:地区科学基金项目
批准号:11101204
批准年份:2011
资助金额:18.00
项目类别:青年科学基金项目

相似国自然基金

1

动态社交网络表示学习理论与应用

批准号:61702447
批准年份:2017
负责人:杨洋
学科分类:F0607
资助金额:25.00
项目类别:青年科学基金项目
2

大规模复杂信息网络的表示学习与应用

批准号:61772302
批准年份:2017
负责人:栾焕博
学科分类:F0211
资助金额:63.00
项目类别:面上项目
3

大规模知识图谱的分布式表示学习、知识获取与推理应用

批准号:61572273
批准年份:2015
负责人:刘知远
学科分类:F0211
资助金额:67.00
项目类别:面上项目
4

基于表示学习的跨社交网络用户对齐研究

批准号:61806031
批准年份:2018
负责人:刘立
学科分类:F0606
资助金额:24.00
项目类别:青年科学基金项目