Network data analysis plays a more and more important role in abundant applications, such as user profiling, personalized marketing and financial risk management. This enables the network data be widely collected and analyzed. Although the network data analysis is useful in a wide range of applications, it posts new challenges to conventional statistical analysis. Classical statistical analysis usually relies on the independent assumption, however, this assumption does not hold for network data. Based on the characteristics of the network data, this project aims to contribute to the following three parts: (1) spatial regression for large scale network data and its efficient computation; (2) high dimensional time series modeling with network structure information; (3) variable selection and important nodes detection method for large scale network data. This project tries to establish the analysis framework for network data in the aspects of regression and time series analysis. Specifically, part (1) focuses on the spatial autoregression model for large scale network data and efficient computation especially when the network structure is sparse. Part (2) aims to build network vector autoregression models for high dimensional time series data. Lastly, part (3) investigates the variable selection and important nodes detection techniques for network data. The research results could be widely applied to real data analysis, thus have great practical values.
近年来,网络数据在用户画像、个性化营销、金融风险建模等多个领域起到重要作用,从而被大规模收集、存储以及分析。网络数据建模有广泛而巨大的应用场景,同时也对统计分析方法提出新的挑战。传统的统计学分析,往往依赖于样本独立性假设,这难以直接应用于网络数据。针对复杂网络数据,本项目将致力于如下三个问题的研究:(1)大规模网络数据空间自回归模型建模及高效计算;(2)大规模网络数据的高维时间序列建模方法;(3)大规模网络数据的变量选择方法。本项目试图通过以上三个方面研究,建立网络数据回归以及动态数据建模方面的分析框架和方法。其中,问题一将着重探讨给定网络稀疏性假设时,空间自回归模型的高效估计和渐近性质研究;问题二将探讨利用网络结构信息对高维时间序列数据建模;问题三将研究给定网络结构时重要变量及节点的选择方法。本项目研究成果可广泛应用实际数据分析,有非常实际的价值。
近年来,网络数据在用户画像、个性化营销、金融风险建模等多个领域起到重要作用,从而被大规模收集、存储以及分析。网络数据建模有广泛而巨大的应用场景,同时也对统计分析方法提出新的挑战。针对复杂网络数据,本项目致力于如下三个问题的研究:(1)大规模网络数据空间自回归模型建模及高效计算;(2)大规模网络数据的高维时间序列建模方法;(3)大规模网络数据的变量选择方法。本项目试图通过以上三个方面研究,建立网络数据回归以及动态数据建模方面的分析框架和方法。其中,问题一着重探讨给定网络稀疏性假设时,空间自回归模型的高效估计和渐近性质研究。具体而言,项目研究了针对双模网络、带网络结构的函数型数据、离散型动态数据的建模及计算问题。问题二探讨利用网络结构信息对高维时间序列数据建模。具体而言,项目探索了针对分位数自回归模型的网络数据建模方案。在考虑网络节点存在异质性的前提下,项目提出了多种基于社群或分组的结构的网络自回归模型。问题三主要研究给定网络结构时大规模数据的重要变量选择方法。本项目研究成果应用于污染物排放异常值检测、在线营销对话文本建模等。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
"多对多"模式下GEO卫星在轨加注任务规划
基于主体视角的历史街区地方感差异研究———以北京南锣鼓巷为例
大规模生物数据计算的优化建模与高效算法研究
大规模社交网络中统计建模及假设检验
加权网络数据建模及其统计推断
有向网络数据统计抽样及建模问题的研究