Distributional symbolic data analysis provides a new and effective idea for processing and analyzing large-scale data. It has a wide range of applications in engineering, economic management, financial risk and other fields. This project uses massive time series data analysis in the financial field as the application background and explores distributional symbolic data modeling theory and technical methods with time-series features. In allusion to the problem of the algebraic operation of the existing distributional symbolic data being inaccurate and non-closed, this project starts with the algebraic basis and operational rules of the distributional symbolic data, and establishes the algebraic space of distributional symbolic data that satisfies the constraints and basic assumptions in the probability space. On this basis, the modeling theory and estimation method of one-dimensional time series model and multi-dimensional panel model of distributional symbolic data are systematically analyzed. Combined with the actual data in the financial field, it is proposed to carry out an empirical analysis of the fluctuation characteristics and forecasting of the stock market based on high-frequency data. The implementation of these studies provides a new and more effective analysis tool for modeling and predicting time series data of complex systems in the context of big data.
分布型符号数据分析为处理和分析大规模数据提供了一种全新而有效的思想,在工程技术、经济管理、金融风险等领域都有很广泛的应用前景。本项目以金融领域的海量时序数据分析为应用背景,探索带有时序特征的分布型符号数据的建模理论和技术方法。针对现有分布型符号数据代数运算不精确和不封闭的问题,本项目首先从分布型符号数据的代数基础和运算规则入手,建立满足概率空间中的约束条件和基本假设的分布型符号数据的完备代数空间。在此基础上,系统地分析分布型符号数据的一维时间序列模型和多维面板模型的建模理论和估计方法。结合金融领域的实际数据,拟开展基于高频数据的中国股市波动特征和预测研究的实证分析。这些研究的实现,为大数据环境下的复杂系统时序数据的建模和预测提供一种新的更加有效的分析工具。
符号数据分析为处理大规模数据提供了一种全新而有效的思想,在工程技术、经济管理、金融风险等领域都有很广泛的应用前景。分布型符号数据是符号数据的一种重要类型,它包含了定量符号数据的大多数类型。由于分布型符号数据的每个单元是概率密度函数,表征的是相对信息,经典的函数运算并不适用。为此,本项目基于贝叶斯空间代数,推导分布型符号数据向量代数体系。采用的运算定义充分考虑了概率密度函数的特性,是艾奇逊几何的拓展,在其内积定义下概率密度函数空间构成一个完备的内积空间,具有优良的代数性质。在此基础上,针对横截面数据,提出了贝叶斯空间中的多元线性回归模型,并结合函数数据分析技术,提出了协变量是概率密度函数的线性回归模型。针对时序数据,基于中心对比数变换和贝叶斯空间理论的提出分布型时序数据的模型建立、模型检验等一系列方法,针对面板数据,研究了分布型符号数据面板数据的混合模型和固定效应模型及其相应的估计方法。结合实际数据,将所提的模型方法应用到金融市场、国民经济领域等实证研究中。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
金融时序数据的动态分位数回归建模及其应用
金融时序数据的遗忘理论研究
基于粒计算的多元时序数据语义建模、算法及应用研究
符号网络理论研究与应用