The traditional prediction models, including multivariate linear model (MLR), logistic regression (LR) and linear discriminant analysis (LDA), always break down when handling such financial data with high dimension, strong correlated characteristic and group effect. To improve them, the project aims to propose and build sparse models based on regularization techniques and Bayesian analysis. These novel models can select variables simultaneously while estimating model parameters. The properties of penalty functions will be analyzed systematically, then l1 penalty and SCAD (Smoothly Clipped Absolute Deviation) penalty will be introduced into the related prediction models. The hybrid penalized multivariate optimization algorithms will be put forward to solve those problems. In addition, the Bayesian variable selection mechanisms (selection of parameter distribution prior, model searching and sampling algorithms) and the relation between the two approaches will also be explored, so the unified variable selection architecture can be obtained. On the basis of the built models, the financial distress prediction empirical analysis can be implemented on the data (such as financial ration, cash flow .etc) from listed manufacturing companies in Shanghai and Shenzhen stock exchange markets with the toolbox developed by our research group. A series of simulation experiments will be done to evaluate the performance of those models, including prediction accuracy and their interpretability.
针对传统财务预警模型(多元线性模型MLR、逻辑回归LR和线性判别分析LDA)无法处理高维、变量相关性大且呈组效应数据问题,本项目拟使用正则化技术和贝叶斯分析开展上市公司财务预警稀疏模型研究,在估计模型参数的同时实现变量选择。在对惩罚函数的特性进行系统分析和梳理的基础上,使用两种具体的稀疏惩罚函数(l1范数及SCAD惩罚)建立模型,结合惩罚多变量优化算法的研究提出和改进模型求解算法;对贝叶斯变量选择机制(模型参数先验、模型搜索及抽样算法等)进行深入研究,建立统一的贝叶斯变量选择框架,对正则化和贝叶斯变量选择技术及其联系进行分析讨论;使用沪深股市制造业上市公司的财务比率、现金流量等数据,进行模型学习和开展财务困境预报实证分析,开发财务预警工具箱,进行系列仿真实验和性能评判,考察模型的解释性和预报精度。
本项目围绕机器学习中的低秩稀疏模型及其优化算法进行分析研究,系统地学习正则化技术、惩罚函数和收缩函数以及它们的特点,关注这类模型方法在财务预警、金融分析及其它社会经济科学领域的应用。建立平滑削边绝对偏离(SCAD)惩罚截断Hinge损失SVM,结合沪深股市上市公司财务数据进行财务预警实证研究;构建图正则化MNMF(Graph Regularized MNMF,GMNMF)模型,并提出模型的迭代求解算法,将该模型用于中文邮件分类,获得了较好的分类效果;提出高斯混合模型拟合截断数据的方法,使用分裂与合并操作改进算法,将RJMCMC算法用于高斯混合模型的求解并加以改进调整,得到了对应的层次模型;结合股票收益率数据分布尖峰后尾特性,建立q-高斯分布投资组合模型,并同时考虑资产收益率序列的相依关系,结合Copula理论、极值分布理论建立集成的算法框架,以便衡量资产组合风险和收益;开展多重检验相关理论及相关问题(正确原假设比例的估计算法)的研究,在正确原假设比例估计的均值算法中融合三次样条方法,提出用参数混合模型来估计真正原假设的比例,分别在均匀数据集、非均匀数据集和隐藏相依结构的基因表达数据上进行模拟研究;针对Mean-CVaR模型存在优化解微权值数目过多的问题,造成操作性下降,提出在Mean-CVaR模型引入权值分离性约束建立稀疏投资组合模型,结合上证50指数股票进行实例分析;对金融时间序列的风险因子进行分析,建立稀疏风险因子模型,结合沪深上市公司的收益率数据分析不同上市公司与相应行业指数的依赖关系;其它的研究包括了多服务器架构下认证与秘钥协商协议和大规模MIMO异构网能效型小区选择等方面。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
涡度相关技术及其在陆地生态系统通量研究中的应用
监管的非对称性、盈余管理模式选择与证监会执法效率?
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
动态离散选择模型的贝叶斯估计与变量选择
基于贝叶斯变量选择的生物标志物筛选方法与策略研究
上市公司财务预警模式创新研究
正则化结构方程模型的贝叶斯分析及其在心理学研究中的应用