面向多源异构征信大数据的信用评分理论、方法与应用研究

基本信息
批准号:71901179
项目类别:青年科学基金项目
资助金额:18.00
负责人:唐静静
学科分类:
依托单位:西南财经大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
哈希学习多视角学习信用评分支持向量机多源异构数据
结项摘要

Research on the models, theory and algorithms of big-data-driven credit reporting plays an important role in reducing credit risk and improving management decision-making level. However, in the current Internet era, credit data presents the characteristics of multi-source, heterogeneity and high dimensionality. How to effectively process and integrate these data and deeply excavate the credit model of credit subject is an urgent problem to be solved. Therefore, this proposal will focus on design and development of the multi-source and heterogeneous data reduction model and the credit scoring model for Credit Reporting System. We firstly propose a hash-based multi-source and heterogeneous data reduction model to obtain compact hash coding and consistent hash structure, which realizes the goal of data and dimensionality reduction. This model establishes the foundation for the construction of the credit scoring model. Then, based on support vector machine, a credit scoring model for the multi-source and heterogeneous data will be proposed, and the corresponding properties will be analyzed by using the optimization theory and methods. Further more, we explore the efficient algorithm to solve the model. Our research will enrich and improve the theory and the methodology of big-data-driven Credit Reporting System. On the basis of a Credit Scoring project, we perform the applications on massive amounts of multi-source and heterogeneous credit data. The outcome of the proposed project will contribute to the development of Credit Reporting System. This research not only has important scientific significance, but also has a broad application prospect.

针对大数据征信的模型、理论与算法方面的研究对降低信贷风险、提高管理决策水平具有重要的作用。然而,当前互联网时代,征信数据呈现多源异构和高维度的特点。如何对这些数据进行有效融合,深度挖掘信用主体的信用模式是一个亟待解决的问题。因此,本研究将致力于多源异构征信大数据驱动的数据约简模型与信用评分模型的研究。通过提出基于哈希学习的多源异构征信大数据约简模型,得到紧凑的哈希编码和一致的哈希结构,实现数据压缩与降维,为下一步信用评分模型的构建奠定基础。基于支持向量机,构建多源异构征信大数据信用评分模型,并从最优化理论与方法的角度进行分析,探索高效的计算方法,提升和完善大数据征信的理论研究和方法体系。在应用实践上,以申请者正在进行的信用评估项目为基础,进行实证研究,检验模型与算法的有效性和可行性。本项目的研究成果将为征信体系的发展做出贡献。因此,该研究不但具有重要的科学意义,还具有广阔的应用前景。

项目摘要

针对大数据征信的模型、理论与算法方面的研究对降低信贷风险、提高管理决策水平具有重要的作用。本项目以多源异构征信大数据为研究对象,围绕征信数据存在数据缺失、标签标注代价高昂、类别高度不均衡、噪声污染等问题,以统计学习、机器学习等为理论基础,以最优化为工具,运用支持向量机、多视角学习、迁移学习、不均衡学习等方法,提出行之有效的模型和算法,并进行理论分析和实证研究。具体来说,针对数据缺失问题,本项目提出Reduced多视角支持向量机,以充分挖掘多视角缺失数据中的有用信息。针对标签标注代价高昂问题,本项目提出基于Coupling损失和自利用特权信息的多视角迁移学习模型,以实现不同来源数据的知识迁移和复用。针对类别高度不均衡和噪声污染问题,本项目提出基于BLINEX损失的代价敏感不均衡学习模型和基于Stein损失的代价敏感不均衡学习模型。利用集成学习技术,可将这两个模型扩展到多视角情形上,构建多视角信用评分框架。结合多视角数据的语义一致性和相容互补性的特点,本项目提出基于LINEX损失的多视角支持向量机、基于BLINEX损失的多视角支持向量机、基于一致互补性的多视角最小二乘支持向量机等,这些模型可以结合自步学习或采样技术等来进行信用风险评估。此外,本项目还利用多示例学习和深度学习等前沿技术进行拓展研究,并提出了多视角多示例度量学习模型和多视角教师学生网络。总之,该项目不但具有重要的科学意义,还具有广阔的应用前景。在理论上,丰富和完善现有的大数据征信的理论研究和方法体系。在实践上,本项目的研究成果不仅有助于提升金融风险监控的科学化管理水平和效率,还为完善征信体系提供重要的理论基础、技术支撑和应用范例。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
5

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018

唐静静的其他基金

相似国自然基金

1

面向互联网信贷的基于多源大数据的个人信用评分关键技术

批准号:71671178
批准年份:2016
负责人:刘莹
学科分类:G0112
资助金额:48.00
项目类别:面上项目
2

面向不确定性多源异构数据融合分类方法的小微企业信用评级研究

批准号:71901044
批准年份:2019
负责人:陈伟杰
学科分类:G0112
资助金额:18.00
项目类别:青年科学基金项目
3

面向金融市场的多源异构数据知识表示与应用研究

批准号:71771204
批准年份:2017
负责人:龙文
学科分类:G0112
资助金额:50.00
项目类别:面上项目
4

大数据情境下的国家级信用平台及金融信用创新应用研究-长三角征信链创新示范应用与实践

批准号:92146002
批准年份:2021
负责人:柴洪峰
学科分类:G0119
资助金额:60.00
项目类别:重大研究计划