面向多源多视图数据的结构化预测模型研究

基本信息
批准号:61902127
项目类别:青年科学基金项目
资助金额:29.00
负责人:周昉
学科分类:
依托单位:华东师范大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
预测模型结构回归与分类数据挖掘应用多视图学习
结项摘要

The research on structured prediction models for multi-source multi-view data has important and practical significance in the era of big data. Integrating objects’ multi-view description theoretically give prediction models a broader and more comprehensive analysis space, thereby improving prediction accuracy. However, due to the diversity of data sources and views, data has characteristics of density and sparsity coexistence, multiple feature spaces and massive objects coexistence, redundant features and incomplete data coexistence, which bring great challenges to the existing prediction models. This project aims to improve prediction accuracy and learning efficiency of models, and develop effective, fast and robust multi-source multi-view structured prediction models. The research will focus on developing a variety of structured prediction models, which utilize the correlations among objects and correlations among views, for multi-source multi-view datasets, in order to 1) improve prediction accuracy; 2) deal with missing data; and 3) improve models’ learning efficiency. The proposed models will be applied to analyzing e-commerce data, social media data and electronic medical record data, providing theoretical and technical support for multi-source multi-view data. The team members have related research experience. The project has clear objectives and strong feasibility.

开展面向多源多视图数据的预测模型研究在大数据时代具有重要而实际的意义。综合研究对象多视图的描述,理论上能赋予预测模型更广阔全面的分析空间,从而提高预测的准确度。然而,由于数据源和视图的多样性使得数据中存在数据稠密与稀疏并存、多特征空间与海量并存、冗余与缺失并存的问题,给现有预测模型带来了巨大的挑战。本课题以提高模型的预测准确度和学习效率为目标,研发高效、快速、鲁棒的多源多视图结构化预测模型。研究重点:研发多种面向多源多视图数据的结构化预测模型使其能挖掘并有效利用研究对象及视图之间的相关性,来实现1)提高预测的准确度;2)应对数据缺失问题;3)加快模型的学习效率。所研发的模型将应用于电子商务数据、社交媒体数据和电子病历数据分析与研究中,为针对多源多视图数据预测提供理论和技术支持。课题组具有较好的相关研究基础,项目目标明确,可行性较强。

项目摘要

多源多视图学习在大数据时代具有重要的意义。综合研究对象多视图的描述,理论上能赋予预测模型更广阔全面的分析空间,从而提高预测的准确率。然而,由于多源多视图数据具有数据量大 、数据不完整、数据异构三个特点,给现有预测模型带来了巨大的挑战。本项目以这三个特点为切入点,以提高模型的预测准确率和学习效率为目标,针对不同问题研发相应的具有高效、快速、鲁棒性的多源多视图结构化预测模型。本项目的主要研究内容:1.提出了距离相关系数来捕获视图间真实的相似性,从而解决多视图数据中不同视图维度不同、数据样本量大等挑战,有效利用隐藏在数据中的研究对象(以及视图)之间的关联信息,从而提高预测的准确率;2.提出了一种新的多视图分类方法,其通过使用视图间相似性保存机制和样本间一致性保存机制,能够同时捕获(1)不同视图对间的相似性信息以及(2)不同样本对间的标签一致性信息,以此揭示视图间的相互关系,同时提升所学表征的判别能力。3. 针对多视图数据存在数据缺失问题,提出了一种新的多视图分类算法,并将其应用到根据电子病历数据从而来预测患者的疾病风险。4. 我们将所研发的多视图数据分类算法应用到异常检测和商户流失的真实场景中,有效的提高了模型在海量数据上的学习效率以及模型预测结果的正确率。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
4

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
5

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019

周昉的其他基金

相似国自然基金

1

面向多源异构数据的多聚类通用模型及安全高效算法研究

批准号:61802112
批准年份:2018
负责人:赵雅靓
学科分类:F0214
资助金额:24.00
项目类别:青年科学基金项目
2

面向多源数据的多粒度计算方法研究

批准号:61603173
批准年份:2016
负责人:林国平
学科分类:F0607
资助金额:22.00
项目类别:青年科学基金项目
3

面向不完整信息的多视图数据表示、恢复与学习

批准号:61603193
批准年份:2016
负责人:杨琬琪
学科分类:F0603
资助金额:21.00
项目类别:青年科学基金项目
4

面向多源大数据的鲁棒聚类模型与算法研究

批准号:61502289
批准年份:2015
负责人:杜亮
学科分类:F0201
资助金额:21.00
项目类别:青年科学基金项目