基于数据特性分析的机器学习建模与算法研究

基本信息
批准号:61673249
项目类别:面上项目
资助金额:61.00
负责人:王文剑
学科分类:
依托单位:山西大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:郭虎升,门昌骞,姜高霞,田萌,许行,张文凯,薛松,祁晓博
关键词:
模型评价正则化模型机器学习学习算法
结项摘要

Machine leaning is the core supporting technology for big data analysis and processing, so further researches on machine learning modeling and algorithms for big data have important theoretical significance and application value. Aiming at some challenges in machine learning such as large scale and poor quality of data, the model constructing, learning and measurements based on data characteristic analysis will be studied deeply and systematically. The main contents of the project include: (1) Instruction of penalty factor in regularization machine learning models, and analysis of error bounds theory and properties. (2) Uniform framework of kernel selection based on orthogonal polynomial. (3) Estimation of generalization performance of algorithms by estimating cross-validation variance. (4) Analysis of relationships and pseudo relevance embedding in data. (5) Developing the high efficient machine learning algorithms for some special applications. The research results will not only enrich the related theories and algorithms of big data machine learning, but provide the important technical supports for practical applications of machine learning in big data as well.

机器学习是大数据分析与处理的核心支撑技术,深入研究大数据机器学习建模与算法具有重要的理论意义与应用价值。本项目针对数据的大规模、低质量等给机器学习带来的挑战,基于数据的特性分析,就模型构建、模型学习、模型评价等机器学习核心科学问题开展系统深入的研究。主要内容包括:(1)正则化机器学习模型中正则项的构造及其性质;(2)基于正交多项式的核函数构造统一框架;(3)基于交叉验证方差估计的学习算法泛化误差估计;(4)数据的相关性分析;(5)高效机器学习算法设计及应用。项目研究成果将丰富大数据机器学习的相关理论与算法,为机器学习的大数据实际应用提供重要的技术支撑。

项目摘要

本项目围绕大数据的分类、聚类、预测等数据分析和挖掘任务,针对复杂数据的大规模、低质量给传统机器学习方法带来的挑战,就机器学习的模型构建、模型学习、模型评价等机器学习核心科学问题开展了系统深入的研究,通过对数据进行特性分析,构建了有效的学习模型和高效的学习算法,并应用于服务计算、社会网络等领域。项目研究成果丰富了大数据机器学习的相关理论与算法,为机器学习的大数据实际应用提供了重要的技术支撑。项目组发表多篇高水平学术成果,培养多名博士、硕士研究生。项目研究成果已达到研究目标。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018

王文剑的其他基金

批准号:60673095
批准年份:2006
资助金额:24.00
项目类别:面上项目
批准号:60975035
批准年份:2009
资助金额:33.00
项目类别:面上项目
批准号:61273291
批准年份:2012
资助金额:79.00
项目类别:面上项目

相似国自然基金

1

面向机器学习任务的优化建模与算法研究

批准号:11871447
批准年份:2018
负责人:杨周旺
学科分类:A0405
资助金额:55.00
项目类别:面上项目
2

基于健康数据分析的半监督在线学习血糖预报建模算法研究

批准号:61503208
批准年份:2015
负责人:纪俊
学科分类:F0603
资助金额:19.00
项目类别:青年科学基金项目
3

基于机器学习和优化建模的视频大数据感知编码研究

批准号:61801303
批准年份:2018
负责人:高伟
学科分类:F0108
资助金额:26.00
项目类别:青年科学基金项目
4

基于机器学习的运动捕获数据分析与重用技术研究

批准号:61070140
批准年份:2010
负责人:魏迎梅
学科分类:F0209
资助金额:27.00
项目类别:面上项目