基于数据特性分析的机器学习建模与算法研究

基本信息

批准号：61673249

项目类别：面上项目

资助金额：61.00

负责人：王文剑

学科分类：

依托单位：山西大学

批准年份：2016

结题年份：2020

起止时间：2017-01-01 - 2020-12-31

项目状态：已结题

项目参与者：郭虎升,门昌骞,姜高霞,田萌,许行,张文凯,薛松,祁晓博

关键词：

模型评价正则化模型机器学习学习算法

结项摘要

Machine leaning is the core supporting technology for big data analysis and processing, so further researches on machine learning modeling and algorithms for big data have important theoretical significance and application value. Aiming at some challenges in machine learning such as large scale and poor quality of data, the model constructing, learning and measurements based on data characteristic analysis will be studied deeply and systematically. The main contents of the project include: (1) Instruction of penalty factor in regularization machine learning models, and analysis of error bounds theory and properties. (2) Uniform framework of kernel selection based on orthogonal polynomial. (3) Estimation of generalization performance of algorithms by estimating cross-validation variance. (4) Analysis of relationships and pseudo relevance embedding in data. (5) Developing the high efficient machine learning algorithms for some special applications. The research results will not only enrich the related theories and algorithms of big data machine learning, but provide the important technical supports for practical applications of machine learning in big data as well.

机器学习是大数据分析与处理的核心支撑技术，深入研究大数据机器学习建模与算法具有重要的理论意义与应用价值。本项目针对数据的大规模、低质量等给机器学习带来的挑战，基于数据的特性分析，就模型构建、模型学习、模型评价等机器学习核心科学问题开展系统深入的研究。主要内容包括：（1）正则化机器学习模型中正则项的构造及其性质；（2）基于正交多项式的核函数构造统一框架；（3）基于交叉验证方差估计的学习算法泛化误差估计；（4）数据的相关性分析；（5）高效机器学习算法设计及应用。项目研究成果将丰富大数据机器学习的相关理论与算法，为机器学习的大数据实际应用提供重要的技术支撑。

项目摘要

本项目围绕大数据的分类、聚类、预测等数据分析和挖掘任务，针对复杂数据的大规模、低质量给传统机器学习方法带来的挑战，就机器学习的模型构建、模型学习、模型评价等机器学习核心科学问题开展了系统深入的研究，通过对数据进行特性分析，构建了有效的学习模型和高效的学习算法，并应用于服务计算、社会网络等领域。项目研究成果丰富了大数据机器学习的相关理论与算法，为机器学习的大数据实际应用提供了重要的技术支撑。项目组发表多篇高水平学术成果，培养多名博士、硕士研究生。项目研究成果已达到研究目标。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：

发表时间：2021

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：10.14050/j.cnki.1672-9250.2017.02.014

发表时间：2017

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

王文剑的其他基金

批准号：60673095

批准年份：2006

资助金额：24.00

项目类别：面上项目

批准号：60975035

批准年份：2009

资助金额：33.00

项目类别：面上项目

批准号：61273291

批准年份：2012

资助金额：79.00

项目类别：面上项目

相似国自然基金

面向机器学习任务的优化建模与算法研究

批准号：11871447

批准年份：2018

负责人：杨周旺

学科分类：A0405

资助金额：55.00

项目类别：面上项目

基于健康数据分析的半监督在线学习血糖预报建模算法研究

批准号：61503208

批准年份：2015

负责人：纪俊

学科分类：F0603

资助金额：19.00

项目类别：青年科学基金项目

基于机器学习和优化建模的视频大数据感知编码研究

批准号：61801303

批准年份：2018

负责人：高伟

学科分类：F0108

资助金额：26.00

项目类别：青年科学基金项目

基于机器学习的运动捕获数据分析与重用技术研究

批准号：61070140

批准年份：2010

负责人：魏迎梅

学科分类：F0209

资助金额：27.00

项目类别：面上项目

基于数据特性分析的机器学习建模与算法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于国产化替代环境下高校计算机教学的研究

基于铁路客流分配的旅客列车开行方案调整方法

一种基于多层设计空间缩减策略的近似高维优化方法

基于综合治理和水文模型的广西县域石漠化小流域区划研究

新型树启发式搜索算法的机器人路径规划

王文剑的其他基金

SVM的核选择方法及其应用研究

粒度支持向量机学习方法及应用研究

提高支持向量机处理复杂数据效能的方法研究

相似国自然基金