面向大规模数据的机器学习算法研究

基本信息
批准号:61175050
项目类别:面上项目
资助金额:54.00
负责人:吴高巍
学科分类:
依托单位:中国科学院自动化研究所
批准年份:2011
结题年份:2015
起止时间:2012-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:田冠华,黄奕衡,孙正雅,徐海瑞,韩彦军,吴双,杨波
关键词:
大规模机器学习优化算法结构优化非凸优化坐标优化
结项摘要

由于计算机和网络技术的飞速发展,机器学习面临高维海量数据的现实挑战,求解大规模机器学习优化问题是当前机器学习发展的关键性科学性问题之一。本项目将针对大规模机器学习任务,研究有效的随机学习算法和在线学习算法。具体包括:以结构优化的思想为基础,与众多的机器学习算法进一步相结合,得到新的大规模机器学习结构优化算法;用结构优化方法解决坐标优化的子问题,从而得到具有结构优化特点的 primal坐标优化算法;提出能够求解大规模非凸优化问题的坐标优化和在线优化方法,同时保证支持向量的稀疏性和学习问题本身的结构不变。

项目摘要

由于计算机和网络技术的飞速发展,机器学习面临高维海量数据的现实挑战,求解大规模机器学习优化问题是当前机器学习发展的关键性科学性问题之一。本项目针对大规模机器学习任务,研究有效的学习算法。以坐标优化为基础,提出一种对随机挑选的单变量子问题采用结构优化方法进行求解的研究思路,对于光滑和非光滑损失函数分别给出了相应的随机坐标下降方法。采用变分不等式的收敛来描述学习速度,提出基于变分不等式的ADMM随机学习算法。针对数据稀疏性问题数据稀疏性问题,提出基于语义相似性的快速哈希匹配方法。.考虑大数据环境下机器学习算法的应用,探索了面向自然语言处理任务的学习算法。针对词向量表示,基于多语言组合来训练词向量,不同语言的词嵌入能够获得相同或相似的语义信息,因此词向量基于多语种组合获得,由向量空间中多语言的词嵌入的中心来表示,能够捕获更多更可靠的语义信息;基于语言迁移训练词向量,基于特定的转换规则,语言迁移模型采用源语言词向量来表示目标语言词向量。针对情感分析,提出一个递归深度神经模型,通过词向量和依存结构树来表示句子,使用相同的构造函数计算树中的高层节点向量,从而准确的预测句子的情感标签。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于铁路客流分配的旅客列车开行方案调整方法

基于铁路客流分配的旅客列车开行方案调整方法

DOI:
发表时间:2021
2

一种基于多层设计空间缩减策略的近似高维优化方法

一种基于多层设计空间缩减策略的近似高维优化方法

DOI:10.1051/jnwpu/20213920292
发表时间:2021
3

基于被动变阻尼装置高层结构风振控制效果对比分析

基于被动变阻尼装置高层结构风振控制效果对比分析

DOI:10.13197/j.eeev.2019.05.95.fuwq.009
发表时间:2019
4

奥希替尼治疗非小细胞肺癌患者的耐药机制研究进展

奥希替尼治疗非小细胞肺癌患者的耐药机制研究进展

DOI:
发表时间:2020
5

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于改进LinkNet的寒旱区遥感图像河流识别方法

DOI:10.6041/j.issn.1000-1298.2022.07.022
发表时间:2022

吴高巍的其他基金

相似国自然基金

1

面向大规模机器学习的高效优化算法研究

批准号:61806128
批准年份:2018
负责人:彭涵阳
学科分类:F0603
资助金额:25.00
项目类别:青年科学基金项目
2

面向人脸检测的大规模异构并行Adaboost机器学习算法研究

批准号:61303067
批准年份:2013
负责人:曾坤
学科分类:F0204
资助金额:23.00
项目类别:青年科学基金项目
3

面向大数据的随机森林机器学习理论与算法研究

批准号:61602482
批准年份:2016
负责人:张英华
学科分类:F06
资助金额:21.00
项目类别:青年科学基金项目
4

面向气象雷达大数据超短临精准降水的机器学习模型与算法研究

批准号:61806204
批准年份:2018
负责人:魏波
学科分类:F0608
资助金额:22.00
项目类别:青年科学基金项目