In big data machine learning, there are various uncertainties in data source, algorithm design and optimization, which pose serious challenges for traditional methods. This project employs recent advances in machine learning, stochastic optimization and distributed computing to study the following research topics: "refinement of unreliable data", "learning algorithm designing for dynamic environment", "optimization for large scale problem with complex structures" and "application on brain disease analysis". More specifically, the project will focus on multi-sourced heterogeneous data fusion, active label querying, tracking of data distribution change, modeling on concept shift, detection of class label evolving and large scale optimization for non-convex problems, and try to make technique breakthroughs on modeling uncertainty for big data machine learning. Also, the research achievements will be applied to medical data analysis, especially for Alzheimer's disease and intracranial aneurysm.
大数据机器学习在数据原料、算法设计及优化求解等不同层次存在多种不确定性,给传统方法带来严重挑战。本课题利用机器学习、随机优化、分布式计算等方面的最新研究成果,着重开展“针对不可靠数据的学习原料提炼”、“面向动态多变环境的学习算法设计”、“针对大规模复杂问题的优化求解”和“面向脑疾病大数据的应用”等研究工作。特别是研究多源异构数据融合、主动标记查询、样本分布变化跟踪、语义迁移建模、标记变化检测、大规模非凸优化等新方法,在大数据机器学习不确定性建模的技术和方法上取得创新。并基于以上研究成果,对阿尔茨海默病、颅内动脉瘤等脑疾病医疗大数据任务进行典型应用。
数据规模的急剧膨胀同样也带来了诸多不定因素,其主要体现在数据质量的下降,应用环境的动态多变以及学习问题的更加复杂等,由此带来了一系列学习上的问题,我们将之归结为大数据机器学习在数据、环境和模型求解三个层面的不确定性。以往机器学习的不确定性研究更多关注的是数据不确定性,而相对较少关注环境和求解过程的不确定性。本项目系统性地研究不确定性在数据表征、环境变化和求解过程中对预测任务的影响,同时在数据层,算法层和优化层开展不确定性建模,并面向脑疾病大数据进行应用层研究。针对不可靠数据的学习原料提炼方面,通过研究复杂环境中数据不确定性统一表征模型和理论,提出了多种不可靠数据的学习原料提炼方法。在面向动态多变环境的学习算法设计方面,建立了动态环境下面向样本分布、语义概念、输出空间变化的鲁棒学习算法。针对大规模复杂问题的优化求解方面,提出了针对大规模复杂问题的鲁棒和快速优化求解方法。在面向脑疾病大数据的应用方面,将以上创新成果应用于脑疾病的诊断问题,有效提升了其诊断精度和效率。.通过项目的开展,发表论文130余篇。其中CCF A类文30余篇,CCF B类文30余篇。发表的论文他引2500余次,其中发表在TPAMI上的一文他引400余次。引文作者不乏多名IEEE Fellow和本领域的知名学者。在应用方面,脑疾病诊断方面的成果发表在Nature Communications上。陈松灿、张道强教授入选IAPR Fellow,陈松灿教授入选中国人工智能学会会士(CAAI Fellow)。张道强入选国家万人计划科技创新领军人才,黄圣君入选国家优青,黄飞虎入选国家高层次青年人才。陈松灿、张道强、谭晓阳均在项目期内连续入选Elsevier高被引学者。培养的学生获江苏省优秀博士学位论文2篇,江苏省优秀硕士学位论文4篇,江苏省计算机学会优秀博士学位论文1篇,江苏省计算机学会优秀硕士学位论文5篇,江苏省人工智能学会优秀博士学位论文2篇,中国图象图形学学会优秀博士学位论文提名1篇。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于SSVEP 直接脑控机器人方向和速度研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
面向大数据机器学习的不确定性建模理论与方法
面向大数据的机器学习理论与方法
面向专利大数据的机器学习与推理研究
面向机器学习任务的优化建模与算法研究