一种“统计+结构”机器学习理论与方法研究

基本信息

批准号：61472423

项目类别：面上项目

资助金额：83.00

负责人：王珏

学科分类：

依托单位：中国科学院自动化研究所

批准年份：2014

结题年份：2018

起止时间：2015-01-01 - 2018-12-31

项目状态：已结题

项目参与者：张文生,孙正雅,张英华,肖宪,杨阳,蒋晓娟,杨叶辉,胡文锐,王鑫

关键词：

知识推理语义概率图模型知识表示机器学习统计+结构

结项摘要

With the arrival of the era of big data, the need for semantic understanding of vast amounts of heterogeneous data has become increasingly prominent, machine learning has become the key technology of semantic understanding and knowledge acquisition. Existing statistical machine learning approaches emphasize the Law of Excluded Middle and break the law of causality, while the symbolic machine learning emphasizes the causality and breaks the Law of Excluded Middle. To explore an idea of compromised, forming a new machine learning theory, is the hot spot in the current machine learning research field. This project aims to propose a kind of semantic probabilistic graphical models, we will do research in "Statistics + Structure" based machine learning field, knowledge representation theory and models, key technologies, typical examples for verification etc. First, study the "Statistics + Structure" based knowledge representation theory, and propose a kind of semantics probabilistic graphical model based on semantic triples，as the theoretical basis of complex problem representation and solution. Secondly, study the following key technologies for model generation and reasoning: knowledge representation and knowledge cluster refining，structure learning based Deep Learning, adaptive learning of model parameters, accurate and approximate inference etc. Finally, combined with the JingDong E-commerce trading record and and logistics and distribution data processing task, verify the proposed theories and key technologies. Through these researches above, to explore the meeting point of traditional Statistical Machine Learning and Symbolic Machine Learning, has great significance to satisfy the needs of big data Machine Learning Theory and application developments.

随着大数据时代到来，人们对海量异构数据语义理解的需求日益凸显，机器学习已成为语义理解和知识获取的关键。现有统计机器学习强调排中律而破缺因果律，而符号机器学习强调因果律而破缺排中律，探索一种折衷的理念，形成一套新的机器学习理论，成为当前机器学习研究的热点。本项目旨在提出一种语义概率图模型，从知识表示理论与模型、关键技术、实例验证三方面开展"统计+结构"机器学习研究。首先，研究"统计+结构"知识表示理论，提出基于语义三元组与语义概率图模型，为复杂问题表示与求解提供理论与模型基础；其次，研究语义概率图上知识表示与知识簇提炼、深度学习的结构发现、模型参数自适应学习、精确与近似推理关键技术，实现模型的生成与推理；最后，结合承担的京东商城网络交易和物流配送大型网络数据处理任务,验证提出的理论与关键技术。通过上述研究，探索传统的统计机器学习与符号机器学习的契合点，对大数据机器学习理论和应用具有重要意义。

项目摘要

现有统计机器学习强调排中律而破缺因果律，符号机器学习强调因果律而破缺排中律，一种统计+结构的机器学习理论与方法旨综合利用符号机器学习的语义、关系表示能力与统计机器学习的数值表示、推理能力，帮助机器学习理论步入一个崭新阶段。.项目主要研究内容和难点体现在：“统计+结构”知识表示理论，提出基于语义三元组与语义概率图模型，为复杂问题表示与求解提供理论与模型基础；语义概率图上知识表示、模型结构和参数自适应学习、推理关键技术，实现模型的生成与推理；最后，对物流、健康、警务安防、气象服务等多个领域进行典型实例验证。.项目主要成果体现在：.在基础理论研究方面，提出了“结构+统计”知识表示理论，构建了概率图知识表示与样本结构模型。提出了加权多任务稀疏表示模型，提出在线耦合线性优化算法，降低表示复杂度；提出了非参贝叶斯加权无限关系模型，提高表示能力；从统计角度证明了统计叠加模型与结构弱可学习理论的等价性，奠定了结构模型和统计模型的互补机制的基础。.在关键技术方面，突破了语义概率图的表示、学习、推理预测等关键技术。在表示方面：通过挖掘语义概率图的时序约束、结构约束和节点协同作用，完善知识及其表示。在学习方面：通过因果关系挖掘确定语义概率图模型的结构，通过统计偏置纠正确定语义概率图模型的参数，实现“结构+统计”的机器学习范式。在推理预测方面：通过联合树和信念传播实现精确推理，通过MCMC实现近似推理，提升大规模数据处理能力。.在典型验证性应用方面，在统计+结构的机器学习理论指导下，项目的相关算法在医疗健康大数据、警务大数据、气象大数据以及快件综合服务等众多领域实现了落地和应用，在各个领域取得了长足的进步和社会影响。.此外，项目组在本领域重要的国际期刊和会议上发表(含已录用)论文31篇，其中SCI论文21篇, 培养博士研究生10名，申请了多项国家专利和软件著作权。超额完成任务计划书中规定的考核指标。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：10.13197/j.eeev.2019.05.95.fuwq.009

发表时间：2019

DOI：

发表时间：2020

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

王珏的其他基金

批准号：51204005

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：30973584

批准年份：2009

资助金额：30.00

项目类别：面上项目

批准号：69775014

批准年份：1997

资助金额：10.00

项目类别：面上项目

批准号：61303050

批准年份：2013

资助金额：27.00

项目类别：青年科学基金项目

批准号：81702521

批准年份：2017

资助金额：20.00

项目类别：青年科学基金项目

批准号：81904197

批准年份：2019

资助金额：20.00

项目类别：青年科学基金项目

批准号：71673227

批准年份：2016

资助金额：47.00

项目类别：面上项目

批准号：61771264

批准年份：2017

资助金额：62.00

项目类别：面上项目

批准号：81600125

批准年份：2016

资助金额：18.00

项目类别：青年科学基金项目

批准号：60573078

批准年份：2005

资助金额：22.00

项目类别：面上项目

批准号：51877198

批准年份：2018

资助金额：63.00

项目类别：面上项目

批准号：69375010

批准年份：1993

资助金额：5.50

项目类别：面上项目

批准号：70801058

批准年份：2008

资助金额：18.00

项目类别：青年科学基金项目

批准号：69075009

批准年份：1990

资助金额：3.00

项目类别：面上项目

批准号：31400626

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：71302179

批准年份：2013

资助金额：19.00

项目类别：青年科学基金项目

批准号：71771208

批准年份：2017

资助金额：47.00

项目类别：面上项目

批准号：81001341

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：21905087

批准年份：2019

资助金额：26.00

项目类别：青年科学基金项目

批准号：38770857

批准年份：1987

资助金额：3.50

项目类别：面上项目

批准号：11801116

批准年份：2018

资助金额：26.00

项目类别：青年科学基金项目

批准号：50777061

批准年份：2007

资助金额：31.00

项目类别：面上项目

批准号：19404010

批准年份：1994

资助金额：7.00

项目类别：青年科学基金项目

批准号：81670255

批准年份：2016

资助金额：55.00

项目类别：面上项目

批准号：11904311

批准年份：2019

资助金额：27.00

项目类别：青年科学基金项目

批准号：60271025

批准年份：2002

资助金额：20.00

项目类别：面上项目

批准号：61401240

批准年份：2014

资助金额：26.00

项目类别：青年科学基金项目

批准号：81701776

批准年份：2017

资助金额：20.00

项目类别：青年科学基金项目

批准号：69978017

批准年份：1999

资助金额：13.30

项目类别：面上项目

批准号：51708179

批准年份：2017

资助金额：23.00

项目类别：青年科学基金项目

批准号：30670660

批准年份：2006

资助金额：25.00

项目类别：面上项目

批准号：81071150

批准年份：2010

资助金额：32.00

项目类别：面上项目

批准号：61431012

批准年份：2014

资助金额：290.00

项目类别：重点项目

批准号：71271202

批准年份：2012

资助金额：54.00

项目类别：面上项目

批准号：61271088

批准年份：2012

资助金额：82.00

项目类别：面上项目

批准号：81302305

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：U1760113

批准年份：2017

资助金额：50.00

项目类别：联合基金项目

批准号：59302020

批准年份：1993

资助金额：6.00

项目类别：青年科学基金项目

批准号：81801171

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：51301085

批准年份：2013

资助金额：24.00

项目类别：青年科学基金项目

批准号：51377153

批准年份：2013

资助金额：86.00

项目类别：面上项目

相似国自然基金

面向大数据的机器学习理论与方法

批准号：61332007

批准年份：2013

负责人：朱小燕

学科分类：F0201

资助金额：300.00

项目类别：重点项目

开放动态环境下在线机器学习理论与方法

批准号：61333014

批准年份：2013

负责人：周志华

学科分类：F0305

资助金额：290.00

项目类别：重点项目

统计学习理论与算法研究

批准号：60575001

批准年份：2005

负责人：陶卿

学科分类：F0605

资助金额：23.00

项目类别：面上项目

面向图像语义理解的对抗机器学习理论与方法

批准号：61876130

批准年份：2018

负责人：韩亚洪

学科分类：F0604

资助金额：64.00

项目类别：面上项目

一种“统计+结构”机器学习理论与方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

基于被动变阻尼装置高层结构风振控制效果对比分析

基于多色集合理论的医院异常工作流处理建模

基于改进LinkNet的寒旱区遥感图像河流识别方法

新型树启发式搜索算法的机器人路径规划

王珏的其他基金

转炉钢渣综合利用的热力学研究

吡格列酮（PIO）在恒河猴代谢综合症模型中的遗传药理学研究

“规则+例外“的知识表示方法与机器学习

面向异构众核系统的非规则问题优化技术研究

NEDD9与AGO2在肾细胞癌中相互作用的鉴定及机制研究

龟鹿二仙胶抑制p16INK4a-Rb通路减轻化疗后骨髓造血干细胞衰老的机制研究

中国企业对外直接投资的空间布局与行为关联研究

面向近海广域覆盖的无线传输理论与关键技术研究

微泡介导CRISPR/Cas9靶向FLT3-ITD突变:基因突变靶向新策略?

情报与安全信息学基础研究

面向高频高压应用的元胞级碳化硅功率集成芯片技术基础研究

问题描述的图文互补风格

不确定环境下的我国能源供需预测预警研究

表达问题的理论与方法

PAK蛋白激酶活力调控的分子机制

中国企业对外直接投资股权进入模式选择及其对海外子公司绩效的影响机制研究—基于制度理论和社会网络的视角

面向互联网数据的大宗商品市场深度学习预测方法研究

KIR-HLA 基因型组合对四川汉族人群HIV-1感染进程的影响

原位合金化策略反应机理及协同效应原理的基础研究

用于肿瘤治疗的P(35)Be快中子的放射生物学特性研究

基于部分数据Calderón问题的理论分析、数值计算及其应用

重复频率快速低抖动激光触发沿面闪络开关的研究

纳米多孔介质气凝胶的输运特性研究

lncRNA调控人类心肌细胞增殖能力转变过程的研究

Cu-Pd合金团簇可控制备及其CO2电催化还原机制的研究

基于三维造型和模糊技术的远程康复系统

面向5G的大规模MIMO多用户无线传输关键问题研究

经颅磁刺激对前扣带回个体化精准定位刺激及其对持续注意力的调控

折射率可调气凝胶薄膜的制备及其光学特性研究

考虑土-斜桩相互作用的近海风机支撑结构动力行为研究

阿尔茨海默病神经细胞损伤及修复的神经动力学机理研究

神经电流磁共振方法追踪神经活动的定位研究

TDCS改善早期AD患者认知功能的理论与方法研究

基于智能优化的信用风险评估方法与综合集成预警模型研究

多源信息协同分析脑深部刺激术作用机制及效应的方法研究

"人源性"乳腺微环境的靶点基因核糖体蛋白L32的作用机制研究

基于铁浴还原的石煤改质含钒转炉钢渣资源化利用的基础研究

轻质纳米多孔材料---气凝胶的研制

H19/miR-18a/VEGF轴以外泌体为载体诱导缺血性脑卒中血脑屏障破坏的机制研究

镍基合金大应变量热塑成形过程的变形机制研究及模型建立

微间隙放电机理与高沿面绝缘强度微堆层绝缘表面低温等离子体处理工艺的研究

相似国自然基金