This program will study parameter identifiability of the machine learning model which integrates the "Knowledge-driven" submodel and the "Data-driven" submodel, namely the KD model. The model aims at merging two types of reasoning inference: "Deduction" and "Induction" in learning machines. Parameter identifiability, which refers to the uniqueness of the parameters determined from input and output data, is of fundamental importance to the KD model. Specific efforts will be made on the parameters in the "Knowledge-driven" sub-model, because their identifiability is a prerequisite of good estimations and interpretability to the model. We will focus on theoretical derivations of identifiability theorems for nonlinear multi-input and multi-output systems. For reducing the number of unidentifiable parameters, the strategies of re-design of nonlinear approximators and re-parameterization methods will be investigated. The discrepancy between the theoretical and numerical parameter identifiability will be another theme in the study. For verifying the theoretical fundamentals, we will conduct case studies on both regression problems and plant growth modeling. The related toolbox will be developed in a format of open-source software.
本课题拟采用的机器学习模型将包括"机理关系(或知识驱动)"子模型与"非线性逼近器(或数据驱动)"子模型两部分。该类模型的目标是将"演绎"与"归纳"两种不同推理体系(或子模型)结合起来,随之而来的是多子模型耦合后的参数可辨识性问题。参数可辨识性是关于模型参数能否被惟一确定的性质,也是模型参数能否获得正确估计的前提条件,是提高模型透明度和可解释性的重要内容之一。本课题重点研究该类机器学习模型的参数可辨识性的理论方法基础。其中拟解决的关键问题包括:推导任意非线性多输入多输出系统的参数可辨识性定理,发展不可辨识参数的自动判别,降低不可辨识物理参数个数的非线性逼近器选择方法与重新参数化方法,探讨参数学习模型中理论可辨识性和数值可辨识性的差异原理与条件等内容。我们将以非线性回归与植物生长建模问题为研究背景,同时发展解决相关问题的开放源码软件。
本课题针对机器学习模型中包括"机理关系(或知识驱动)"子模型与"非线性逼近器(或数据驱动)"子模型两部分,由于"演绎"与"归纳"两种不同推理体系(或子模型)结合起来带来的多子模型耦合后的参数可辨识性问题开展研究。参数可辨识性是关于模型参数能否被惟一确定的性质,也是模型参数能否获得正确估计的前提条件,是提高模型透明度和可解释性的重要内容之一。本课题重点研究了该类机器学习模型的参数可辨识性的理论方法基础。其中包括:推导多输入多输出系统的参数可辨识性定理,开展非线性回归与排序问题,以及基于"机理关系"子模型与"非线性逼近器"子模型的植物生长建模问题为实例应用研究,并以无监督学习中非线性排序回归建模问题为研究背景,发布了开放源码软件。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
监管的非对称性、盈余管理模式选择与证监会执法效率?
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
基于SSVEP 直接脑控机器人方向和速度研究
知识与数据双向驱动的大数据多粒度学习模型与方法
面向专利大数据的机器学习与推理研究
危重病人复苏的数据驱动模型参数辨识与鲁棒线性参变控制研究
面向大数据的机器学习理论与方法