Interpretable opponent modeling is one of the most important factors that endorse applications of multiagent decision making techniques in a reliable and safe manner. However, the interpretable technology hasn’t been seriously counted into a systematic and thorough research. This project will learn an interpretable decision model for an opponent based on a sum-product-max network and automate the construction of a dynamic decision model in a new, complex problem using transfer learning techniques to learn the opponent’s preference function from a simple decision model. When a decision model of a subject agent fails in an execution, this project will adopt important sampling and most relevance explanation techniques to search the most probable reason to interpret the failure, and generate a new model for an opponent through neuro-computational operators over real-time interaction data. The subject agent’s model will be revised and the agent’s decision quality will be evaluated using a value-equivalence principle. This project will develop the technological evaluation system based on compute game replay data and demonstrate practical utilities of the proposed model learning, reasoning and revision techniques. The project outcomes of a high value will provide new research insights about interpretable techniques to artificial intelligence researchers.
竞争对手建模技术的可解释性是保证多智能体决策技术可靠、应用安全的一个重要因素,但尚未得到高度的重视,也缺乏系统深入的研究。本项目拟从大量智能体之间的行为交互数据中学习出基于和积最大网络的竞争对手决策模型,采用迁移学习技术从简单决策模型中估计出适用于复杂问题新领域的竞争对手偏好函数,以建立复杂问题的和积最大网络动态决策模型。若主体智能体决策模型执行失败,本项目将采用重要性抽样和最相关解释技术搜索最有可能的失败原因,根据在线实时交互数据,利用神经元计算的演化操作算子快速生成新的竞争对手模型,以修正决策模型,并依据值等价原理从理论上预判主体智能体的决策性能。本项目将开发基于游戏重播数据的建模技术评价系统,评估所提出的可解释模型学习技术、推理方法及其模型修正技术的实际应用价值。项目研究成果将为人工智能研究人员在可解释性技术研究方面提供新思路,具有较高的学术研究价值。
竞争对手建模技术的可解释性是保证多智能体决策技术可靠、应用安全的一个重要因素,但尚未得到高度的重视,也缺乏系统深入的研究。本项目从大量智能体之间的行为交互数据中学习出基于和积最大网络的竞争对手决策模型,采用迁移学习技术从简单决策模型中估计出适用于复杂问题新领域的竞争对手偏好函数,建立复杂问题的和积最大网络动态决策模型。若主体智能体决策模型执行失败,本项目采用重要性抽样和最相关解释技术搜索最有可能的失败原因,根据在线实时交互数据,利用神经元计算的演化操作算子快速生成新的竞争对手模型,修正决策模型,并依据值等价原理从理论上预判主体智能体的决策性能。本项目开发基于游戏重播数据的建模技术评价系统,评估所提出的可解释模型学习技术、推理方法及其模型修正技术的实际应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
面向云工作流安全的任务调度方法
汉语解释性意见挖掘关键技术研究
具有结构转换的半参数和幂变换门限GARCH建模及其应用
具有鲁棒特性的混沌建模新方法及其应用研究
具有可扩展性的鲁棒多视图学习算法及其应用研究