具有可解释性的竞争对手建模技术研究及其应用

基本信息
批准号:61806089
项目类别:青年科学基金项目
资助金额:27.00
负责人:潘颖慧
学科分类:
依托单位:江西财经大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:Prashant Doshi,肖泉,毛明松,王曲舒,曾步鑫,周其蓁
关键词:
多智能体决策分析概率图形模型多智能体规划和学习
结项摘要

Interpretable opponent modeling is one of the most important factors that endorse applications of multiagent decision making techniques in a reliable and safe manner. However, the interpretable technology hasn’t been seriously counted into a systematic and thorough research. This project will learn an interpretable decision model for an opponent based on a sum-product-max network and automate the construction of a dynamic decision model in a new, complex problem using transfer learning techniques to learn the opponent’s preference function from a simple decision model. When a decision model of a subject agent fails in an execution, this project will adopt important sampling and most relevance explanation techniques to search the most probable reason to interpret the failure, and generate a new model for an opponent through neuro-computational operators over real-time interaction data. The subject agent’s model will be revised and the agent’s decision quality will be evaluated using a value-equivalence principle. This project will develop the technological evaluation system based on compute game replay data and demonstrate practical utilities of the proposed model learning, reasoning and revision techniques. The project outcomes of a high value will provide new research insights about interpretable techniques to artificial intelligence researchers.

竞争对手建模技术的可解释性是保证多智能体决策技术可靠、应用安全的一个重要因素,但尚未得到高度的重视,也缺乏系统深入的研究。本项目拟从大量智能体之间的行为交互数据中学习出基于和积最大网络的竞争对手决策模型,采用迁移学习技术从简单决策模型中估计出适用于复杂问题新领域的竞争对手偏好函数,以建立复杂问题的和积最大网络动态决策模型。若主体智能体决策模型执行失败,本项目将采用重要性抽样和最相关解释技术搜索最有可能的失败原因,根据在线实时交互数据,利用神经元计算的演化操作算子快速生成新的竞争对手模型,以修正决策模型,并依据值等价原理从理论上预判主体智能体的决策性能。本项目将开发基于游戏重播数据的建模技术评价系统,评估所提出的可解释模型学习技术、推理方法及其模型修正技术的实际应用价值。项目研究成果将为人工智能研究人员在可解释性技术研究方面提供新思路,具有较高的学术研究价值。

项目摘要

竞争对手建模技术的可解释性是保证多智能体决策技术可靠、应用安全的一个重要因素,但尚未得到高度的重视,也缺乏系统深入的研究。本项目从大量智能体之间的行为交互数据中学习出基于和积最大网络的竞争对手决策模型,采用迁移学习技术从简单决策模型中估计出适用于复杂问题新领域的竞争对手偏好函数,建立复杂问题的和积最大网络动态决策模型。若主体智能体决策模型执行失败,本项目采用重要性抽样和最相关解释技术搜索最有可能的失败原因,根据在线实时交互数据,利用神经元计算的演化操作算子快速生成新的竞争对手模型,修正决策模型,并依据值等价原理从理论上预判主体智能体的决策性能。本项目开发基于游戏重播数据的建模技术评价系统,评估所提出的可解释模型学习技术、推理方法及其模型修正技术的实际应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
3

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

面向云工作流安全的任务调度方法

面向云工作流安全的任务调度方法

DOI:10.7544/issn1000-1239.2018.20170425
发表时间:2018

潘颖慧的其他基金

相似国自然基金

1

汉语解释性意见挖掘关键技术研究

批准号:61672211
批准年份:2016
负责人:付国宏
学科分类:F0211
资助金额:63.00
项目类别:面上项目
2

具有结构转换的半参数和幂变换门限GARCH建模及其应用

批准号:71271011
批准年份:2012
负责人:杨继平
学科分类:G0103
资助金额:55.00
项目类别:面上项目
3

具有鲁棒特性的混沌建模新方法及其应用研究

批准号:61701137
批准年份:2017
负责人:花忠云
学科分类:F0118
资助金额:26.00
项目类别:青年科学基金项目
4

具有可扩展性的鲁棒多视图学习算法及其应用研究

批准号:61806205
批准年份:2018
负责人:王岳青
学科分类:F0605
资助金额:27.00
项目类别:青年科学基金项目