具有可解释性的竞争对手建模技术研究及其应用

基本信息

批准号：61806089

项目类别：青年科学基金项目

资助金额：27.00

负责人：潘颖慧

学科分类：

依托单位：江西财经大学

批准年份：2018

结题年份：2021

起止时间：2019-01-01 - 2021-12-31

项目状态：已结题

项目参与者：Prashant Doshi,肖泉,毛明松,王曲舒,曾步鑫,周其蓁

关键词：

多智能体决策分析概率图形模型多智能体规划和学习

结项摘要

Interpretable opponent modeling is one of the most important factors that endorse applications of multiagent decision making techniques in a reliable and safe manner. However, the interpretable technology hasn’t been seriously counted into a systematic and thorough research. This project will learn an interpretable decision model for an opponent based on a sum-product-max network and automate the construction of a dynamic decision model in a new, complex problem using transfer learning techniques to learn the opponent’s preference function from a simple decision model. When a decision model of a subject agent fails in an execution, this project will adopt important sampling and most relevance explanation techniques to search the most probable reason to interpret the failure, and generate a new model for an opponent through neuro-computational operators over real-time interaction data. The subject agent’s model will be revised and the agent’s decision quality will be evaluated using a value-equivalence principle. This project will develop the technological evaluation system based on compute game replay data and demonstrate practical utilities of the proposed model learning, reasoning and revision techniques. The project outcomes of a high value will provide new research insights about interpretable techniques to artificial intelligence researchers.

竞争对手建模技术的可解释性是保证多智能体决策技术可靠、应用安全的一个重要因素，但尚未得到高度的重视，也缺乏系统深入的研究。本项目拟从大量智能体之间的行为交互数据中学习出基于和积最大网络的竞争对手决策模型，采用迁移学习技术从简单决策模型中估计出适用于复杂问题新领域的竞争对手偏好函数，以建立复杂问题的和积最大网络动态决策模型。若主体智能体决策模型执行失败，本项目将采用重要性抽样和最相关解释技术搜索最有可能的失败原因，根据在线实时交互数据，利用神经元计算的演化操作算子快速生成新的竞争对手模型，以修正决策模型，并依据值等价原理从理论上预判主体智能体的决策性能。本项目将开发基于游戏重播数据的建模技术评价系统，评估所提出的可解释模型学习技术、推理方法及其模型修正技术的实际应用价值。项目研究成果将为人工智能研究人员在可解释性技术研究方面提供新思路，具有较高的学术研究价值。

项目摘要

竞争对手建模技术的可解释性是保证多智能体决策技术可靠、应用安全的一个重要因素，但尚未得到高度的重视，也缺乏系统深入的研究。本项目从大量智能体之间的行为交互数据中学习出基于和积最大网络的竞争对手决策模型，采用迁移学习技术从简单决策模型中估计出适用于复杂问题新领域的竞争对手偏好函数，建立复杂问题的和积最大网络动态决策模型。若主体智能体决策模型执行失败，本项目采用重要性抽样和最相关解释技术搜索最有可能的失败原因，根据在线实时交互数据，利用神经元计算的演化操作算子快速生成新的竞争对手模型，修正决策模型，并依据值等价原理从理论上预判主体智能体的决策性能。本项目开发基于游戏重播数据的建模技术评价系统，评估所提出的可解释模型学习技术、推理方法及其模型修正技术的实际应用价值。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.16368/j.issn.1674-8999.2018.12.569

发表时间：2018

DOI：10.12354/j.issn.1000-8179.2021.20201763

发表时间：2021

DOI：

发表时间：2021

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：2020

潘颖慧的其他基金

批准号：61562033

批准年份：2015

资助金额：39.00

项目类别：地区科学基金项目

相似国自然基金

汉语解释性意见挖掘关键技术研究

批准号：61672211

批准年份：2016

负责人：付国宏

学科分类：F0211

资助金额：63.00

项目类别：面上项目

具有结构转换的半参数和幂变换门限GARCH建模及其应用

批准号：71271011

批准年份：2012

负责人：杨继平

学科分类：G0103

资助金额：55.00

项目类别：面上项目

具有鲁棒特性的混沌建模新方法及其应用研究

批准号：61701137

批准年份：2017

负责人：花忠云

学科分类：F0118

资助金额：26.00

项目类别：青年科学基金项目

具有可扩展性的鲁棒多视图学习算法及其应用研究

批准号：61806205

批准年份：2018

负责人：王岳青

学科分类：F0605

资助金额：27.00

项目类别：青年科学基金项目

具有可解释性的竞争对手建模技术研究及其应用

{{i.achievement_title}}

暂无此项成果

其他相关文献

肥胖型少弱精子症的发病机制及中医调体防治

外泌体在胃癌转移中作用机制的研究进展

基于铁路客流分配的旅客列车开行方案调整方法

一种基于多层设计空间缩减策略的近似高维优化方法

基于多色集合理论的医院异常工作流处理建模

潘颖慧的其他基金

基于数据驱动的多智能体交互式动态影响图算法研究与应用

相似国自然基金