面向通用博弈系统的策略表示与推理研究

基本信息

批准号：61806102

项目类别：青年科学基金项目

资助金额：23.00

负责人：姜桂飞

学科分类：

依托单位：南开大学

批准年份：2018

结题年份：2021

起止时间：2019-01-01 - 2021-12-31

项目状态：已结题

项目参与者：章衡,张圣林,郑阳,李祥攀

关键词：

多智能体系统搜索算法策略推理模型检测全局博弈策略

结项摘要

General Game Playing (GGP) is a research project launched by Stanford University in 2005. It aims to develop a game player with general intelligence that is able to play more than one game successfully. As an important AI research area, the main challenge of GGP is how to build an efficient general game player, which can understand the rules of arbitrary games and learn to play these games effectively without human intervention. Strategy representation and reasoning is a core technique to build such a general game player. Based on the GGP platform, this project focuses on the study of strategy representation and reasoning for general game players. The main contents include: .1) Establish a unified logic theory for game description, strategy representation and reasoning, and study its logical properties such as soundness, proof theory and complexity..2) Investigate effective tools for representing and reasoning about dynamic information and uncertainty during the game, develop model-checking algorithms for a general game player to automatically verify game properties, and study automatic reasoning techniques..3) Design strategy generation algorithms based on game rules, and develop search algorithms to support efficient decision-making for general game players. .The results of this project can be applied to other areas, bringing today's AI systems to a new level of generality. They can also promote the development of the theory and techniques of General Artificial Intelligence.

全局博弈策略(GGP)是由斯坦福大学在2005年发起的研究项目，旨在研发具有通用性智能的博弈系统。作为人工智能的重要研究领域，GGP研究目前所面临的主要挑战是如何构造高效的通用博弈系统，使其能够自主学习任意给定的博弈规则，并自动生成有效的博弈策略。策略表示与推理是构建通用博弈系统的关键。为此，本项目将基于GGP平台研究通用博弈系统的策略表示与推理机制设计。主要内容包括：1) 构建用于博弈描述、策略表示与推理的统一逻辑框架，并研究其可靠性、复杂性、证明论等系统性质。2）研究处理博弈过程中信息动态化和不确定性的知识表示与推理的有效工具，开发通用博弈系统自动验证博弈性质的模型检测算法以及自动推理技术。3）探究基于博弈规则的策略生成算法，设计支持通用博弈系统进行高效智能决策的搜索算法。本研究成果可广泛用于提高当今经济、社会等领域人工智能系统的通用性水平，有助于推动通用人工智能理论与技术的发展。

项目摘要

作为人工智能的重要研究领域，全局博弈策略 (General Game Playing, GGP) 旨在研发具有通用性智能的博弈系统，使其能够成功地基于博弈规则进行任意已知或未知的博弈。GGP研究的主要问题是如何构造高效的通用博弈系统，使其能够自主学习任意给定的博弈规则，并自动生成有效的博弈策略。针对这一问题，本项目系统地研究了通用博弈系统策略推理的逻辑基础与高效策略生成算法。主要研究内容包括：（1）通过自下而上的方式构建了用于（非）完美信息博弈描述、策略表示与推理的统一逻辑系统，并研究了它们的语言表达力，计算复杂性，公理化等元性质。研究结果表明，与同类策略逻辑相比，这些逻辑系统实现了语言表达力与计算复杂性的良好均衡；（2）针对所构建的逻辑系统，研发了具有良好复杂度的模型检测算法来自动验证博弈和策略的性质；同时，基于所建立的语义理论和证明论系统，设计了有效的推理机制，使博弈主体能够基于给定的博弈规则自动推导出博弈状态上的重要决策信息，并对其认知状态以及策略推理实现精细刻画；（3）深入分析了主流通用策略生成算法蒙特卡洛树搜索算法（MCTS）及其变种所具有的状态评估方差大、不稳定等问题，利用相似状态共享信息的泛化思想，通过在MCTS基础上设计了记忆存储结构来记录状态的特征信息，并基于这些记忆生成在线近似值，有效地提高了状态模拟估值的准确性，提升了MCTS的性能表现；（4）通过整合所研发的模型检测算法，带记忆结构的MCTS算法和深度强化学习算法，特别是AlphaZero的广义深度强化学习算法构建了通用博弈系统，并基于GGP平台对所构建的通用博弈系统在不同类型的多个博弈上进行了全面的性能评估。实验结果表明，与基准系统相比，所构建的通用博弈系统无论在决策水平还是效率上都有了显著的提升。项目组已在国际人工智能顶级期刊 Artificial Intelligence，顶级会议IJCAI和AAAI上发表论文3篇; 此外，有1篇论文已被AAAI-2022接收录用。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.16368/j.issn.1674-8999.2018.12.569

发表时间：2018

DOI：10.16796/j.cnki.1000-3770.2022.03.003

发表时间：2022

DOI：10.12354/j.issn.1000-8179.2021.20201763

发表时间：2021

DOI：

发表时间：2021

DOI：10.1051/jnwpu/20213920292

发表时间：2021

姜桂飞的其他基金

相似国自然基金

面向开放网络数据的多元关系抽取、表示与推理研究

批准号：61772501

批准年份：2017

负责人：靳小龙

学科分类：F0607

资助金额：58.00

项目类别：面上项目

面向语义Web的行动表示和推理研究

批准号：61363030

批准年份：2013

负责人：常亮

学科分类：F0607

资助金额：43.00

项目类别：地区科学基金项目

面向装配规划的领域知识表示及推理研究

批准号：60963010

批准年份：2009

负责人：古天龙

学科分类：F0209

资助金额：23.00

项目类别：地区科学基金项目

通用定性时空关系建模、推理与应用

批准号：60603030

批准年份：2006

负责人：王生生

学科分类：F06

资助金额：26.00

项目类别：青年科学基金项目

面向通用博弈系统的策略表示与推理研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

肥胖型少弱精子症的发病机制及中医调体防治

EBPR工艺运行效果的主要影响因素及研究现状

外泌体在胃癌转移中作用机制的研究进展

基于铁路客流分配的旅客列车开行方案调整方法

一种基于多层设计空间缩减策略的近似高维优化方法

姜桂飞的其他基金

相似国自然基金