量子强化学习理论、算法及应用

基本信息

批准号：60703083

项目类别：青年科学基金项目

资助金额：20.00

负责人：董道毅

学科分类：

依托单位：浙江大学

批准年份：2007

结题年份：2010

起止时间：2008-01-01 - 2010-12-31

项目状态：已结题

项目参与者：陈春林,王文旭,齐波,穆义芬,潘豪,崔巍,向美珍

关键词：

量子态量子强化学习动作选择强化学习量子控制

结项摘要

设计快速高效的学习算法是人工智能中的一个关键问题，强化学习是机器学习领域的一种重要学习方法。项目以自主移动机器人学习和量子系统控制设计为应用背景，拟将量子理论系统的引入到强化学习系统的分析与设计中，探索新的知识表示方法和学习机理，提出一套完整的量子强化学习方法。内容主要包括：①将传统强化学习中的状态/动作进行量子化表示，建立量子强化学习的正式知识表示，给出量子强化学习的动作选择策略和值函数更新规则，建立量子强化学习的完整算法框架；②分析量子强化学习算法的收敛性、搜索策略等问题，从理论上找出高效快速的学习模式；③通过经典计算机仿真实现不同策略下的量子强化学习算法，以验证量子强化学习的优越性，通过对其物理实现进行分析以论证方法的可行性，根据分析结果建议合适的物理实现方案；④结合自主移动机器人学习和量子系统控制问题考虑用量子强化学习算法解决实际问题，并对量子人工智能和量子学习控制进行探索。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.13197/j.eeev.2019.05.95.fuwq.009

发表时间：2019

DOI：10.1360/SSM-2020-0035

发表时间：2020

DOI：

发表时间：2023

DOI：10.3969/j.issn.1004-132X.2020.03.001

发表时间：2020

DOI：

发表时间：2017

董道毅的其他基金

相似国自然基金

分层式强化学习理论及其量子启发式算法研究

批准号：60805029

批准年份：2008

负责人：陈春林

学科分类：F03

资助金额：19.00

项目类别：青年科学基金项目

面向非限定条件的演化强化学习理论与算法研究

批准号：61375061

批准年份：2013

负责人：俞扬

学科分类：F0603

资助金额：79.00

项目类别：面上项目

多视图张量学习理论、算法及在脑机接口中的应用

批准号：61202155

批准年份：2012

负责人：赵启斌

学科分类：F0605

资助金额：24.00

项目类别：青年科学基金项目

新型强化学习算法及应用研究

批准号：60775046

批准年份：2007

负责人：高阳

学科分类：F0603

资助金额：27.00

项目类别：面上项目

量子强化学习理论、算法及应用

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于被动变阻尼装置高层结构风振控制效果对比分析

现代优化理论与应用

新产品脱销等待时间对顾客抱怨行为的影响:基于有调节的双中介模型

机电控制无级变速器执行机构动态响应特性仿真研究

汽车侧倾运动安全主动悬架LQG控制器设计方法

董道毅的其他基金

相似国自然基金