量子强化学习理论、算法及应用

基本信息
批准号:60703083
项目类别:青年科学基金项目
资助金额:20.00
负责人:董道毅
学科分类:
依托单位:浙江大学
批准年份:2007
结题年份:2010
起止时间:2008-01-01 - 2010-12-31
项目状态: 已结题
项目参与者:陈春林,王文旭,齐波,穆义芬,潘豪,崔巍,向美珍
关键词:
量子态量子强化学习动作选择强化学习量子控制
结项摘要

设计快速高效的学习算法是人工智能中的一个关键问题,强化学习是机器学习领域的一种重要学习方法。项目以自主移动机器人学习和量子系统控制设计为应用背景,拟将量子理论系统的引入到强化学习系统的分析与设计中,探索新的知识表示方法和学习机理,提出一套完整的量子强化学习方法。内容主要包括:①将传统强化学习中的状态/动作进行量子化表示,建立量子强化学习的正式知识表示,给出量子强化学习的动作选择策略和值函数更新规则,建立量子强化学习的完整算法框架;②分析量子强化学习算法的收敛性、搜索策略等问题,从理论上找出高效快速的学习模式;③通过经典计算机仿真实现不同策略下的量子强化学习算法,以验证量子强化学习的优越性,通过对其物理实现进行分析以论证方法的可行性,根据分析结果建议合适的物理实现方案;④结合自主移动机器人学习和量子系统控制问题考虑用量子强化学习算法解决实际问题,并对量子人工智能和量子学习控制进行探索。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
2

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

DOI:
发表时间:2020
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

DOI:
发表时间:2018
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

董道毅的其他基金

相似国自然基金

1

分层式强化学习理论及其量子启发式算法研究

批准号:60805029
批准年份:2008
负责人:陈春林
学科分类:F03
资助金额:19.00
项目类别:青年科学基金项目
2

面向非限定条件的演化强化学习理论与算法研究

批准号:61375061
批准年份:2013
负责人:俞扬
学科分类:F0603
资助金额:79.00
项目类别:面上项目
3

多视图张量学习理论、算法及在脑机接口中的应用

批准号:61202155
批准年份:2012
负责人:赵启斌
学科分类:F0605
资助金额:24.00
项目类别:青年科学基金项目
4

新型强化学习算法及应用研究

批准号:60775046
批准年份:2007
负责人:高阳
学科分类:F0603
资助金额:27.00
项目类别:面上项目