基于贝叶斯增强学习的自适应奖赏学习策略机制研究

基本信息
批准号:61806029
项目类别:青年科学基金项目
资助金额:20.00
负责人:王婷
学科分类:
依托单位:成都信息工程大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:符颖,邹茂扬,杨晓东,曹云华,郭峰,罗超,伍贤宇
关键词:
学习率认知学习贝叶斯理论增强学习功能磁共振成像
结项摘要

In this project, a computer model is proposed to solve the problem that the current cognitive learning model does not have adaptive learning and that cognitive neural mechanisms are not clear, and combines with the functional magnetic resonance imaging analysis method, realizing the learning rate of cognitive learning model can adapt the function of the change and exploring the neural modulation factor of cognitive learning rate. The study includes: (1) to solve the problem of fixed rate of cognitive learning, a Bayesian reinforcement learning algorithm is proposed to construct an enhanced learning model with flexible learning rate; (2) based on this, the research on cognitive learning neural mechanism is proposed, an adaptive reward learning task model is designed to simulate the learning process of cognitive reward in human brain. (3) based on the content of the study (2) , the functional magnetic resonance data are collected, and the general linear model method is used to analyze the neural modulation factors of cognitive learning. The cognitive learning model proposed in this project with flexible learning rate can simulate the decision-making process of human brain better, and can provide an effective way for us to study the neural coding of the modulation factor.

本课题拟针对当前认知学习模型不具备自适应学习且认知神经机制不清楚的问题,提出一种计算机模型,并结合功能磁共振成像分析方法,实现认知学习模型的学习率可自适应改变的功能,并探索认知学习率的神经调制因子。具体研究内容包括:(1)针对认知学习率固定问题,拟提出一种贝叶斯增强学习算法,构建具有灵活学习率的增强学习模型;(2)以此为基础,针对认知学习神经机制研究问题,设计一种自适应奖赏学习任务模型,用于模拟人脑认知奖赏学习过程;(3)在研究内容(2)的基础上,采集该任务模型下的功能磁共振数据,并采用广义线性模型方法对其进行分析,研究认知学习率的神经调制因子。本项目所提出的具有灵活学习率的认知学习模型,能够较好地模拟人脑认知决策过程,为我们研究学习调制因子的神经编码提供有效途径。

项目摘要

人脑自主认知学习的关键特征是能够灵活调整新信息权重从而时实更新预测。为了研究人脑在认知决策过程中的脑神经机制,本项目将计算机模型和功能磁共振成像相结合从而来实现该问题的建模和分析。具体研究内容包括:(1)针对认知学习率固定问题,拟提出一种贝叶斯增强学习算法,构建具有灵活学习率的增强学习模型;(2)以此为基础,针对认知学习神经机制研究问题,设计一种自适应奖赏学习任务模型,用于模拟人脑认知奖赏学习过程;(3)在研究内容(2)的基础上,采集该任务模型下的功能磁共振数据,并采用广义线性模型方法对其进行分析,研究认知学习率的神经调制因子。本项目首次提出了一种分层贝叶斯增强学习模型来模拟人脑灵活认知决策过程。该模型具有自主调节学习率、上下文感知、重新配置等基本特征,能被广泛用于人脑认知决策相关的任务设计。同时,本项目首次提出用心理生理交互(PPI)算法实现学习因子对应脑区的交互分析。最终实现结果发现,当对学习率、学习率×奖赏反馈、学习率×预测误差进行PPI分析时,发现大脑的内侧额回均参与了所有的交互,这表明内侧额回是认知处理的关键枢纽。此外,奖赏反馈和学习率之间的整合涉及决策控制和运动处理通路,表明在认知决策过程中决策控制与运动处理相辅相成。最后,奖赏反馈和预测误差之间的整合涉及了与纹状体相关的通路。该研究完成了使用灵活的学习策略对模型估计的功能模式及其在强化学习模型中的相互作用的首次探索,为后续脑认知研究提供基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
3

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
4

转录组与代谢联合解析红花槭叶片中青素苷变化机制

转录组与代谢联合解析红花槭叶片中青素苷变化机制

DOI:
发表时间:
5

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018

王婷的其他基金

批准号:30870446
批准年份:2008
资助金额:8.00
项目类别:面上项目
批准号:U1630136
批准年份:2016
资助金额:56.00
项目类别:联合基金项目
批准号:81602537
批准年份:2016
资助金额:17.00
项目类别:青年科学基金项目
批准号:81570177
批准年份:2015
资助金额:60.00
项目类别:面上项目
批准号:51509100
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:81503124
批准年份:2015
资助金额:17.90
项目类别:青年科学基金项目
批准号:41505021
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目
批准号:81673778
批准年份:2016
资助金额:57.00
项目类别:面上项目
批准号:71804179
批准年份:2018
资助金额:17.50
项目类别:青年科学基金项目
批准号:31270493
批准年份:2012
资助金额:77.00
项目类别:面上项目
批准号:51705284
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:30400183
批准年份:2004
资助金额:21.00
项目类别:青年科学基金项目
批准号:11204033
批准年份:2012
资助金额:30.00
项目类别:青年科学基金项目
批准号:81602813
批准年份:2016
资助金额:18.00
项目类别:青年科学基金项目
批准号:81100957
批准年份:2011
资助金额:23.00
项目类别:青年科学基金项目
批准号:31560584
批准年份:2015
资助金额:41.00
项目类别:地区科学基金项目
批准号:31701576
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:61602412
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:21177062
批准年份:2011
资助金额:58.00
项目类别:面上项目
批准号:51508006
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:31401648
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目
批准号:61100073
批准年份:2011
资助金额:23.00
项目类别:青年科学基金项目
批准号:81903577
批准年份:2019
资助金额:21.00
项目类别:青年科学基金项目
批准号:81600093
批准年份:2016
资助金额:17.00
项目类别:青年科学基金项目
批准号:11575233
批准年份:2015
资助金额:73.00
项目类别:面上项目
批准号:81802800
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:31701011
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:81702107
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目
批准号:81000738
批准年份:2010
资助金额:20.00
项目类别:青年科学基金项目
批准号:11426140
批准年份:2014
资助金额:3.00
项目类别:数学天元基金项目
批准号:11105173
批准年份:2011
资助金额:20.00
项目类别:青年科学基金项目
批准号:51303197
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:61906086
批准年份:2019
资助金额:27.00
项目类别:青年科学基金项目
批准号:21577066
批准年份:2015
资助金额:66.00
项目类别:面上项目
批准号:41503101
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目
批准号:71603086
批准年份:2016
资助金额:17.00
项目类别:青年科学基金项目
批准号:81172253
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:30600749
批准年份:2006
资助金额:22.00
项目类别:青年科学基金项目
批准号:21806082
批准年份:2018
资助金额:28.00
项目类别:青年科学基金项目
批准号:81200726
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目
批准号:31600917
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:81703922
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目
批准号:61803370
批准年份:2018
资助金额:26.00
项目类别:青年科学基金项目
批准号:81374001
批准年份:2013
资助金额:70.00
项目类别:面上项目

相似国自然基金

1

基于稀疏贝叶斯学习的稳健空时自适应处理研究

批准号:61401478
批准年份:2014
负责人:阳召成
学科分类:F0112
资助金额:27.00
项目类别:青年科学基金项目
2

多任务贝叶斯网络学习及其应用

批准号:61703416
批准年份:2017
负责人:周鋆
学科分类:F0601
资助金额:21.00
项目类别:青年科学基金项目
3

基于限制性贝叶斯网络的学习技术研究

批准号:60673089
批准年份:2006
负责人:王志海
学科分类:F06
资助金额:28.00
项目类别:面上项目
4

基于贝叶斯推理的模糊逻辑强化学习模型研究

批准号:61272005
批准年份:2012
负责人:刘全
学科分类:F0201
资助金额:61.00
项目类别:面上项目