基于贝叶斯增强学习的自适应奖赏学习策略机制研究

基本信息

批准号：61806029

项目类别：青年科学基金项目

资助金额：20.00

负责人：王婷

学科分类：

依托单位：成都信息工程大学

批准年份：2018

结题年份：2021

起止时间：2019-01-01 - 2021-12-31

项目状态：已结题

项目参与者：符颖,邹茂扬,杨晓东,曹云华,郭峰,罗超,伍贤宇

关键词：

学习率认知学习贝叶斯理论增强学习功能磁共振成像

结项摘要

In this project, a computer model is proposed to solve the problem that the current cognitive learning model does not have adaptive learning and that cognitive neural mechanisms are not clear, and combines with the functional magnetic resonance imaging analysis method, realizing the learning rate of cognitive learning model can adapt the function of the change and exploring the neural modulation factor of cognitive learning rate. The study includes: (1) to solve the problem of fixed rate of cognitive learning, a Bayesian reinforcement learning algorithm is proposed to construct an enhanced learning model with flexible learning rate; (2) based on this, the research on cognitive learning neural mechanism is proposed, an adaptive reward learning task model is designed to simulate the learning process of cognitive reward in human brain. (3) based on the content of the study (2) , the functional magnetic resonance data are collected, and the general linear model method is used to analyze the neural modulation factors of cognitive learning. The cognitive learning model proposed in this project with flexible learning rate can simulate the decision-making process of human brain better, and can provide an effective way for us to study the neural coding of the modulation factor.

本课题拟针对当前认知学习模型不具备自适应学习且认知神经机制不清楚的问题，提出一种计算机模型，并结合功能磁共振成像分析方法，实现认知学习模型的学习率可自适应改变的功能，并探索认知学习率的神经调制因子。具体研究内容包括：（1）针对认知学习率固定问题，拟提出一种贝叶斯增强学习算法，构建具有灵活学习率的增强学习模型；（2）以此为基础，针对认知学习神经机制研究问题，设计一种自适应奖赏学习任务模型，用于模拟人脑认知奖赏学习过程；（3）在研究内容（2）的基础上，采集该任务模型下的功能磁共振数据，并采用广义线性模型方法对其进行分析，研究认知学习率的神经调制因子。本项目所提出的具有灵活学习率的认知学习模型，能够较好地模拟人脑认知决策过程，为我们研究学习调制因子的神经编码提供有效途径。

项目摘要

人脑自主认知学习的关键特征是能够灵活调整新信息权重从而时实更新预测。为了研究人脑在认知决策过程中的脑神经机制，本项目将计算机模型和功能磁共振成像相结合从而来实现该问题的建模和分析。具体研究内容包括：（1）针对认知学习率固定问题，拟提出一种贝叶斯增强学习算法，构建具有灵活学习率的增强学习模型；（2）以此为基础，针对认知学习神经机制研究问题，设计一种自适应奖赏学习任务模型，用于模拟人脑认知奖赏学习过程；（3）在研究内容（2）的基础上，采集该任务模型下的功能磁共振数据，并采用广义线性模型方法对其进行分析，研究认知学习率的神经调制因子。本项目首次提出了一种分层贝叶斯增强学习模型来模拟人脑灵活认知决策过程。该模型具有自主调节学习率、上下文感知、重新配置等基本特征，能被广泛用于人脑认知决策相关的任务设计。同时，本项目首次提出用心理生理交互（PPI）算法实现学习因子对应脑区的交互分析。最终实现结果发现，当对学习率、学习率×奖赏反馈、学习率×预测误差进行PPI分析时，发现大脑的内侧额回均参与了所有的交互，这表明内侧额回是认知处理的关键枢纽。此外，奖赏反馈和学习率之间的整合涉及决策控制和运动处理通路，表明在认知决策过程中决策控制与运动处理相辅相成。最后，奖赏反馈和预测误差之间的整合涉及了与纹状体相关的通路。该研究完成了使用灵活的学习策略对模型估计的功能模式及其在强化学习模型中的相互作用的首次探索，为后续脑认知研究提供基础。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.13210/j.cnki.jhmu.20190508.001

发表时间：2019

DOI：10.13592/j.cnki.ppj.2021.0301

发表时间：2022

DOI：

发表时间：2019

DOI：10.12011/setp2020-2080

发表时间：2022

DOI：10.13544/j.cnki.jeg.2014.06.004

发表时间：2014

王婷的其他基金

批准号：81100957

批准年份：2011

资助金额：23.00

项目类别：青年科学基金项目

批准号：30870446

批准年份：2008

资助金额：8.00

项目类别：面上项目

批准号：U1630136

批准年份：2016

资助金额：56.00

项目类别：联合基金项目

批准号：81602537

批准年份：2016

资助金额：17.00

项目类别：青年科学基金项目

批准号：81570177

批准年份：2015

资助金额：60.00

项目类别：面上项目

批准号：51509100

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：81503124

批准年份：2015

资助金额：17.90

项目类别：青年科学基金项目

批准号：41505021

批准年份：2015

资助金额：21.00

项目类别：青年科学基金项目

批准号：81673778

批准年份：2016

资助金额：57.00

项目类别：面上项目

批准号：71804179

批准年份：2018

资助金额：17.50

项目类别：青年科学基金项目

批准号：31270493

批准年份：2012

资助金额：77.00

项目类别：面上项目

批准号：51705284

批准年份：2017

资助金额：25.00

项目类别：青年科学基金项目

批准号：30400183

批准年份：2004

资助金额：21.00

项目类别：青年科学基金项目

批准号：11204033

批准年份：2012

资助金额：30.00

项目类别：青年科学基金项目

批准号：81602813

批准年份：2016

资助金额：18.00

项目类别：青年科学基金项目

批准号：31560584

批准年份：2015

资助金额：41.00

项目类别：地区科学基金项目

批准号：31701576

批准年份：2017

资助金额：25.00

项目类别：青年科学基金项目

批准号：61602412

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：21177062

批准年份：2011

资助金额：58.00

项目类别：面上项目

批准号：51508006

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：31401648

批准年份：2014

资助金额：24.00

项目类别：青年科学基金项目

批准号：61100073

批准年份：2011

资助金额：23.00

项目类别：青年科学基金项目

批准号：81903577

批准年份：2019

资助金额：21.00

项目类别：青年科学基金项目

批准号：81600093

批准年份：2016

资助金额：17.00

项目类别：青年科学基金项目

批准号：11575233

批准年份：2015

资助金额：73.00

项目类别：面上项目

批准号：81802800

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：31701011

批准年份：2017

资助金额：25.00

项目类别：青年科学基金项目

批准号：81702107

批准年份：2017

资助金额：20.00

项目类别：青年科学基金项目

批准号：81000738

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：11426140

批准年份：2014

资助金额：3.00

项目类别：数学天元基金项目

批准号：11105173

批准年份：2011

资助金额：20.00

项目类别：青年科学基金项目

批准号：51303197

批准年份：2013

资助金额：25.00

项目类别：青年科学基金项目

批准号：61906086

批准年份：2019

资助金额：27.00

项目类别：青年科学基金项目

批准号：21577066

批准年份：2015

资助金额：66.00

项目类别：面上项目

批准号：41503101

批准年份：2015

资助金额：21.00

项目类别：青年科学基金项目

批准号：71603086

批准年份：2016

资助金额：17.00

项目类别：青年科学基金项目

批准号：81172253

批准年份：2011

资助金额：60.00

项目类别：面上项目

批准号：30600749

批准年份：2006

资助金额：22.00

项目类别：青年科学基金项目

批准号：21806082

批准年份：2018

资助金额：28.00

项目类别：青年科学基金项目

批准号：81200726

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

批准号：31600917

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：81703922

批准年份：2017

资助金额：20.00

项目类别：青年科学基金项目

批准号：61803370

批准年份：2018

资助金额：26.00

项目类别：青年科学基金项目

批准号：81374001

批准年份：2013

资助金额：70.00

项目类别：面上项目

相似国自然基金

基于稀疏贝叶斯学习的稳健空时自适应处理研究

批准号：61401478

批准年份：2014

负责人：阳召成

学科分类：F0112

资助金额：27.00

项目类别：青年科学基金项目

多任务贝叶斯网络学习及其应用

批准号：61703416

批准年份：2017

负责人：周鋆

学科分类：F0601

资助金额：21.00

项目类别：青年科学基金项目

基于限制性贝叶斯网络的学习技术研究

批准号：60673089

批准年份：2006

负责人：王志海

学科分类：F06

资助金额：28.00

项目类别：面上项目

基于贝叶斯推理的模糊逻辑强化学习模型研究

批准号：61272005

批准年份：2012

负责人：刘全

学科分类：F0201

资助金额：61.00

项目类别：面上项目

基于贝叶斯增强学习的自适应奖赏学习策略机制研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

病毒性脑炎患儿脑电图、神经功能、免疫功能及相关因子水平检测与意义

转录因子WRKY71对拟南芥根系发育的影响

基于旋量理论的数控机床几何误差分离与补偿方法研究

中国出口经济收益及出口外资渗透率分析--基于国民收入视角

吹填超软土固结特性试验分析

王婷的其他基金

microRNA-199a调控SIRT1表达对神经细胞氧化应激损伤的保护作用及机制

西部干旱区山地林线动态对气候变化的响应

基于柔性材料的可共形MEMS天线研究

4.1N基因调控EMT在结肠癌转移中的作用及分子机制研究

Exosome负载的分子信息在淋巴瘤侵袭与进展恶性生物学行为中的机制研究

水库支流异重流入汇干流动力过程试验研究

抑制DAGT1抵抗脂肪酸诱导的胰岛β细胞损伤及其分子机制研究

基于DOAS方法的对流层SO2地基星载联合遥感反演研究

TXNIP介导NLRP3炎症小体活化在衰老大鼠神经炎症反应中的作用及三七总皂苷的干预

重大科技基础设施综合效益产生机理与评估模型研究

北亚热带暖温带过渡区针叶林分布的时空动态及其对气候变化的响应研究

基于量子点探针的超低摩擦力高精度定量测量技术

遗传、药物环境因素对白血病CYP3A5耐药机制的影响及逆转研究

功能性纳米颗粒对生物膜表面重构的物理效应研究

基因组功能性遗传变异与煤工尘肺易感性关联研究

陇东旱塬长期不同施肥农田土壤的氮转化特征及其分子生物学机制

谷胱甘肽对嗜热链球菌和德氏乳杆菌协同生长作用的机制研究

信息物理融合系统模型精化方法研究

微囊藻毒素-LR促进肿瘤转移的作用及其分子机制研究

不同亲疏水性的天然有机物对铜和铬离子在钛酸纳米管表面的吸附行为及其形态影响

基于新型N-糖酰胺酶PNGase T的白果32K蛋白糖链结构及致敏机制研究

空间天气学全球MHD数值模拟的大规模并行计算研究

聚多巴胺修饰有序大-微孔MOF仿生矿化蛋白质新型复合材料用于HPLC手性药物分离研究

BATF高表达对再生障碍性贫血T细胞分化及功能的影响

辐射旁效应诱导拟南芥TGS序列表观激活的染色体位置效应研究

细胞周期抑制蛋白E2F6和Cdc14B在Hedgehog信号驱动髓母细胞瘤发生中的作用

Th17细胞调控哮喘伴抑郁患者激素敏感性机制研究

基于适配子组三重血清荧光高通量测定建立“一站式”肝癌诊断新技术及其前瞻性评价

日本血吸虫尾蚴"延迟脱尾"及其免疫学意义研究

算子代数上的Lie结构

DNA甲基化机制在植物辐射远程效应中的作用

基于噻吩[3,2-b]并噻吩新型梯形稠环分子的设计合成及其光伏性能研究

水下仿人手臂遥操作抓取和捕获控制研究

微囊藻毒素-LR通过miR-221/IRX5调控EMT促进结直肠癌侵袭转移机制的研究

干湿交替过程中沉积物铁锰氧化物对磷迁移转化的影响研究

政府支出对人均能源消费及其库兹涅茨曲线的影响——中国与OECD国家的比较研究

糖酵解通路在淋巴瘤发病机制中的作用及干预研究

TIMP-1在乳腺癌化疗敏感性降低中的作用及其分子机制研究

PM2.5载带的硝基多环芳烃介导ROS促动脉粥样硬化的作用机制研究

MicroRNA-21通过对T细胞的基因调控抑制角膜移植排斥的研究

执行功能在社会排斥引发攻击行为中的作用机制研究

汉黄芩素经表观遗传调控Nrf2/HIF-1α通路及逆转乳腺癌放疗抵抗的作用机制研究

集值量测下的系统辨识与趋同控制

从线粒体自噬-NLRP3炎症小体途径研究竹节参总皂苷改善衰老鼠认知功能障碍的作用机制

相似国自然基金