大规模张量分析中的非参贝叶斯学习技术研究

基本信息
批准号:61572111
项目类别:面上项目
资助金额:63.00
负责人:徐增林
学科分类:
依托单位:电子科技大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:吴洪,任亚洲,刘斌,李广西,阙晓凡,刘畅
关键词:
高斯过程大规模机器学习张量分解概率图模型贝叶斯学习
结项摘要

Multidimensional arrays or tensor data are widely observed in many real-world systems. For example, the relationship <user-image-tag-location> in online social networks, and the relationship <user-goods-transaction-time> in e-commerce systems are all examples of tensors. As a principle way of processing tensor data, tensor decomposition has been effectively adopted in many systems. However, most current tensor decomposition methods are multi-linear methods, which may be insufficient to deal with the complex relationship between tensor elements and hard to process the missing values and various data types of tensor elements. To overcome the difficulties of previous research, the PI will work upon previous research results on tensor analysis to propose more generalized Bayesian tensor models, based on random graph theory, matrix/tensor-variate distributions, and nonparametric Bayesian learning. The PI will further extend the tensor models to dynamical tensor analysis. Then the PI will exploit online learning and distributed computing strategies to develop toolkits for large-scale tensor analysis. Finally, as the evaluation system, the team will evaluate our developed algorithms on open and large scale datasets, and develop recommendations systems based on tensor analysis.

张量(矩阵向三维或更高维的扩展)广泛存在于许多现实系统中,例如社会网络中的<用户-图片-图片标记-地理位置>和电子商务中的<用户-商品-交易-时间>。比起向量或矩阵表示,张量可以有效包含不同模之间的关联关系并有助于大大提高预测精度。张量分解是处理张量数据的主要手段,但是大多张量分解算法是线性的,不足以描述张量元素间的复杂关系,而且难以处理缺失值和数值类型问题,或者很难应用于大规模数据中。为了解决上述问题,本研究将在前期工作基础上,通过探讨随机图理论和矩阵/张量分布理论,结合非参贝叶斯学习理论,提出更具有泛化能力的贝叶斯张量分解模型。然后将进一步拓展动态张量模型以描述张量数据的动态变化,并探讨在线学习和分布式学习策略来开发能够适应于大规模数据的张量分解算法工具包。最后,作为本研究的最终评价系统,申请人将在公开和实际的大规模张量数据集中对算法进行测试,并设计基于大规模张量分析的推荐系统。

项目摘要

经过4年的研究,项目组在张量分析算法、多视图学习、大数据机器学习、深度学习及其在推荐系统、自然语言理解应用方面取得了重要成果,出色完成了项目书提出的各项目标。首先,对张量学习框架方面,课题组对矩阵(即二阶张量)分解、张量分解进行了深入细致的研究,沿着线性张量分解算法、贝叶斯非线性算法、神经张量分解非线性算法的研究路径,提出了一系列具有更强泛化能力的算法。其次在构造适合于动态系统的张量分析模型方面,课题组将张量分解算法与循环神经网络相结合,提出了张量循环神经网络模型,可以对动态数据进行分析;还将神经张量分析与注意力模型相结合,提出了能够处理多模态数据问答的网络模型。然后在大规模张量学习算法方面,课题组提出了基于切块的并行张量分解算法,并将其用于推荐系统,开源了第一个基于tensorflow的张量分解工具包。在论文发表方面,课题组在机器学习、人工智能领域的顶级期刊和国际会议上实际发表论文50多篇,超过原计划的10-15篇; 实际申报专利6项(含授权2项,超过原计划(2-3项)。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
5

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020

徐增林的其他基金

相似国自然基金

1

基于限制性贝叶斯网络的学习技术研究

批准号:60673089
批准年份:2006
负责人:王志海
学科分类:F06
资助金额:28.00
项目类别:面上项目
2

多任务贝叶斯网络学习及其应用

批准号:61703416
批准年份:2017
负责人:周鋆
学科分类:F0601
资助金额:21.00
项目类别:青年科学基金项目
3

视觉人体运动的贝叶斯学习、分析与合成

批准号:61673269
批准年份:2016
负责人:赵旭
学科分类:F0304
资助金额:62.00
项目类别:面上项目
4

贝叶斯深度张量学习模型、理论及算法研究

批准号:61773129
批准年份:2017
负责人:赵启斌
学科分类:F0605
资助金额:16.00
项目类别:面上项目