基于张量积的向量化代码自动生成和调优技术研究

基本信息
批准号:61572025
项目类别:面上项目
资助金额:48.00
负责人:刘仲
学科分类:
依托单位:中国人民解放军国防科技大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:扈啸,邓让钰,张雪萌,张军阳,王子聪,田希,鲁庆男,黄琳琳,黄佳帅
关键词:
张量积自动代码生成乘加融合向量处理器向量化
结项摘要

Fast changing, increasingly complex, and diverse computing platforms pose central problems in scientific computing: How to achieve, with reasonable effort, portable optimal performance? In order to achieve the automatic vectorization code generation, performance optimization and platform adaption for vector processor of fused multiply-add architecture, this project intends to design specific mathematical structures and algebraic rules of digital signal transform algorithm by the tensor product, studys the general method to convert any transform algorithm into an FMA algorithm, parallelization and vectorization algorithms,as well as to automatically generate vectorization code, automatic tuning and evaluation algorithm. Design and synthesize a set of adaptive automatic tuning and high performance vectorization code generation mechanism and implementation algorithm based on tensor product, and evaluate and compare the performance of the mechanisms and algorithms by experimental tests and theoretical analysis.

计算平台的快速发展、日益复杂和变化多端对科学计算提出了一个核心问题:如何用合适的代价实现可移植的最优性能?为了实现乘加融合结构向量处理器的向量化代码自动生成、性能最优化和平台自适应,本项目拟通过张量积理论设计数字信号变换算法的特定数学结构和代数规则,研究FMA变换算法、并行和向量化算法的一般方法,以及向量化代码的自动生成、自动调优和评估算法。设计和综合出一套基于张量积的自适应、自动调优和高效能的向量化代码生成机制和实现算法,并通过实验测试和理论分析的手段评价和比较所设计机制与算法的性能。

项目摘要

计算平台的快速发展、日益复杂和变化多端对科学计算提出了一个核心问题:如何用合适的代价实现可移植的最优性能?为了实现乘加融合结构向量处理器的向量化代码自动生成、性能最优化和平台自适应,本项目拟通过张量积理论设计数字信号变换算法的特定数学结构和代数规则,研究FMA变换算法、并行和向量化算法的一般方法,以及向量化代码的自动生成、自动调优和评估算法。设计和综合出一套基于张量积的自适应、自动调优和高效能的向量化代码生成机制和实现算法,并通过实验测试和理论分析的手段评价和比较所设计机制与算法的性能。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于国产化替代环境下高校计算机教学的研究

基于国产化替代环境下高校计算机教学的研究

DOI:
发表时间:
2

水中溴代消毒副产物的生成综述

水中溴代消毒副产物的生成综述

DOI:10.7524/j.issn.0254-6108.2021021801
发表时间:2022
3

吹填超软土固结特性试验分析

吹填超软土固结特性试验分析

DOI:10.13544/j.cnki.jeg.2014.06.004
发表时间:2014
4

GF-4序列图像的云自动检测

GF-4序列图像的云自动检测

DOI:CNKI:SUN:YGXB.0.2018-01-012
发表时间:2018
5

区块链技术:从数据智能到知识自动化

区块链技术:从数据智能到知识自动化

DOI:
发表时间:2017

刘仲的其他基金

批准号:60503042
批准年份:2005
资助金额:22.00
项目类别:青年科学基金项目

相似国自然基金

1

大数据分析引擎“系统配置”自动调优关键技术研究

批准号:61802384
批准年份:2018
负责人:贝振东
学科分类:F0204
资助金额:27.00
项目类别:青年科学基金项目
2

数据驱动的代码注释自动生成方法研究

批准号:61902441
批准年份:2019
负责人:黄袁
学科分类:F0203
资助金额:29.00
项目类别:青年科学基金项目
3

面向并发的自动化代码重构技术研究

批准号:60903026
批准年份:2009
负责人:钱巨
学科分类:F0203
资助金额:18.00
项目类别:青年科学基金项目
4

基于动态信息协同的源代码漏洞自动化分析技术研究

批准号:61272493
批准年份:2012
负责人:吴世忠
学科分类:F0206
资助金额:82.00
项目类别:面上项目