基于张量积的向量化代码自动生成和调优技术研究

基本信息
批准号:61572025
项目类别:面上项目
资助金额:48.00
负责人:刘仲
学科分类:
依托单位:中国人民解放军国防科技大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:扈啸,邓让钰,张雪萌,张军阳,王子聪,田希,鲁庆男,黄琳琳,黄佳帅
关键词:
张量积自动代码生成乘加融合向量处理器向量化
结项摘要

Fast changing, increasingly complex, and diverse computing platforms pose central problems in scientific computing: How to achieve, with reasonable effort, portable optimal performance? In order to achieve the automatic vectorization code generation, performance optimization and platform adaption for vector processor of fused multiply-add architecture, this project intends to design specific mathematical structures and algebraic rules of digital signal transform algorithm by the tensor product, studys the general method to convert any transform algorithm into an FMA algorithm, parallelization and vectorization algorithms,as well as to automatically generate vectorization code, automatic tuning and evaluation algorithm. Design and synthesize a set of adaptive automatic tuning and high performance vectorization code generation mechanism and implementation algorithm based on tensor product, and evaluate and compare the performance of the mechanisms and algorithms by experimental tests and theoretical analysis.

计算平台的快速发展、日益复杂和变化多端对科学计算提出了一个核心问题:如何用合适的代价实现可移植的最优性能?为了实现乘加融合结构向量处理器的向量化代码自动生成、性能最优化和平台自适应,本项目拟通过张量积理论设计数字信号变换算法的特定数学结构和代数规则,研究FMA变换算法、并行和向量化算法的一般方法,以及向量化代码的自动生成、自动调优和评估算法。设计和综合出一套基于张量积的自适应、自动调优和高效能的向量化代码生成机制和实现算法,并通过实验测试和理论分析的手段评价和比较所设计机制与算法的性能。

项目摘要

计算平台的快速发展、日益复杂和变化多端对科学计算提出了一个核心问题:如何用合适的代价实现可移植的最优性能?为了实现乘加融合结构向量处理器的向量化代码自动生成、性能最优化和平台自适应,本项目拟通过张量积理论设计数字信号变换算法的特定数学结构和代数规则,研究FMA变换算法、并行和向量化算法的一般方法,以及向量化代码的自动生成、自动调优和评估算法。设计和综合出一套基于张量积的自适应、自动调优和高效能的向量化代码生成机制和实现算法,并通过实验测试和理论分析的手段评价和比较所设计机制与算法的性能。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
3

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
4

基于分形维数和支持向量机的串联电弧故障诊断方法

基于分形维数和支持向量机的串联电弧故障诊断方法

DOI:
发表时间:2016
5

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021

刘仲的其他基金

批准号:60503042
批准年份:2005
资助金额:22.00
项目类别:青年科学基金项目

相似国自然基金

1

大数据分析引擎“系统配置”自动调优关键技术研究

批准号:61802384
批准年份:2018
负责人:贝振东
学科分类:F0204
资助金额:27.00
项目类别:青年科学基金项目
2

数据驱动的代码注释自动生成方法研究

批准号:61902441
批准年份:2019
负责人:黄袁
学科分类:F0203
资助金额:29.00
项目类别:青年科学基金项目
3

面向并发的自动化代码重构技术研究

批准号:60903026
批准年份:2009
负责人:钱巨
学科分类:F0203
资助金额:18.00
项目类别:青年科学基金项目
4

基于动态信息协同的源代码漏洞自动化分析技术研究

批准号:61272493
批准年份:2012
负责人:吴世忠
学科分类:F0206
资助金额:82.00
项目类别:面上项目