Fast changing, increasingly complex, and diverse computing platforms pose central problems in scientific computing: How to achieve, with reasonable effort, portable optimal performance? In order to achieve the automatic vectorization code generation, performance optimization and platform adaption for vector processor of fused multiply-add architecture, this project intends to design specific mathematical structures and algebraic rules of digital signal transform algorithm by the tensor product, studys the general method to convert any transform algorithm into an FMA algorithm, parallelization and vectorization algorithms,as well as to automatically generate vectorization code, automatic tuning and evaluation algorithm. Design and synthesize a set of adaptive automatic tuning and high performance vectorization code generation mechanism and implementation algorithm based on tensor product, and evaluate and compare the performance of the mechanisms and algorithms by experimental tests and theoretical analysis.
计算平台的快速发展、日益复杂和变化多端对科学计算提出了一个核心问题:如何用合适的代价实现可移植的最优性能?为了实现乘加融合结构向量处理器的向量化代码自动生成、性能最优化和平台自适应,本项目拟通过张量积理论设计数字信号变换算法的特定数学结构和代数规则,研究FMA变换算法、并行和向量化算法的一般方法,以及向量化代码的自动生成、自动调优和评估算法。设计和综合出一套基于张量积的自适应、自动调优和高效能的向量化代码生成机制和实现算法,并通过实验测试和理论分析的手段评价和比较所设计机制与算法的性能。
计算平台的快速发展、日益复杂和变化多端对科学计算提出了一个核心问题:如何用合适的代价实现可移植的最优性能?为了实现乘加融合结构向量处理器的向量化代码自动生成、性能最优化和平台自适应,本项目拟通过张量积理论设计数字信号变换算法的特定数学结构和代数规则,研究FMA变换算法、并行和向量化算法的一般方法,以及向量化代码的自动生成、自动调优和评估算法。设计和综合出一套基于张量积的自适应、自动调优和高效能的向量化代码生成机制和实现算法,并通过实验测试和理论分析的手段评价和比较所设计机制与算法的性能。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于LASSO-SVMR模型城市生活需水量的预测
基于多模态信息特征融合的犯罪预测算法研究
基于分形维数和支持向量机的串联电弧故障诊断方法
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
大数据分析引擎“系统配置”自动调优关键技术研究
数据驱动的代码注释自动生成方法研究
面向并发的自动化代码重构技术研究
基于动态信息协同的源代码漏洞自动化分析技术研究