使用工作站进行大规模计算必须支持动态负载平衡;当某些机器被关闭或发生故障时必须进行任务迁移。为了使长时间运行的作业能最终正确执行完毕,必须支持进程迁移而不是简单的故障转移。实现进程迁移的一个重要方法是检查点技术。现有的检查点算法开销较大,并且不支持应用程序对文件的任意访问。本项研究在对现有检查点算法进行分类比较基础上,提出了一个能使检查点支持应用程序对文件系统的操作的SCR算法,和一个具有较小开销和较短冻结时间的一致检查点算法SFT;在各种平台支持的PVM上加进了这些算法,使PVM支持基于检查点的进程迁移和容错。
{{i.achievement_title}}
数据更新时间:2023-05-31
"多对多"模式下GEO卫星在轨加注任务规划
孕期双酚A暴露与自然流产相关性的Meta分析
基于 RDD关键度的Spark检查点管理策略
A Fast Algorithm for Computing Dominance Classes
基于虚拟变量的六相永磁同步电机缺任意 两相容错型直接转矩控制
工作站网络上的并行计算模型与算法
并行计算系统中的故障检测和容错通讯
基于Mesh的并行计算机网络容错性的概率研究
煤矿沉陷区水域浮游植物功能群和水体富营养化进程的关系