实时流数据处理系统中的弹性计算技术

基本信息
批准号:61702109
项目类别:青年科学基金项目
资助金额:23.00
负责人:王立
学科分类:
依托单位:广东工业大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:张荣跃,陈炳丰,成英超,卢子杰,黄礼泊,钟椿荣
关键词:
实时数据处理流数据处理调度算法弹性计算分布式系统
结项摘要

Distributed stream processing system processes fast and continuous data stream in real time by leveraging the abundant resources in the cluster, and has been widely used in many applications, such as smart traffic, internet of things, and mobile Internet. In real applications, data arrival rate and key distribution usually fluctuate dramatically with time. Such dynamics may introduce unbalanced workload among the execution units and result in significant increase of processing time and reduce of throughput. We refer to the ability of handling workload dynamics immediately as elasticity. Existing systems achieve poor elastic, as they solve the workload imbalance by key space repartitioning of the input stream with high synchronization and state migration overhead. To solve this problem, this project aims to guarantee real-time data processing by exploring elastic computing, from perspectives of system architecture, performance model and implementation. We first study the method to decouple key space partitioning from resource allocation, to enable fast resource allocation updates. Then we study the performance model and estimate the workload and computational resource requirements of the executors under a given input data distribution. Finally, we study dynamic scheduling algorithm, which searches for a valid CPU allocation solution that minimizes migration costs, while constraining the computation locality. We believe this project will improve the system performance, in terms of throughput and processing latency, against a dynamic workload, and the theories and methods derived from this research work provides necessary guidance to the optimization on other distributed systems.

分布式流数据处理系统实时地处理快速、连续到达的数据序列,已被广泛用于物联网、移动互联网等领域。在实际应用中,数据到达的速率和数据的分布往往随时间剧烈波动,造成系统负载失衡、处理时间剧增、吞吐量骤降。现有系统应对负载变化时引入过高的的同步代价和计算状态迁移代价,导致调整速度滞后于负载的变化,丧失计算的实时性。本项目计划从系统架构、性能建模理论和算法设计等角度出发,研究流数据处理中的弹性计算技术,以保证负载波动时数据处理的实时性。首先研究弹性执行引擎,将计算资源的分配与数据流的划分解耦合,实现计算资源分配的快速更新;其次研究性能代价模型,准确计算执行单元的工作负载和资源需求;最后研究动态调度算法,搜索最优的资源分配更新方案,以维持计算的局部性、降低计算状态的迁移代价。本项目相关研究成果既为相关分布式系统的设计提供理论基础,又可直接应用到现有的系统中,具有较高的理论研究和实际应用价值。

项目摘要

分布式流数据处理系统实时地处理快速、连续到达的数据序列,已被广泛用于物联网、移动互联网等领域。在实际应用中,数据到达的速率和数据的分布往往随时间剧烈波动,造成系统负载失衡、处理时间剧增、吞吐量骤降。现有系统应对负载变化时引入过高的的同步代价和计算状态迁移代价,导致调整速度滞后于负载的变化,丧失计算的实时性。本项目计划从系统架构、性能建模理论和算法设计等角度出发,研究流数据处理中的弹性计算技术,以保证负载波动时数据处理的实时性。首先研究弹性执行引擎,将计算资源的分配与数据流的划分解耦合,实现计算资源分配的快速更新;其次研究性能代价模型,准确计算执行单元的工作负载和资源需求;最后研究动态调度算法,搜索最优的资源分配更新方案,以维持计算的局部性、降低计算状态的迁移代价。本项目相关研究成果既为相关分布式系统的设计提供理论基础,又可直接应用到现有的系统中,具有较高的理论研究和实际应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
3

针灸治疗胃食管反流病的研究进展

针灸治疗胃食管反流病的研究进展

DOI:
发表时间:2022
4

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018
5

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

DOI:
发表时间:2020

王立的其他基金

批准号:20572097
批准年份:2005
资助金额:8.00
项目类别:面上项目
批准号:29674023
批准年份:1996
资助金额:9.50
项目类别:面上项目
批准号:20172045
批准年份:2001
资助金额:18.00
项目类别:面上项目
批准号:51873189
批准年份:2018
资助金额:59.00
项目类别:面上项目
批准号:21272210
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:51179041
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:50976048
批准年份:2009
资助金额:36.00
项目类别:面上项目
批准号:51076010
批准年份:2010
资助金额:39.00
项目类别:面上项目
批准号:20672097
批准年份:2006
资助金额:28.00
项目类别:面上项目
批准号:50676009
批准年份:2006
资助金额:28.00
项目类别:面上项目
批准号:61564007
批准年份:2015
资助金额:40.00
项目类别:地区科学基金项目
批准号:51276016
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:38970804
批准年份:1989
资助金额:3.00
项目类别:面上项目
批准号:10979015
批准年份:2009
资助金额:36.00
项目类别:联合基金项目
批准号:51673170
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:31671890
批准年份:2016
资助金额:63.00
项目类别:面上项目
批准号:31570505
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:61703008
批准年份:2017
资助金额:23.00
项目类别:青年科学基金项目
批准号:61474059
批准年份:2014
资助金额:74.00
项目类别:面上项目
批准号:51476009
批准年份:2014
资助金额:82.00
项目类别:面上项目
批准号:31300771
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:20772108
批准年份:2007
资助金额:30.00
项目类别:面上项目
批准号:50809020
批准年份:2008
资助金额:22.00
项目类别:青年科学基金项目
批准号:81501414
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:29374171
批准年份:1993
资助金额:8.00
项目类别:面上项目
批准号:39470315
批准年份:1994
资助金额:6.00
项目类别:面上项目
批准号:21472168
批准年份:2014
资助金额:80.00
项目类别:面上项目
批准号:39270460
批准年份:1992
资助金额:5.50
项目类别:面上项目
批准号:41801155
批准年份:2018
资助金额:26.00
项目类别:青年科学基金项目
批准号:21072175
批准年份:2010
资助金额:35.00
项目类别:面上项目
批准号:20174032
批准年份:2001
资助金额:18.00
项目类别:面上项目
批准号:10804041
批准年份:2008
资助金额:24.00
项目类别:青年科学基金项目
批准号:U1432129
批准年份:2014
资助金额:66.00
项目类别:联合基金项目
批准号:31501776
批准年份:2015
资助金额:19.00
项目类别:青年科学基金项目
批准号:31471617
批准年份:2014
资助金额:85.00
项目类别:面上项目

相似国自然基金

1

基于光流方法的PIV计算技术研究

批准号:11002082
批准年份:2010
负责人:卢宗庆
学科分类:A0909
资助金额:16.00
项目类别:青年科学基金项目
2

基于FPGA的傅里叶变换成像光谱仪实时数据处理系统研究

批准号:61265006
批准年份:2012
负责人:殷世民
学科分类:F0507
资助金额:48.00
项目类别:地区科学基金项目
3

基于可重构计算技术的暂态稳定性实时计算方法研究

批准号:50977052
批准年份:2009
负责人:汪芳宗
学科分类:E0704
资助金额:33.00
项目类别:面上项目
4

社交文本流中的实时事件监测和摘要

批准号:61073082
批准年份:2010
负责人:闫宏飞
学科分类:F0211
资助金额:32.00
项目类别:面上项目