基于执行踪迹推断的云应用异常诊断技术研究

基本信息

批准号：61872344

项目类别：面上项目

资助金额：60.00

负责人：王焘

学科分类：

依托单位：中国科学院软件研究所

批准年份：2018

结题年份：2022

起止时间：2019-01-01 - 2022-12-31

项目状态：已结题

项目参与者：钟华,徐罡,徐继伟,宋云奎,吴悦文,许源佳,薛晓东,石钟浩

关键词：

执行踪迹运行监测异常检测云应用日志挖掘

结项摘要

With the rapid development of cloud computing, cloud-based distributed applications are more and more used to provide various online services. However, cloud-based applications commonly have many components, complex dependencies, and frequent updates, which increase the probability of anomaly and the difficulty of anomaly diagnosis. Existing studies do not consider applications’ features and run-time status, so cannot collect sufficient necessary information for analysis; do not correlate logs across multiple tasks, layers and nodes, so cannot infer the execution trace for each task; do not consider the behaviors of anomalies in different layers, so cannot locate the root causes of anomalies in a fine granularity. To address the above issues, this project uses machine learning technologies to study the record and enhancement of logs, the analysis and mining of logs, the characterization and recognition of anomalies, and the detection and diagnosis of anomalies for cloud-based applications. Concretely, this project involves recording logs with static defect prediction and dynamic anomaly estimation, mining execution traces by correlating multiple logs, and diagnosing anomalies based on inferring execution traces and recognizing anomaly patterns. This project plans to implement a prototype, uses our real cloud computing platform and typical cloud-based applications to validate the proposed theories, methods and technologies. This project aims at efficiently recording logs, effectively analyzing traces and accurately locating the root causes of anomalies to provide the theoretical basis and technical support for reliable cloud-based applications.

随着云计算技术飞速发展，基于云平台的分布式应用软件广泛用于提供多样化的在线服务，然而云应用组件众多、依赖复杂、更新频繁等特点增加了异常发生的风险和诊断的难度。当前研究未充分考虑应用软件的自身特征与运行环境，难以有效获取运行状态；未关联跨节点并发任务日志，难以全景还原执行踪迹；未考虑异常在各层次的表现形式，难以准确定位问题的根本原因。针对以上问题，本项目以机器学习为主要技术，研究云应用的日志记录与增强、日志分析与挖掘、异常刻画与识别、异常检测与诊断等问题。研究内容主要包括：基于缺陷预测与异常评估的自适应日志生成方法、基于日志关联分析的执行踪迹推断方法，基于执行踪迹模式识别的异常诊断方法等。提出相应技术体系，建立实验原型系统，并结合典型云应用与云平台对提出的理论、模型、方法和技术进行验证与评价，为实现具有高可靠、高可用、可持续提供高质量服务的云应用提供理论依据与技术支撑。

项目摘要

随着云计算技术飞速发展，基于云平台的分布式应用软件广泛用于提供多样化的在线服务，然而云应用组件众多、依赖复杂、更新频繁等特点增加了异常发生的风险和诊断的难度。当前研究未充分考虑应用软件的自身特征与运行环境，难以有效获取运行状态；未关联跨节点并发任务日志，难以全景还原执行踪迹；未考虑异常在各层次的表现形式，难以准确定位问题的根本原因。针对以上问题，本项目以机器学习为主要技术，研究云应用的一体化日志监测、自主化配置分析与挖掘、智能化异常诊断等问题。研究内容主要包括：云应用执行踪迹的日志监测方法、基于日志关联分析的云应用配置异常诊断方法、基于执行踪迹的云应用异常诊断方法等。提出相应技术体系，建立云应用执行踪迹异常诊断原型系统，并结合典型云应用与云平台对提出的理论、模型、方法和技术进行验证与评价，为实现具有高可靠、高可用、可持续提供高质量服务的云应用提供理论依据与技术支撑。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2018

DOI：

发表时间：2020

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

DOI：10.16383/j.aas.c180673

发表时间：2021

DOI：10.3969/j.issn.1000-4440.2021.03.031

发表时间：2021

王焘的其他基金

批准号：61402450

批准年份：2014

资助金额：24.00

项目类别：青年科学基金项目

批准号：11105053

批准年份：2011

资助金额：22.00

项目类别：青年科学基金项目

相似国自然基金

云计算服务异常检测关键技术研究

批准号：61272399

批准年份：2012

负责人：陈蜀宇

学科分类：F0205

资助金额：81.00

项目类别：面上项目

基于类别分布感知的金融异常发现与推断

批准号：92046003

批准年份：2020

负责人：敖翔

学科分类：F0605

资助金额：20.00

项目类别：重大研究计划

基于多源监测数据融合的云平台故障诊断关键技术研究

批准号：61572090

批准年份：2015

负责人：陈蜀宇

学科分类：F0205

资助金额：65.00

项目类别：面上项目

卫星执行器驱动信号符号故障的诊断与容错控制技术研究

批准号：61703204

批准年份：2017

负责人：马亚杰

学科分类：F0301

资助金额：27.00

项目类别：青年科学基金项目

基于执行踪迹推断的云应用异常诊断技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

神经退行性疾病发病机制的研究进展

基于多色集合理论的医院异常工作流处理建模

智能煤矿建设路线与工程实践

二维FM系统的同时故障检测与控制

黄曲霉毒素B1检测与脱毒方法最新研究进展

王焘的其他基金

基于统计学习的云计算系统故障检测与诊断方法研究

双场暴胀模型的理论研究和观测限制

相似国自然基金