With the development of cloud computing, mobile networks, Internet of things, and wearable devices, the traditional medical and healthcare industry is in the progress of technology transition to Smart Healthcare and Precision Medicine based on the “Internet Plus” project. Therefore, big data in medicine and healthcare are generated explosively. Since semi-structured data is the standard of Electronic Medical Records (EMR), transport and storage of telemedicine and wearable devices in sensor networks, semi-structured data management is the key technology of medical and healthcare big data management. However, the large data volume, multi-source heterogeneity and real-time requirement lead to great challenges, which urge study and research on medicine and healthcare oriented semi-structured data management technologies. Centering on the features of medical and healthcare big data, this project studies distributed storage strategies, index structures, query processing and analysis technologies of large-scale semi-structured data, along with socialized query processing and privacy-preserving query processing and analysis. The research achievement will broaden the application scope of semi-structured data, and make significant contributions to smart healthcare, precision medicine and personalized health management.
云计算、移动网络、物联网、可穿戴设备等新兴技术的发展,推动了传统医疗健康产业向以“互联网+”为背景的智慧医疗与个性化健康管理转型。在医疗健康大数据中,电子病历文档、远程医疗、体征监测与慢性病预警等应用普遍使用半结构化数据作为数据存储和传输的标准。在医疗健康大数据应用中,传统的半结构化数据管理技术不仅面临性能瓶颈,而且无法处理诸如社交查询、基于隐私保护的数据发布与查询分析等全新的数据管理需求,迫切需要进一步展开半结构化医疗健康数据管理的研究。本课题围绕医疗健康大数据的特点,深入研究面向医疗健康大数据的半结构化数据管理技术,包括分布式存储策略、分布式索引结构及其维护技术、分布式与流式查询处理与分析技术、社交查询处理技术、隐私保护技术等。本课题的研究成果将进一步拓宽半结构化数据管理的应用领域,为智慧医疗、精准医疗以及个性化健康管理的实现提供理论和技术支持。
本项目的研究进展顺利,围绕医疗健康大数据的特点与挑战,在半结构化数据的存储、查询处理与分析、隐私保护等方面展开了深入研究,并取得了一定的成果。. 1. 在半结构化数据存储与索引方面,提出了基于任意分片的半结构化数据分割策略、分布式存储策略,并面向多类型复杂问题设计了具有针对性的分布式索引。. 2. 在半结构化数据复杂查询方面,提出了基于辐散算法的规模受限的k-core群组查询,基于Skyline的跨多个社交网络的知识转移处理框架,提出了时序边界模拟概念以及时序边界模拟匹配算法,研究了社交信任感知的个性化路径查询。针对用户查询问题,提出了基于极限学习机的图数据用户查询技术。. 3. 在半结构化数据挖掘与分析方面,针对药物不良反应发现提出基于极限学习机ELM的PU分类技术框架,针对阿尔兹海默症诊断提出基于图神经网络的脑网络分析技术,针对大图数据提出了海量规模的大图分类框架。. 4. 在半结构化数据隐私保护方面,提出了一种概率自上而下的划分算法,可以有效地生成经过清理的位置记录数据,通过采用精心设计的分区树模型,以根据位置记录提取基本信息,并利用新颖的自适应用户分配方案和一系列优化技术提高发布数据的准确性。.5. 项目组在本项目的资助下,在Information Sciences、Cognitive Computation、Soft Computing、DASFAA等国内外重要SCI期刊与CCF认定会议上发表论文19篇,其中SCI论文17篇,培养硕士研究生16人,毕业5人,申请专利4项,获批软件著作权3项。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
非结构化数据管理若干关键技术研究
面向大规模分布式内存的非结构化数据管理系统关键技术研究
基于ontology语义信息的半结构化数据管理方法研究
结构化P2P网络中多媒体数据管理关键技术研究