在利用数据挖掘技术进行企业知识发现工作时,常常会遇到数据不完备现象,本研究基于迁移学习来解决企业不完备数据中的知识发现问题,包括:1,研究企业不完备数据的特征,进行定性和定量描述;2,研究迁移学习在企业不完备数据挖掘中的基本应用模型和方法;3,结合交互式数据挖掘原理,研究交互式迁移学习在企业不完备数据挖掘中的应用模型和方法;4,结合进化计算原理,研究进化型迁移学习在企业不完备数据挖掘中的应用模型和方法。达到以下目的:揭示企业不完备数据特征;初步形成以迁移学习、交互式数据挖掘和进化计算为理论基础的模型和方法体系;结合企业实际,开发软件算法库并在企业试用。
本研究重点针对企业知识发现中常见的数据不完备问题,基于迁移学习的方法和思路提出相关应对方法。本研究内容可以概括为三个层次:数据层次(细分为特征迁移和样本迁移两类)、信息层次和知识层次。主要具体内容包括:基于特征迁移的客户分类问题研究、基于改进TrAdaBoost的样本迁移方法的网络在线评论挖掘研究、进化型关联分类中的高阶信息辅助低阶信息迁移方法研究、交互式关联规则挖掘中的知识评价和迁移方法研究。此外,还延伸出新的基于符号回归规律发现与迁移方法研究和不均衡数据中规则挖掘与迁移研究,用于在缺乏领域知识、缺乏前提假设、数据不均衡等条件下发现数据中潜在规律,目前此项研究还在继续进行。以上方法和应用研究,可以为企业不完备数据中的知识发现提供一些解决方法和借鉴思路。.本项目已发表学术论文13篇,其中国际期刊2篇,自然基金委管理学部认可的A类国内期刊2篇,国际会议7篇,国内会议2篇,这些论文被SCI检索2篇,EI检索4篇。应邀参与国际会议程序委员会2次、参与国际会议组织委员会2次、参加国际学术会议和国内学术会议8人次。较好地完成了原计划各项指标。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
黄河流域水资源利用时空演变特征及驱动要素
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
服务经济时代新动能将由技术和服务共同驱动
数据开采中的知识表示和知识发现方法研究
基于字典学习的不完备投影数据CT重建方法研究
基于数据融合的知识发现方法及其在网络管理中的应用
基于知识图谱的农业大数据碎片化知识发现方法研究