传统的Web内容挖掘技术主要是利用网页上的文本数据来进行分析,但实际上,Web网页上往往同时存在着多种类型的数据,这些多模态数据之间往往隐含了一定的联系,如果能够有效地协同利用这些不同类型的数据,可望能够更有效地对网页内容进行分析。这方面的研究不仅引起了学术界的关注,还引起了软件业的巨头微软的重视。本课题拟对基于机器学习的Web上图像和文本协同挖掘技术进行研究,拟提出一种快速准确地对Web网页上与考察主题有关的图像和文本定位的方法;提出一种高效且有效地提取Web图像和文本包含的语义特征信息的方法;提出一种有效地对Web图像和文本包含的语义信息特征进行结合分析的方法;提出一种有效利用未标记网页数据提高协同挖掘性能的方法;在国际刊物、会议和国内一级学报上发表5~8篇高质量论文;申请国家发明专利1-2项;培养研究生3-4名。
{{i.achievement_title}}
数据更新时间:2023-05-31
针对弱边缘信息的左心室图像分割算法
基于改进LinkNet的寒旱区遥感图像河流识别方法
新型树启发式搜索算法的机器人路径规划
智能煤矿建设路线与工程实践
信息熵-保真度联合度量函数的单幅图像去雾方法
Web文本意见挖掘关键技术研究
基于迁移学习的Web挖掘研究
基于Web挖掘的图像和视频标注与搜索关键技术研究
WEB文本挖掘中知识模式的抽取和评价机制