基于视觉动态认知特性的上下文视频语义捕捉

基本信息

批准号：61071180

项目类别：面上项目

资助金额：34.00

负责人：姚鸿勋

学科分类：

依托单位：哈尔滨工业大学

批准年份：2010

结题年份：2013

起止时间：2011-01-01 - 2013-12-31

项目状态：已结题

项目参与者：刘绍辉,纪荣嵘,宋三明,孙晓帅,刘先明,钟必能,张盛平,许鹏飞,孙鑫

关键词：

认知视频语义理解关注度模型动态特性

结项摘要

本课题目标是，通过对视觉注意、转移、竞争式联想等视觉动态特性的研究，推进对视觉认知机理的认识，通过对视觉语义基元合理性定义，寻求基于上下文语义基元的视频语义理解关联计算方法，探索异构数据和异构任务间的学习模式，发展半监督学习、主动学习和生成学习理论，创新出自主式视频语义挖掘计算方法、视频语义学习方法和语义表达方式，使语义计算过程贴近真实的视觉理解过程，使捕捉的语义更加本质、充分，且支持语义跨媒介形式的表达。该课题将获得对人类认知过程的更深了解, 也将是对现有视频语义理解研究的实质性推进。该课题对计算机视觉和认知科学发展具有重要的科学意义。

项目摘要

本项目从探索人类视觉动态认知特性出发，试图通过计算机视觉、心理学、神经科学的交叉研究，实现精确、全面的上下文视频语义捕捉。课题主要包含两方面研究内容：1）视觉动态认知特性研究，包括神经网络动力学仿真、视觉注意转移、选择性信息获取与注意建模，语义敏感的局部视觉表达等，探究如何把生理学、心理学等认知学科中的关于视觉动态认知特性的启发式理论和假说转化为高效、合理的可计算模型并在实际应用中进行合理验证；2）上下文视频语义捕捉，具体包括视觉语义概念的理解与建模、异构数据（图像与视频）学习传递、异构语义（身份、情感、动作）的提取、视觉数据语义相似性度量等问题。本项目的研究深入探索了基于上下文的视频语义理解、异构数据学习、语义挖掘计算等热点研究方向，获得了对人类认知过程的更深层的理解，同时实现了对现有视频语义理解研究的实质性推进。课题组的研究成果发表在相关的国际期刊和会议上，已发表（含接收）学术论文51篇，其中国际期刊14篇，国际会议37篇，分别被SCI/EI/ISTP检索12/41/10篇，申请发明专利2项，其中已授权1项。项目培养已毕业博士3人,已毕业硕士10人。其中，在读博士生孙晓帅获得“微软学者”奖，博士张盛平刚毕业就得到了“香江学者”人才计划的资助。邀请到多名国际知名学者来访，并有多名组内学生获得国际交流访问。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：

发表时间：2019

DOI：10.16383/j.aas.c180673

发表时间：2021

DOI：10.3724/SP.J.1089.2019.17435

发表时间：2019

DOI：

发表时间：2020

姚鸿勋的其他基金

批准号：61133003

批准年份：2011

资助金额：270.00

项目类别：重点项目

批准号：60472043

批准年份：2004

资助金额：24.00

项目类别：面上项目

批准号：60775024

批准年份：2007

资助金额：31.00

项目类别：面上项目

批准号：61772158

批准年份：2017

资助金额：69.00

项目类别：面上项目

批准号：61472103

批准年份：2014

资助金额：80.00

项目类别：面上项目

相似国自然基金

基于语义事件和上下文感知的视频检索

批准号：60273005

批准年份：2002

负责人：徐光祐

学科分类：F0210

资助金额：24.00

项目类别：面上项目

基于视觉语义推理与上下文约束建模的场景理解方法研究

批准号：61272218

批准年份：2012

负责人：路通

学科分类：F0209

资助金额：80.00

项目类别：面上项目

基于语义分析和视觉关注的视频自适应研究

批准号：60905008

批准年份：2009

负责人：王金桥

学科分类：F0604

资助金额：18.00

项目类别：青年科学基金项目

基于视觉特性的视觉感知分析与视频编码优化

批准号：61771348

批准年份：2017

负责人：陈震中

学科分类：F0108

资助金额：67.00

项目类别：面上项目

基于视觉动态认知特性的上下文视频语义捕捉

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

基于主体视角的历史街区地方感差异研究———以北京南锣鼓巷为例

二维FM系统的同时故障检测与控制

信息熵-保真度联合度量函数的单幅图像去雾方法

扶贫资源输入对贫困地区分配公平的影响

姚鸿勋的其他基金

面向公共安全的多源异构数据融合的群体行为分析与挖掘

基于转码的数字视频水印技术研究

基于空间关系的多摄像机3D目标跟踪

图像情感元素计算

视觉语义的Web统计模型及理解深化

相似国自然基金