以新闻、电影和历史文献等类别的视频数据为研究对象,针对其所包含的视频帧、转录文本、视频字幕和音频等多媒质数据时序关联共生的特点,研究反映这种特性的视频高维多媒质特征的降维方法和相应融合机制,以理解视频中所包含的丰富语义。同时,为克服从小部分训练数据集合所得到的语义理解结果难以反映视频所蕴涵的完整语义空间的局限性,研究未标注数据利用和交互过程中先验知识挖掘的方法,使其成为视频分析与理解过程的一个有机组成部分,以提高视频语义理解的准确率。.本项目将为视频检索、数字图书馆、视频监控、教育、医学和娱乐等领域的应用提供理论成果、算法基础和实现技术,具有重要研究价值和应用意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于国产化替代环境下高校计算机教学的研究
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
信息熵-保真度联合度量函数的单幅图像去雾方法
高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析
基于多模态融合机制的视频语义表征方法研究
基于多模态特征语义融合的网络不良视频识别
融合多级语义表达的体育视频事件分析
基于视频语义理解的艺术风格化研究