面向虚拟现实内容生成的视频合成技术研究

基本信息

批准号：61772298

项目类别：面上项目

资助金额：78.00

负责人：张松海

学科分类：

依托单位：清华大学

批准年份：2017

结题年份：2021

起止时间：2018-01-01 - 2021-12-31

项目状态：已结题

项目参与者：张方略,黄浩智,刘斌,卢嘉铭,李瑞龙,董欣,王敏轩

关键词：

视频合成视频拼接对象嵌入背景替换虚拟现实

结项摘要

Comparison with the explosive growth of the virtual reality(VR) devices and the market, the lack of content has become a major factor restricting the development of virtual reality. The content of virtual reality is mainly obtained in the form of image or video, and provides the immersive perception and cognition with synthesized image or video. Therefore, image and video are the main battlefield of the research and application of VR technology. This project starts from the structure and semantics analysis of the video, by use of deep learning tools, focusing on the specific needs of VR applications, including real-time alignment and stitching of multi-view videos, real-time foreground extraction and background substitution of avatar videos, and efficient virtual objects embedding into the videos. The achievements of project can be directly used in the field of remote conference, video live broadcast, sports events and live concerts, video advertisement recommendation and generation. The applicant and his research team composed of about 10 graduated students, have put efforts on the preliminary research of the research content of the project for nearly 2 years , and achieved some initial results to clarify and verify the approaches. We expect to achieve expected innovation outcome in project period, and push it into practical applications.

在当前虚拟现实硬件设备爆发式增长和市场快速普及的情况下，内容匮乏则逐渐成为制约虚拟现实发展的一个主要因素。虚拟现实的内容主要以图像或视频的形式获取，并合成为所需的图像或视频提供沉浸式的感知和认知媒介。因此，图像和视频是虚拟现实技术研究和应用的主战场。本项目从分析视频的结构和语义分析出发，利用深度学习等工具，研究基于结构和语义分析的视频高效合成，针对虚拟现实应用的具体需求，重点聚焦在多角度拍摄的视频合成全景视频的对齐和实时拼接技术、视频前景人物和背景画面的实时分离和新背景替换技术，以及视频中虚拟物体的高效嵌入与融合技术。项目成果可应用于远程会议、视频直播、大型体育赛事和演唱会直播、视频广告推荐与生成等领域，具有较大的实用价值。申请人带领约10人科研团队已对该项目研究内容进行了近2年的技术预研，取得了初步成果，并明确了本项目的技术方案，有望在项目期内实现预期创新成果，并产生实际应用。

项目摘要

虚拟现实内容制作效率和质量是当前制约虚拟现实产业规模化发展的一个关键问题。而虚拟现实内容的两个主要载体形式即是全景视觉数据和三维几何模型。本项目面向虚拟现实内容生成，从视频结构和语义分析出发，围绕全景视频合成、人像分割与背景替换、虚拟物体嵌入等内容编辑合成的重要问题开展研究，同时也针对三维几何场景的快速合成与交互的问题开展了研究；在全景视频合成、人像分割、虚拟对象嵌入的尺寸/位置/类别估计、三维场景自动合成及高效交互合成、VR行走重定向方面取得了一系列创新成果，发表（或录用）论文24篇，其中包括ACM TOG、IEEE TVCG论文和ACM Siggraph、IEEE CVPR、IEEE VR、ISMAR会议论文10篇，申请发明专利11项，相关成果获得国家科技进步二等奖1项。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.11897/SP.J.1016.2018.00886

发表时间：2018

DOI：10.16798/j.issn.1003-0530.2020.01.008

发表时间：2020

DOI：

发表时间：2016

DOI：10.7501/j.issn.0253-2670.2020.19.021

发表时间：2020

DOI：10.13344/j.microbiol.china.180319

发表时间：2019

张松海的其他基金

批准号：60970100

批准年份：2009

资助金额：29.00

项目类别：面上项目

批准号：61373069

批准年份：2013

资助金额：80.00

项目类别：面上项目

相似国自然基金

沉浸式虚拟现实视频内容生成与高效编码

批准号：61672063

批准年份：2016

负责人：王荣刚

学科分类：F0210

资助金额：62.00

项目类别：面上项目

面向移动视频点播的内容分析技术研究

批准号：61572240

批准年份：2015

负责人：沈项军

学科分类：F0210

资助金额：64.00

项目类别：面上项目

头戴式虚拟现实设备的屏幕内容视频编码算法研究

批准号：61801167

批准年份：2018

负责人：徐媛媛

学科分类：F0108

资助金额：25.00

项目类别：青年科学基金项目

面向视频社交网站的视频内容理解与挖掘研究

批准号：61571045

批准年份：2015

负责人：袁家政

学科分类：F0113

资助金额：67.00

项目类别：面上项目

面向虚拟现实内容生成的视频合成技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

WMTL-代数中的蕴涵滤子及其应用

TVBN-ResNeXt:解决动作视频分类的端到端时空双流融合网络

A Fast Algorithm for Computing Dominance Classes

地黄-知母-黄柏配伍对药源性阴虚证小鼠肾上腺皮质功能的调节作用

细菌3-酮脂酰ACP 还原酶研究进展

张松海的其他基金

基于结构分析的视频卡通风格绘制技术研究

基于对象分析的图像/视频内容编辑

相似国自然基金