基于深度神经网络的交互式图像编辑与视频颜色编辑

基本信息
批准号:61872137
项目类别:面上项目
资助金额:64.00
负责人:肖懿
学科分类:
依托单位:湖南大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:谭光华,袁进,朱贤益,伍湘琼,张学东,张杰,王华钦,潘超,周佩瑶
关键词:
深度神经网络交互式视频编辑颜色编辑结构编辑交互式图像编辑
结项摘要

In recent research works, image processing methods based on deep neural networks have shown their advantages compared to traditional methods. Since user interactions play an important pole in image editing applications, many researchers attempt to include user inputs in deep neural network models to control the edited results. However, existing methods either only support simple user inputs to control the output images, or cannot accurately control the results. To solve this problem, this project will focus on the interactive image color editing, structural editing and video color editing methods based on deep neural networks. We will design smart, straightforward user input ways which can meanwhile accurately control the results. We will study the method to construct corresponding training data set. Also, we will design appropriate network models to fuse the user inputs and appropriate loss functions to differentiate the influences of different inputs. Based on the fast feed forward speed of the neural networks, we can realize real-time interactive image editing and fast interactive video color editing. The outcomes of this project will provide novel methods and tools for interactive image and video editing.

基于深度神经网络的图像处理技术在近年来的研究中展示了它们相比于传统算法的优势。由于用户交互在图像编辑应用中扮演着十分重要的角色,研究者开始尝试把用户交互加入到深度神经网络中以控制图像编辑的结果。但是,目前的方法要么只能支持单一的用户输入方式,要么输入方式不能精确的控制处理的结果。为了解决这个问题,本项目将聚焦于基于深度神经网络的交互式图像颜色编辑、结构编辑、以及视频颜色编辑方法。我们拟以深度神经网络为基础工具,设计灵活、直观、可精确控制编辑结果的用户输入方式,研究相应训练数据集的构造方法,设计能融合多种输入的深度神经网络模型,并设计合适的损失函数来区分不同输入的影响。利用神经网络前馈计算速度快的特点,我们将实现实时交互式图像编辑与快速交互式视频颜色编辑。本项目的研究成果将为图像、视频的交互式编辑提供新的方法与工具。

项目摘要

基于深度神经网络的图像处理技术在近年来的研究中展示了它们相比于传统算法的优势。由于用户交互在图像编辑应用中扮演着十分重要的角色,研究者开始尝试把用户交互加入到深度神经网络中以控制图像编辑的结果。但是,目前的方法要么只能支持单一的用户输入方式,要么输入方式不能精确的控制处理的结果。为了解决这个问题,本项目将聚焦于基于深度神经网络的交互式图像颜色编辑、结构编辑、以及视频颜色编辑方法。我们以深度神经网络为基础工具,设计灵活、直观、可精确控制编辑结果的用户输入方式,研究相应训练数据集的构造方法,设计能融合多种输入的深度神经网络模型,并设计合适的损失函数来区分不同输入的影响。利用神经网络前馈计算速度快的特点,我们实现了实时交互式图像编辑方法和图像风格化方法。本项目的研究成果将为图像、视频的交互式编辑提供新的方法与工具。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于被动变阻尼装置高层结构风振控制效果对比分析

基于被动变阻尼装置高层结构风振控制效果对比分析

DOI:10.13197/j.eeev.2019.05.95.fuwq.009
发表时间:2019
2

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于改进LinkNet的寒旱区遥感图像河流识别方法

DOI:10.6041/j.issn.1000-1298.2022.07.022
发表时间:2022
3

血管内皮细胞线粒体动力学相关功能与心血管疾病关系的研究进展

血管内皮细胞线粒体动力学相关功能与心血管疾病关系的研究进展

DOI:10.13191/j.chj.2017.0028
发表时间:2016
4

基于SSR 的西南地区野生菰资源 遗传多样性及遗传结构分析

基于SSR 的西南地区野生菰资源 遗传多样性及遗传结构分析

DOI:
发表时间:2017
5

含饱和非线性的主动悬架系统自适应控制

含饱和非线性的主动悬架系统自适应控制

DOI:10.3969/j.issn.1674-0696.2020.10.20
发表时间:2020

肖懿的其他基金

批准号:61502158
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目

相似国自然基金

1

保持结构的交互式图像及视频编辑方法研究

批准号:61572243
批准年份:2015
负责人:沈洋
学科分类:F0209
资助金额:16.00
项目类别:面上项目
2

移动设备上的图像交互式分析与编辑

批准号:61572264
批准年份:2015
负责人:程明明
学科分类:F0209
资助金额:63.00
项目类别:面上项目
3

基于对象分析的图像/视频内容编辑

批准号:61373069
批准年份:2013
负责人:张松海
学科分类:F0209
资助金额:80.00
项目类别:面上项目
4

基于交互分析的图像与视频快速编辑扩散技术研究

批准号:61202294
批准年份:2012
负责人:王栋
学科分类:F0209
资助金额:25.00
项目类别:青年科学基金项目