基于深度神经网络的交互式图像编辑与视频颜色编辑

基本信息
批准号:61872137
项目类别:面上项目
资助金额:64.00
负责人:肖懿
学科分类:
依托单位:湖南大学
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:谭光华,袁进,朱贤益,伍湘琼,张学东,张杰,王华钦,潘超,周佩瑶
关键词:
深度神经网络交互式视频编辑颜色编辑结构编辑交互式图像编辑
结项摘要

In recent research works, image processing methods based on deep neural networks have shown their advantages compared to traditional methods. Since user interactions play an important pole in image editing applications, many researchers attempt to include user inputs in deep neural network models to control the edited results. However, existing methods either only support simple user inputs to control the output images, or cannot accurately control the results. To solve this problem, this project will focus on the interactive image color editing, structural editing and video color editing methods based on deep neural networks. We will design smart, straightforward user input ways which can meanwhile accurately control the results. We will study the method to construct corresponding training data set. Also, we will design appropriate network models to fuse the user inputs and appropriate loss functions to differentiate the influences of different inputs. Based on the fast feed forward speed of the neural networks, we can realize real-time interactive image editing and fast interactive video color editing. The outcomes of this project will provide novel methods and tools for interactive image and video editing.

基于深度神经网络的图像处理技术在近年来的研究中展示了它们相比于传统算法的优势。由于用户交互在图像编辑应用中扮演着十分重要的角色,研究者开始尝试把用户交互加入到深度神经网络中以控制图像编辑的结果。但是,目前的方法要么只能支持单一的用户输入方式,要么输入方式不能精确的控制处理的结果。为了解决这个问题,本项目将聚焦于基于深度神经网络的交互式图像颜色编辑、结构编辑、以及视频颜色编辑方法。我们拟以深度神经网络为基础工具,设计灵活、直观、可精确控制编辑结果的用户输入方式,研究相应训练数据集的构造方法,设计能融合多种输入的深度神经网络模型,并设计合适的损失函数来区分不同输入的影响。利用神经网络前馈计算速度快的特点,我们将实现实时交互式图像编辑与快速交互式视频颜色编辑。本项目的研究成果将为图像、视频的交互式编辑提供新的方法与工具。

项目摘要

基于深度神经网络的图像处理技术在近年来的研究中展示了它们相比于传统算法的优势。由于用户交互在图像编辑应用中扮演着十分重要的角色,研究者开始尝试把用户交互加入到深度神经网络中以控制图像编辑的结果。但是,目前的方法要么只能支持单一的用户输入方式,要么输入方式不能精确的控制处理的结果。为了解决这个问题,本项目将聚焦于基于深度神经网络的交互式图像颜色编辑、结构编辑、以及视频颜色编辑方法。我们以深度神经网络为基础工具,设计灵活、直观、可精确控制编辑结果的用户输入方式,研究相应训练数据集的构造方法,设计能融合多种输入的深度神经网络模型,并设计合适的损失函数来区分不同输入的影响。利用神经网络前馈计算速度快的特点,我们实现了实时交互式图像编辑方法和图像风格化方法。本项目的研究成果将为图像、视频的交互式编辑提供新的方法与工具。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
4

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察

DOI:10.3969/j.issn.1674-0858.2020.04.30
发表时间:2020
5

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据

DOI:10.12202/j.0476-0301.2020285
发表时间:2021

肖懿的其他基金

批准号:61502158
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目

相似国自然基金

1

保持结构的交互式图像及视频编辑方法研究

批准号:61572243
批准年份:2015
负责人:沈洋
学科分类:F0209
资助金额:16.00
项目类别:面上项目
2

移动设备上的图像交互式分析与编辑

批准号:61572264
批准年份:2015
负责人:程明明
学科分类:F0209
资助金额:63.00
项目类别:面上项目
3

基于对象分析的图像/视频内容编辑

批准号:61373069
批准年份:2013
负责人:张松海
学科分类:F0209
资助金额:80.00
项目类别:面上项目
4

基于交互分析的图像与视频快速编辑扩散技术研究

批准号:61202294
批准年份:2012
负责人:王栋
学科分类:F0209
资助金额:25.00
项目类别:青年科学基金项目