历史影音资料音频修复方法与关键技术研究

基本信息

批准号：61631016

项目类别：重点项目

资助金额：250.00

负责人：张勤

学科分类：

依托单位：中国传媒大学

批准年份：2016

结题年份：2021

起止时间：2017-01-01 - 2021-12-31

项目状态：已结题

项目参与者：王雨田,钟微,胡飞,张剑,黎涛,白晓飞,王峥,贾砚婷

关键词：

音源分离深度学习噪声消除历史音频介质音频修复

结项摘要

Film and audio material is precious carrier of human civilization, which has a special historical significance and heritage value. However, a variety of early film and audio material, due to historical, technical and other reasons, have been damaged to the urgent situation and need of using interdisciplinary techniques to convert these documents into digital preservation, in order to meet international audio and audiovisual file archiving standards. The project intends to research the non-contact reading analog-digital convert technology, using magnetic and photosensitive devices instead of the magnetic head and the probe to read the historical audio media; research noise characteristic model of the historical audio data, to build the sound source separation based noise elimination method and adaptive multi-types noise cancellation method; research missing data imputation and voice conversion theory and methods, to complement and enhance serious distortion historical audio data; research subjective and objective evaluation model based on deep learning, to increase the accuracy and intelligence of the automatic sound quality evaluation. By meas of these preliminary works, our team establish a theoretical system of historical audio restoration technology, which improve the quality and efficiency and promote the historical audio restoration standards and industrial development.

影视与音频资料是人类文明发展历程的珍贵载体，具有特殊的历史意义与文物价值。然而早期的各种影视与音频资料由于历史、技术等原因，大部分濒临损毁境地，亟待使用跨学科综合技术手段对这些珍贵历史音频文献进行数字化保存，以达到国际音响及音像档案存档标准。本项目拟研究非接触读取模数转换技术，采用磁敏、光敏器件代替磁头和探针来对历史音频介质进行读取；研究历史音频资料的噪声特征模型，建立基于音源分离的噪声消除和多种类噪声的自适应噪声消除方法；研究缺失数据插补与说话人转换理论与方法，对严重失真和缺失的历史音频数据进行补全和增强；研究基于深度学习的主客观评价模型，提高自动化音质评价的准确度和智能性。通过上述工作初步建立历史音频修复的理论技术体系，提高历史音频修复的质量和效率，推动历史音频修复标准制定和产业发展。

项目摘要

老电影胶片是重要的文化遗产。随着时间的推移，胶片会出现划痕、霉斑等不可逆损伤。目前对电影画面中的损伤进行修复的技术相对成熟，但对胶片音频进行修复还没有很好的解决方案。本项目综合应用多种技术手段提取胶片上的音轨信息，并采用深度学习方法对不同内容的音频信号进行修复，形成了一套完整的自主知识产权的音频修复技术体系和工艺，初步构建了新型老电影音频修复工具系统。.1.在胶片音轨数字化方面，传统的基于激光扫描的音轨采集方法不仅会对胶片造成不可逆的物理损坏，而且设备复杂，造价昂贵。为此，我们采用光学成像设备取代激光扫描设备，并且开发了一系列音轨图像校正和修复算法，并通过图音转换法将音轨图像直接转化为音频波形。.2.老电影胶片提取的音频信号会出现各种噪声。为了提高其中语音信号的质量，我们设计了基于循环生成对抗网络的语音增强算法，可以在低信噪比条件下处理各种噪声，并在去除噪的同时做到对原始声音的高度保真。.3.对于大段缺失的音轨缺少有效修复方案的问题，本课题针对不同的场景需求，设计相应的深度学习算法，分别合成语音、音乐和背景声，以此来修复原始音频中缺失的部分。在语音合成方面，针对目前神经网络语音合成模型对于语音韵律的建模能力不够强的问题，本课题采用矢量量化方法来将参考语音的韵律转换为离散隐变量，并以此来控制语音的合成。我们的系统不但在合成效果上超越了现有主流模型，并且可以通过调整隐变量的值来手工调控合成语音的韵律，为影视后期制作提供了便利。在音乐合成方面，主要问题是如何合成跟场景相适应的背景音乐。针对音乐情感变换与结构特性高度相关这一难题，我们设计了一种基于结构特性的情感音乐生成方法，可以有效合成跟前后风格一致的音乐。在音效合成方面，音效同样跟电影画面场景高度相关。我们研究了基于视觉引导的音效合成，可以建立视觉画面和特定音效之间的联系，合成与视频中视觉感知相一致的声音。.4.如何对合成的语音进行智能化评价，是大规模胶片修复与影视产业中亟需解决的问题。为了对语音质量进行合理的估计，本项目提出了共鸣因子指数的概念，并与传统的语音特征参数，如梅尔倒谱系数、线性预测系数等，一起进行特征融合，组成特征矩阵。实验证明，我们提出的指标分类性能比现有指标更加贴合人类主观评价的结果。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：

发表时间：2018

DOI：

发表时间：2019

DOI：

发表时间：2019

DOI：10.1360/SSM-2020-0035

发表时间：2020

张勤的其他基金

批准号：61371191

批准年份：2013

资助金额：84.00

项目类别：面上项目

批准号：31872327

批准年份：2018

资助金额：59.00

项目类别：面上项目

批准号：61503153

批准年份：2015

资助金额：19.00

项目类别：青年科学基金项目

批准号：81670482

批准年份：2016

资助金额：55.00

项目类别：面上项目

批准号：61273330

批准年份：2012

资助金额：80.00

项目类别：面上项目

批准号：39470518

批准年份：1994

资助金额：6.50

项目类别：面上项目

批准号：51508154

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：41072266

批准年份：2010

资助金额：46.00

项目类别：面上项目

批准号：81102107

批准年份：2011

资助金额：20.00

项目类别：青年科学基金项目

批准号：61050005

批准年份：2010

资助金额：30.00

项目类别：专项基金项目

批准号：81101923

批准年份：2011

资助金额：23.00

项目类别：青年科学基金项目

批准号：41274005

批准年份：2012

资助金额：85.00

项目类别：面上项目

批准号：60832004

批准年份：2008

资助金额：220.00

项目类别：重点项目

批准号：39870587

批准年份：1998

资助金额：10.00

项目类别：面上项目

批准号：81300256

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：51675187

批准年份：2016

资助金额：59.00

项目类别：面上项目

批准号：31572361

批准年份：2015

资助金额：58.00

项目类别：面上项目

批准号：81801202

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：30430500

批准年份：2004

资助金额：135.00

项目类别：重点项目

批准号：60643006

批准年份：2006

资助金额：9.00

项目类别：专项基金项目

批准号：41731066

批准年份：2017

资助金额：314.00

项目类别：重点项目

批准号：71671103

批准年份：2016

资助金额：49.30

项目类别：面上项目

批准号：60572041

批准年份：2005

资助金额：28.00

项目类别：面上项目

批准号：40672173

批准年份：2006

资助金额：40.00

项目类别：面上项目

批准号：81300489

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

相似国自然基金

基于ＭＰ时频特征的电影音频场景语义推理研究

批准号：61301300

批准年份：2013

负责人：杨继臣

学科分类：F0117

资助金额：24.00

项目类别：青年科学基金项目

适于MPEG音频播放控制的音频水印关键技术研究

批准号：60873220

批准年份：2008

负责人：王让定

学科分类：F0206

资助金额：33.00

项目类别：面上项目

影像资料修复方法与重构技术

批准号：60932006

批准年份：2009

负责人：杨小康

学科分类：F0117

资助金额：200.00

项目类别：重点项目

基于Web的音频识别与检索关键技术研究

批准号：60673100

批准年份：2006

负责人：周明全

学科分类：F0605

资助金额：25.00

项目类别：面上项目

历史影音资料音频修复方法与关键技术研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

神经退行性疾病发病机制的研究进展

基于旋量理论的数控机床几何误差分离与补偿方法研究

基于主体视角的历史街区地方感差异研究———以北京南锣鼓巷为例

现代优化理论与应用

张勤的其他基金

基于广义建模理论的多原子库图像编码方法研究

利用抗体蛋白质组技术鉴定影响奶牛产奶性状的功能基因和调控网络

野外环境下四足机器人地形辨识与可通过性评价方法研究

潘氏细胞溶菌酶-P与炎症性肠病发生的关系及其在肠道稳态维持中的作用机制

DUCG动态立体因果图的构建和推理方法及其实验验证研究

家畜育种中标记辅助选择的基础研究

考虑循环荷载作用历史的弯剪破坏RC柱抗震性能及地震损伤机理研究

多分辨率雷达干涉融合技术用于矿区塌陷灾害研究

矽肺microRNA特异性表达谱及其靶基因筛选鉴定研究

用于核电站故障诊断和安全运维的动态不确定因果图理论及应用研究

CaMKK2：前列腺癌症治疗的潜在新靶标

基于空间监测技术的汾渭盆地地质灾害构造动力学机制反演研究

基于统计模型与运动基的物体解析与视频重构方法

影响标记辅助选择(MAS)相对效率主要因素的研究

Ghrelin和obestatin对大鼠缺血再灌注心肌的作用及其机制的实验研究

基于液滴的微操作机械手控制机理研究

产肠毒素大肠杆菌F4ac型仔猪腹泻候选致因基因的功能验证

miR-548在视神经脊髓炎中调控Th17细胞分化的机制研究

仔猪E.Coli腹泻抗性的分子遗传机理研究

离散动态不确定因果图基础理论研究

基于空天地技术的滑坡识别与智能监测预警

基于动态不确定因果图的概率安全评价新方法研究

智能粒子滤波器及其在人体运动跟踪中的应用

城市地裂缝InSAR监测的理论与应用研究

叶酸紊乱诱致组蛋白H3K79二甲基化调控失常导致人类神经管畸形发生

相似国自然基金