With the propelling of construction of Chinese agricultural product quality safety information system, large numbers of intellectualized information collection devices are gradually applied in various links of agricultural product quality safety control. A series of front-end technical difficulties by original information collection and control from grass roots exist as well as increasing the level of agricultural informatization. A speech-based Man-computer interaction system becomes the most appropriate solution in the high movement and vision load operation scene; however, the system is still far from practicality. The research prepares to study robust speech recognition in agricultural product quality safety information collection operation scene. Aiming at the problem that recognition rate of speech recognition system are greatly influenced by noise and has poor stability in information collection operation scene, combining with the applied nature of intellectual movable devices and analyzing speech and corpus nature of agricultural product quality safety information and the operational nature of collective operation scene, the research will study noise influence mechanism and cognitive operation rule in the operation scene, put forward robust speech recognition method, and build recognition model and man-computer interaction framework meeting the nature of agricultural product quality safety information collection operation scene, which can help to collect data and information easily, reliably and efficiently, improve the environment adaptability and man-computer interaction of speech recognition in information collection operation scene, and resolve the urgent problem of practicability and commoditization of agricultural product quality safety information collective devices speech recognition technology.
随着我国农产品质量安全信息体系建设的推进,大量智能化的信息采集设备逐步应用到农产品质量安全控制的各环节当中,在提高采集效率的同时也遇到了来自基层的原始信息采集和控制等一系列前端技术困难。基于语音的人机交互系统是在动作和视觉负荷较高的作业场景中最恰当的解决方案,但目前距实用化还有一定距离。本研究拟开展农产品质量安全信息采集作业场景下的语音识别鲁棒性研究,针对作业场景中语音识别率受噪声影响大,稳定性差的问题,结合智能移动设备应用特点,通过分析农产品质量安全信息的语音语料特征及其采集作业场景的操作特点,研究作业场景下的噪声影响机制和认知操作规律,提出适合农产品质量安全信息采集作业场景特点的语音识别鲁棒性方法、识别模型和人机交互框架,达到简便可靠高效采集信息的目的,以期改善信息采集作业场景下语音识别的环境适应性和人机交互性能,解决农产品质量安全信息采集设备语音识别技术实用化和产品化急需解决的问题
本研究开展了农产品信息采集作业场景下的语音识别鲁棒性研究,课题组针对农业作业场景中语音识别率受噪声影响大,稳定性差的问题,通过分析农产品质量和市场信息的语音语料特征及其采集作业场景的操作特点,研究农业作业场景下的噪声影响机制,建立了3.6小时的农产品市场价格信息语音库,用含噪的语音数据训练语音模型,建立适用于农产品信息采集作业场景下的语料库,以应对农产品市场嘈杂的环境信息处理问题;面向农产品质量安全和市场价格信息采集的特殊工作环境,提出了适合农产品信息采集作业场景特点的语音识别鲁棒性方法、识别模型和人机交互框架,达到了简便可靠高效采集农产品信息的目的,改善了信息采集作业场景下(主要是批发市场和野外溯源)语音识别的环境适应性和人机交互性能,在农产品信息采集中应用语音识别技术进行了探索与实践,并将研究结果应用于蜂产品质量安全信息采集之中。本项目研究内容“蜂产品质量安全信息采集作业场景下语音识别技术应用”作为独立创新点应用于“融合检测技术的蜂产品质量安全控制系统研究与应用”成果,该成果于2015年获得北京市科学技术二等奖。在课题实施期间,3人晋升高级技术职称,1人成为学术带头人,2人获得博士学位,1人获得硕士学位,撰写相关研究论文12篇、提交电子工业出版社相关书1本,获得发明专利2项,申请的“一种农产品市场要素信息采集的鲁棒性语音识别方法”发明专利已经完成答辩,申请软件著作权1项。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
监管的非对称性、盈余管理模式选择与证监会执法效率?
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
针灸治疗胃食管反流病的研究进展
卫生系统韧性研究概况及其展望
基于语音增强的鲁棒性语音识别方法研究
噪声环境下鲁棒性蒙古语语音识别技术研究
基于计算听觉场景分析的鲁棒语音识别前端处理系统研究
基于压缩感知的鲁棒性语音情感识别研究