Mobile terminals have become the main way to obtain agricultural knowledge for farmers nowadays. Audio is an important form of this way to obtain agricultural knowledge by mobile terminals, and the conversion of test-to-speech provides technical support. This project focuses on prominent issues about that there is ambiguity field due to the existence of polysemy and multi-word meaning in test-to-speech conversion of agricultural knowledge. In this project, the texts (ambiguity words) of agricultural knowledge are taken as the project object, and an agricultural lexicon will be constructed based on agricultural knowledge. By calculating the probability of word formation between the first or last word of an ambiguity field and the text before and after, a method of extracting ambiguity fields based on dictionary matching and statistical analysis model will be constructed. Refer to the processing method for key words of Agricultural Semantic Retrieval, ambiguity words are processed and extracted based on the Agricultural Ontology Theory, and the processing method of ambiguity words based on Agricultural Semantic Retrieval is designed. Finally, the EDWS toolkit is used to evaluate the processing methods of ambiguity words. Compared with the maximum matching method and the ternary grammar, this project method will be improved based on the final comparison result. The project puts forward processing mechanism and modeling method of ambiguity words for the characteristics of agricultural knowledge, which provides references for farmer to obtain audio knowledge through mobile terminal. It is of great significance to speed up agricultural knowledge popularizing and solve practical problems in agricultural production.
移动终端成为农民获取农业知识主要途径,音频则是借助移动终端获取知识的重要形式,文语转换为其提供技术支撑。项目针对农业知识文语转换中因具有较多专有词汇,存在一词多义和一义多词而导致歧义字段的突出问题,以农业知识文本(歧义字段)为研究对象,基于农业知识语料构建农业分词词典;通过计算歧义字段首末字与前后文本成词概率,设计出基于词典匹配和统计分析模型的歧义字段提取方法;借鉴农业语义检索对关键词的处理方法,基于农业本体理论对歧义字段进行语义处理和语义概念提取,设计出基于农业语义检索的歧义字段处理方法。最终采用EDWS工具包对设计的歧义字段处理方法进行评价,将选取最大匹配法和三元语法与本研究方法做比较,并根据最终比较结果对本研究方法进行改进。项目将完成针对农业知识特点的歧义字段处理机制与建模方法,为通过移动终端获取音频形式的农业知识提供经验借鉴,对加快农业知识推广、解决农业生产实际问题具有重要意义。
随着移动通信技术的发展,以手机为代表的移动终端在广大农民中迅速普及,并已成为农民获取农业知识的主要途径,音频则是借助移动终端获取知识的重要形式,如能将高校和科研院所研究的农业知识,利用文语转换技术,自动高效地转换为农民易接受的音频形式,并借助移动终端将知识方便快捷地送达到农民手中,具有重要的理论和现实意义。项目针对农业知识文语转换中因具有较多专有词汇,存在一词多义和一义多词而导致歧义字段的突出问题,以农业知识文本(歧义字段)为研究对象,借鉴《现代汉语常用词表(草案)》中所提供的词汇和词频信息,构建通用词词典,包含常用词汇5608个,并通过词汇和词频高低进行整理,最终挑选出20万条左右的常用词汇,利用My SQL数据库构建和存储通用词典内容,并将词典匹配和统计分析模型相结合,设计出基于词典匹配和统计分析模型的歧义字段提取方法;借鉴农业语义检索对关键词的处理方法,将歧义字段作为关键词输入农业语义检索接口,对其进行语义处理和语义概念提取;引入农业知识本体理论,通过计算歧义字段与农业语义节点的路径距离、与农业本体实例间的词汇关联度等,明确歧义字段是否可表达明确的语义概念;最终根据判断结果明确歧义字段是完整词汇还是单子词组合,实现对于歧义字段的处理。进而再此基础上,选用 Cool Edit Pro2.0软件对声音进行录制和后期制作,采样率一般从600-192000Hz不等,采样率越高,音频的效果越好。量化比特数有8比特、16比特和32比特,和采样率一样,量化比特数越大,越能细致的放映出音频的变化,从而完成农业知识的文语转换。最终,将专家系统推理算法和知识库引入呼叫中心呼叫中心,设计出面向呼叫中心的音频知识获取模型,在获取棉花病害诊断知识的系统测试中,用户通过语音呼叫将至少三种病害症状输入专家系统,可获得较高的诊断成功率(75%以上),为农民获取农业知识提供了有效渠道,本研究伴随5G技术的迅速发展,必将有良好的应用前景。
{{i.achievement_title}}
数据更新时间:2023-05-31
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
上转换纳米材料在光动力疗法中的研究进展
固溶时效深冷复合处理对ZCuAl_(10)Fe_3Mn_2合金微观组织和热疲劳性能的影响
基于关系对齐的汉语虚词抽象语义表示与分析
中文阅读中歧义字段加工的认知与神经机制
单音节语音输入的歧义处理
高性能汉语文语转换研究
朝文语音处理系统