农业知识文语转换歧义字段处理方法研究

基本信息
批准号:61802411
项目类别:青年科学基金项目
资助金额:20.00
负责人:李鑫星
学科分类:
依托单位:中国农业大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:温皓杰,胡宏伟,白雪冰,彭要奇,董玉红,董保平,朱晨光
关键词:
歧义处理语义检索文语转换词法语义农业知识文本
结项摘要

Mobile terminals have become the main way to obtain agricultural knowledge for farmers nowadays. Audio is an important form of this way to obtain agricultural knowledge by mobile terminals, and the conversion of test-to-speech provides technical support. This project focuses on prominent issues about that there is ambiguity field due to the existence of polysemy and multi-word meaning in test-to-speech conversion of agricultural knowledge. In this project, the texts (ambiguity words) of agricultural knowledge are taken as the project object, and an agricultural lexicon will be constructed based on agricultural knowledge. By calculating the probability of word formation between the first or last word of an ambiguity field and the text before and after, a method of extracting ambiguity fields based on dictionary matching and statistical analysis model will be constructed. Refer to the processing method for key words of Agricultural Semantic Retrieval, ambiguity words are processed and extracted based on the Agricultural Ontology Theory, and the processing method of ambiguity words based on Agricultural Semantic Retrieval is designed. Finally, the EDWS toolkit is used to evaluate the processing methods of ambiguity words. Compared with the maximum matching method and the ternary grammar, this project method will be improved based on the final comparison result. The project puts forward processing mechanism and modeling method of ambiguity words for the characteristics of agricultural knowledge, which provides references for farmer to obtain audio knowledge through mobile terminal. It is of great significance to speed up agricultural knowledge popularizing and solve practical problems in agricultural production.

移动终端成为农民获取农业知识主要途径,音频则是借助移动终端获取知识的重要形式,文语转换为其提供技术支撑。项目针对农业知识文语转换中因具有较多专有词汇,存在一词多义和一义多词而导致歧义字段的突出问题,以农业知识文本(歧义字段)为研究对象,基于农业知识语料构建农业分词词典;通过计算歧义字段首末字与前后文本成词概率,设计出基于词典匹配和统计分析模型的歧义字段提取方法;借鉴农业语义检索对关键词的处理方法,基于农业本体理论对歧义字段进行语义处理和语义概念提取,设计出基于农业语义检索的歧义字段处理方法。最终采用EDWS工具包对设计的歧义字段处理方法进行评价,将选取最大匹配法和三元语法与本研究方法做比较,并根据最终比较结果对本研究方法进行改进。项目将完成针对农业知识特点的歧义字段处理机制与建模方法,为通过移动终端获取音频形式的农业知识提供经验借鉴,对加快农业知识推广、解决农业生产实际问题具有重要意义。

项目摘要

随着移动通信技术的发展,以手机为代表的移动终端在广大农民中迅速普及,并已成为农民获取农业知识的主要途径,音频则是借助移动终端获取知识的重要形式,如能将高校和科研院所研究的农业知识,利用文语转换技术,自动高效地转换为农民易接受的音频形式,并借助移动终端将知识方便快捷地送达到农民手中,具有重要的理论和现实意义。项目针对农业知识文语转换中因具有较多专有词汇,存在一词多义和一义多词而导致歧义字段的突出问题,以农业知识文本(歧义字段)为研究对象,借鉴《现代汉语常用词表(草案)》中所提供的词汇和词频信息,构建通用词词典,包含常用词汇5608个,并通过词汇和词频高低进行整理,最终挑选出20万条左右的常用词汇,利用My SQL数据库构建和存储通用词典内容,并将词典匹配和统计分析模型相结合,设计出基于词典匹配和统计分析模型的歧义字段提取方法;借鉴农业语义检索对关键词的处理方法,将歧义字段作为关键词输入农业语义检索接口,对其进行语义处理和语义概念提取;引入农业知识本体理论,通过计算歧义字段与农业语义节点的路径距离、与农业本体实例间的词汇关联度等,明确歧义字段是否可表达明确的语义概念;最终根据判断结果明确歧义字段是完整词汇还是单子词组合,实现对于歧义字段的处理。进而再此基础上,选用 Cool Edit Pro2.0软件对声音进行录制和后期制作,采样率一般从600-192000Hz不等,采样率越高,音频的效果越好。量化比特数有8比特、16比特和32比特,和采样率一样,量化比特数越大,越能细致的放映出音频的变化,从而完成农业知识的文语转换。最终,将专家系统推理算法和知识库引入呼叫中心呼叫中心,设计出面向呼叫中心的音频知识获取模型,在获取棉花病害诊断知识的系统测试中,用户通过语音呼叫将至少三种病害症状输入专家系统,可获得较高的诊断成功率(75%以上),为农民获取农业知识提供了有效渠道,本研究伴随5G技术的迅速发展,必将有良好的应用前景。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

上转换纳米材料在光动力疗法中的研究进展

上转换纳米材料在光动力疗法中的研究进展

DOI:
发表时间:2017
4

固溶时效深冷复合处理对ZCuAl_(10)Fe_3Mn_2合金微观组织和热疲劳性能的影响

固溶时效深冷复合处理对ZCuAl_(10)Fe_3Mn_2合金微观组织和热疲劳性能的影响

DOI:10.11868/j.issn.1001-4381.2018.001042
发表时间:2019
5

基于关系对齐的汉语虚词抽象语义表示与分析

基于关系对齐的汉语虚词抽象语义表示与分析

DOI:
发表时间:2020

李鑫星的其他基金

相似国自然基金

1

中文阅读中歧义字段加工的认知与神经机制

批准号:31571125
批准年份:2015
负责人:李兴珊
学科分类:C0907
资助金额:65.00
项目类别:面上项目
2

单音节语音输入的歧义处理

批准号:69003301
批准年份:1990
负责人:王晓龙
学科分类:F0211
资助金额:3.50
项目类别:青年科学基金项目
3

高性能汉语文语转换研究

批准号:69975018
批准年份:1999
负责人:王仁华
学科分类:F0605
资助金额:16.00
项目类别:面上项目
4

朝文语音处理系统

批准号:68775009
批准年份:1987
负责人:高喜奎
学科分类:F0605
资助金额:2.50
项目类别:面上项目