本项目是在研究基本词汇的已有研究成果基础上,针对基本词汇"全民性、稳定性和构词能力强"的特点,根据语言学家由列举法产生的被普遍认可的基本词汇,构建先验的基本词汇集,提取该词汇集词语的频度、使用度、流通度曲线,研究这些词语的曲线类型,计算及考察这些词语的构词能力及领域覆盖程度,分析和建立基本词汇的量化分析特征向量,发现基本词汇的共性,建立和划分基本词汇的类型及分类表,构建基本词汇提取模型,在国家语言资源中心的动态流通语料库平台上进行提取实验和人工验证与改进,跟踪和考察基本词汇在历时语料库的发展与变化情况,实现现代汉语基本词汇集的自动更新与提取。.因为基本词汇包含那些反映人类对世界最主要、最基本、最具体认识的词,所以基本词汇集的建立对自然语言处理、汉语教学、词汇大纲、教材编写、辞书编纂、教学法研究、及不同语言之间的历时比较研究等领域研究都会有一定的辅助参考价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
内点最大化与冗余点控制的小型无人机遥感图像配准
水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应
响应面法优化藤茶总黄酮的提取工艺
空气电晕放电发展过程的特征发射光谱分析与放电识别
基于语料库的汉语理解方法研究
基于语料库的汉语短语自动切分方法研究
基于大规模语料库的汉语词语自动聚类研究
大规模汉语历时语料库建设及词汇语义变迁研究