本项目研究可从客观语料库中获取语言结构知识的汉语句法分析方法。句子的结构表示为一棵树,这棵村从下往上表示字怎样结合成词,词怎样结合成词组和短语。我们用结合力度表示这种知识,并认为正确的结构是结合力度最大的树。我们建立了一个基于统计的模型,模型的核心是求结合力度最大的树的算法。使用句子分块及全枚举策略,基于词性同现及短语结合频率矩阵等,我们通过实验系统,证明这一模型是切实可行的。我们还发现了一个基于动态规划的算法,用这一算法代替句子分块和全枚举策略将大大改善模型的性能,因为理论分析证明这一算法具有多项式复杂性,从而使这一算法的提出具有较大的意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
WMTL-代数中的蕴涵滤子及其应用
口腔扁平苔藓研究热点前沿的可视化分析
区块链技术:从数据智能到知识自动化
融合字符串特征的维吾尔语形态切分
新型非易失存储环境下事务型数据管理技术研究
汉语语义知识获取与语义计算模型研究
汉语句法排歧知识的自动获取方法研究
汉语语义选择限制知识自动获取及其应用研究
面向汉语理解的短语信息库的构造