结合分布相似和汉语构词特征的词义相似度计算

基本信息
批准号:61003206
项目类别:青年科学基金项目
资助金额:7.00
负责人:金澎
学科分类:
依托单位:乐山师范学院
批准年份:2010
结题年份:2011
起止时间:2011-01-01 - 2011-12-31
项目状态: 已结题
项目参与者:刘鹏远,孙锐,杨霞,任志萍,宋洋,苏炳均
关键词:
分布相似度自然语言处理词义相似度金标准数据
结项摘要

词义相似度计算旨在自动获取与任一给定词广义相似(包括语义相似或语义相关)的相似词序列。活用所得到的相似词序列可以有效缓解数据稀疏,如平滑统计语言模型,提高自然语言处理的基本问题- - 词义消歧的准确率。本课题的重要创新是结合汉语特点,提出基于大规模语料库的新的词义相似度计算方法。研究内容包括:1)博采多种基于上下文分布特征获取相似词的算法之长,并利用汉语特有的诸如名量搭配之类的可以表征词义的句法关系,提炼新的算法,得到给定词的初步的相似词序列;2)利用汉语的"部首偏旁表字义、字义表词义"的构词知识,增加与给定词具有相同表义字或相同表义偏旁部首的那些相似词的权重,调整相似词序列;3)提出词义相似度计算的评测方法,制备高质量的标准数据;将词义相似度计算作为构件嵌入到其他自然语言处理实用系统,检验效果。申请人在本领域完成了博士论文,组织过多次国际评测,基础扎实,积累丰富。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

智能煤矿建设路线与工程实践

智能煤矿建设路线与工程实践

DOI:10.13199/j.cnki.cst.2020.07.010
发表时间:2020
2

东太平洋红藻诊断色素浓度的卫星遥感研究

东太平洋红藻诊断色素浓度的卫星遥感研究

DOI:10.13634/j.cnki.mes.2022.05.020
发表时间:2022
3

信息熵-保真度联合度量函数的单幅图像去雾方法

信息熵-保真度联合度量函数的单幅图像去雾方法

DOI:10.3724/SP.J.1089.2019.17435
发表时间:2019
4

基于暂态波形相关性的配电网故障定位方法

基于暂态波形相关性的配电网故障定位方法

DOI:10.7500/aeps20191122006
发表时间:2020
5

基于PROSAIL模型和多角度遥感数据的森林叶面积指数反演

基于PROSAIL模型和多角度遥感数据的森林叶面积指数反演

DOI:10.11707/j.1001-7488.20210410
发表时间:2021

金澎的其他基金

批准号:61373056
批准年份:2013
资助金额:73.00
项目类别:面上项目

相似国自然基金

1

空间群组目标相似度计算模型研究

批准号:41201476
批准年份:2012
负责人:刘涛
学科分类:D0115
资助金额:25.00
项目类别:青年科学基金项目
2

基于深度学习的句子相似度计算研究

批准号:61672127
批准年份:2016
负责人:黄德根
学科分类:F0211
资助金额:62.00
项目类别:面上项目
3

面向医学特定疾病的问题分析和相似度计算模型研究

批准号:61772146
批准年份:2017
负责人:郝天永
学科分类:F0211
资助金额:67.00
项目类别:面上项目
4

基于内蕴几何结构的颅面相似度计算与复原

批准号:61702293
批准年份:2017
负责人:赵俊莉
学科分类:F0209
资助金额:25.00
项目类别:青年科学基金项目