基于词语相似关系的统计数据平滑研究

基本信息
批准号:60572159
项目类别:面上项目
资助金额:24.00
负责人:宋柔
学科分类:
依托单位:北京语言大学
批准年份:2005
结题年份:2008
起止时间:2006-01-01 - 2008-12-31
项目状态: 已结题
项目参与者:荀恩东,石嘉明,罗智勇,樊太志,王洁,尚英,颜伟,张瑞朋,胡克力
关键词:
相似关系语料库数据稀疏
结项摘要

语料库统计方法是支持下一代网络自然语言处理功能的关键技术,但这一方法有许多基础性问题尚无深入研究,以致相关应用系统的性能提高受到很大局限,其中尤以数据稀疏问题为甚。缓解数据稀疏问题的平滑方法中,常用的插值方法不适合估计低频词预测问题,阶次回退法存在本质的矛盾,词类平滑方法过于粗糙。本课题深入分析了语料库统计方法的需求和汉语的实际,创性地利用词语相似关系进行平滑,并采用线性邻接属性计算相似度,需要研究相似度计算、同形异质词认定与排歧以及利用相似度的平滑算法。这些方法将集成到本项目组已经取得的关于线性文法的成果中去,改善语料库统计方法的性能,支持下一代网络的文本信息处理功能。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

智能煤矿建设路线与工程实践

智能煤矿建设路线与工程实践

DOI:10.13199/j.cnki.cst.2020.07.010
发表时间:2020
2

基于暂态波形相关性的配电网故障定位方法

基于暂态波形相关性的配电网故障定位方法

DOI:10.7500/aeps20191122006
发表时间:2020
3

WMTL-代数中的蕴涵滤子及其应用

WMTL-代数中的蕴涵滤子及其应用

DOI:10.11897/SP.J.1016.2018.00886
发表时间:2018
4

相关系数SVD增强随机共振的单向阀故障诊断

相关系数SVD增强随机共振的单向阀故障诊断

DOI:
发表时间:2018
5

基于PROSAIL模型和多角度遥感数据的森林叶面积指数反演

基于PROSAIL模型和多角度遥感数据的森林叶面积指数反演

DOI:10.11707/j.1001-7488.20210410
发表时间:2021

宋柔的其他基金

批准号:60272055
批准年份:2002
资助金额:22.00
项目类别:面上项目
批准号:69273042
批准年份:1992
资助金额:6.00
项目类别:面上项目
批准号:61672175
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:60141001
批准年份:2001
资助金额:8.00
项目类别:专项基金项目
批准号:61171129
批准年份:2011
资助金额:62.00
项目类别:面上项目
批准号:69882001
批准年份:1998
资助金额:18.00
项目类别:专项基金项目
批准号:69472015
批准年份:1994
资助金额:8.00
项目类别:面上项目
批准号:69682001
批准年份:1996
资助金额:14.50
项目类别:专项基金项目
批准号:68973027
批准年份:1989
资助金额:3.00
项目类别:面上项目
批准号:60872121
批准年份:2008
资助金额:30.00
项目类别:面上项目

相似国自然基金

1

中文词语信息结构关系的自动辨识

批准号:60372064
批准年份:2003
负责人:董强
学科分类:F0113
资助金额:20.00
项目类别:面上项目
2

汉语词语接续关系的柔性系统及其应用研究

批准号:69682001
批准年份:1996
负责人:宋柔
学科分类:F0113
资助金额:14.50
项目类别:专项基金项目
3

基于非完全相似和相关关系的框架节点性能研究

批准号:51178192
批准年份:2011
负责人:王湛
学科分类:E0804
资助金额:65.00
项目类别:面上项目
4

基于国际编码标准的藏文词语排序算法研究

批准号:61163013
批准年份:2011
负责人:边巴旺堆
学科分类:F0201
资助金额:30.00
项目类别:地区科学基金项目