汉语动词子语类框架的自动获取技术研究

基本信息
批准号:60503071
项目类别:青年科学基金项目
资助金额:23.00
负责人:穗志方
学科分类:
依托单位:北京大学
批准年份:2005
结题年份:2008
起止时间:2006-01-01 - 2008-12-31
项目状态: 已结题
项目参与者:俞士汶,吴云芳,李芸,王洪俊,靳志辉,谌贻荣,丁万松,张秦龙
关键词:
子语类框架计算词汇学词汇知识的自动获取统计机器学习
结项摘要

大规模、高质量的词汇知识资源是自然语言系统处理真实文本的基本保证。随着语料库建设的发展以及机器学习研究的不断深入,基于大规模语料库的语言知识自动获取已经成为必然趋势。本申请以汉语动词子语类框架知识资源的建设为目标,重点研究汉语动词子语类框架的自动获取技术。子语类框架是描述动词词汇知识的一种最基本的形式,它是句法分析和词汇语义知识描述的前提和基础。语言学理论指导下的统计机器学习是本申请拟采取的基本研究方法。具体地,将从语言学的角度重点分析自动获取过程中的噪音问题和数据稀疏问题,通过把论元结构和动词义类信息作为特征加入最大熵模型中,在自动获取子语类框架的过程中统一解决这两个问题。最后,通过一个基于应用的评测机制评价动词子语类框架在句法分析应用中的实际效用。本申请将为建立大规模、高质量的汉语动词子语类框架知识资源奠定技术基础。其研究方法和关键技术对其它语言知识的自动获取也具有方法论上的参考意义。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于铁路客流分配的旅客列车开行方案调整方法

基于铁路客流分配的旅客列车开行方案调整方法

DOI:
发表时间:2021
2

新型树启发式搜索算法的机器人路径规划

新型树启发式搜索算法的机器人路径规划

DOI:10.3778/j.issn.1002-8331.1903-0411
发表时间:2020
3

智能煤矿建设路线与工程实践

智能煤矿建设路线与工程实践

DOI:10.13199/j.cnki.cst.2020.07.010
发表时间:2020
4

现代优化理论与应用

现代优化理论与应用

DOI:10.1360/SSM-2020-0035
发表时间:2020
5

基于自适应干扰估测器的协作机器人关节速度波动抑制方法

基于自适应干扰估测器的协作机器人关节速度波动抑制方法

DOI:10.13973/j.cnki.robot.210412
发表时间:2022

穗志方的其他基金

批准号:61772040
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:61375074
批准年份:2013
资助金额:79.00
项目类别:面上项目
批准号:60873156
批准年份:2008
资助金额:32.00
项目类别:面上项目
批准号:61075067
批准年份:2010
资助金额:37.00
项目类别:面上项目

相似国自然基金

1

汉语动词次范畴化自动获取技术的研究

批准号:60373101
批准年份:2003
负责人:赵铁军
学科分类:F0211
资助金额:23.00
项目类别:面上项目
2

汉语动词搭配知识的自动发现研究

批准号:69903007
批准年份:1999
负责人:周强
学科分类:F0211
资助金额:12.00
项目类别:青年科学基金项目
3

维吾尔语框架语义角色自动标注技术研究

批准号:61163029
批准年份:2011
负责人:阿里甫·库尔班
学科分类:F0211
资助金额:49.00
项目类别:地区科学基金项目
4

英汉动词次范畴化对应关系自动获取研究

批准号:60773069
批准年份:2007
负责人:赵铁军
学科分类:F0211
资助金额:28.00
项目类别:面上项目