文本集特征提取方法及应用研究

基本信息
批准号:70673070
项目类别:面上项目
资助金额:20.00
负责人:李纲
学科分类:
依托单位:武汉大学
批准年份:2006
结题年份:2009
起止时间:2007-01-01 - 2009-12-31
项目状态: 已结题
项目参与者:罗琳,邓仲华,王毅彦,夏晨曦,魏泉,寇广增,杨熔
关键词:
语义映射词频义原文本特征词条过滤
结项摘要

互联网上的信息类型和信息量快速膨胀,但作为互联网海量信息中最基本的类型- - 文本信息的组织和检索效率仍难以令人满意。迄今为止,网上文本信息的组织非常混乱,获取和利用的方式比较简单。由于计算机不可能象人类一样理解和使用文本信息,所以必须把文本表示为某种计算机能够处理的方式,以便更好的挖掘和使用这些信息。. 文本集特征提取就是一种文本表示方法,通过对文本的分词,词条过滤,并使用语义映射处理同义词和多义词,将词条映射为特征,再通过某种算法计算特征值,根据某种标准选择若干特征,构建一个特征向量空间,使每个文本都可以表示为该空间中的一个向量。. 提取的文本特征可用于文本集的分类和聚类,或用于信息提取系统中,以便于更好的组织和利用文本信息。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于直观图的三支概念获取及属性特征分析

基于直观图的三支概念获取及属性特征分析

DOI:10.3778/j.issn.1673-9418.2104120
发表时间:
2

基于直觉模糊二元语义交互式群决策的技术创新项目选择

基于直觉模糊二元语义交互式群决策的技术创新项目选择

DOI:10.12005/orms.2019.0029
发表时间:2019
3

城市生活垃圾热值的特征变量选择方法及预测建模

城市生活垃圾热值的特征变量选择方法及预测建模

DOI:10.11936/bjutxb2021010011
发表时间:2021
4

泛"胡焕庸线"过渡带的地学认知与国土空间开发利用保护策略建构

泛"胡焕庸线"过渡带的地学认知与国土空间开发利用保护策略建构

DOI:10.15957/j.cnki.jjdl.2022.03.003
发表时间:2022
5

基于小波高阶统计量的数字图像来源取证方法

基于小波高阶统计量的数字图像来源取证方法

DOI:
发表时间:2017

李纲的其他基金

批准号:21341002
批准年份:2013
资助金额:10.00
项目类别:专项基金项目
批准号:20501017
批准年份:2005
资助金额:28.00
项目类别:青年科学基金项目
批准号:79900012
批准年份:1999
资助金额:9.00
项目类别:青年科学基金项目
批准号:21071127
批准年份:2010
资助金额:35.00
项目类别:面上项目
批准号:21871257
批准年份:2018
资助金额:65.00
项目类别:面上项目
批准号:21402198
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:51104121
批准年份:2011
资助金额:26.00
项目类别:青年科学基金项目
批准号:21571156
批准年份:2015
资助金额:70.00
项目类别:面上项目
批准号:71273196
批准年份:2012
资助金额:58.00
项目类别:面上项目

相似国自然基金

1

小样本集成预报方法的研究及其应用

批准号:40705039
批准年份:2007
负责人:马晓光
学科分类:D0511
资助金额:19.00
项目类别:青年科学基金项目
2

基于Web语料的维吾尔文重复模式识别算法及应用研究

批准号:61263044
批准年份:2012
负责人:木妮娜·玉素甫
学科分类:F0603
资助金额:47.00
项目类别:地区科学基金项目
3

基于连体段的维吾尔文识别应用研究

批准号:61163031
批准年份:2011
负责人:哈力木拉提·买买提
学科分类:F0211
资助金额:49.00
项目类别:地区科学基金项目
4

天文光谱特征提取及其应用研究

批准号:61273248
批准年份:2012
负责人:李乡儒
学科分类:F0304
资助金额:81.00
项目类别:面上项目