文本中信息的自动抽取方法研究

基本信息

批准号：69375016

项目类别：面上项目

资助金额：6.00

负责人：张永奎

学科分类：

依托单位：山西大学

批准年份：1993

结题年份：1995

起止时间：1994-01-01 - 1995-12-31

项目状态：已结题

项目参与者：张永奎,亢临生,李国臣,高敏,肖宝玮,李红涛

关键词：

信息抽取正文分析

结项摘要

从文本中抽取信息的过程可粗略地分解为文本分析和信息抽取两个阶段。我们研制了一个基于文本的信息检索实验系统，利用自然语言处理技术从无结构的自由文本中提取相关信息并构造结构化的包括相关知识的数据库，从而实现智能信息检索。该系统采用了语义驱幼的文本分析技术，可把一个自由文本转换成一个结构化的文本表示。信息的表示和抽取是通过一种灵活的结构模板来实现的。数据库的检索及自然语言查询采用了定子句语法和差别表方法。结构模板中的部位名词汇的获取采用了基于统计分析和电子词典相结合的计算机辅助编辑方法。电子词典的快速查找问题通过Trie索引来解决，从而避免了重新组织词典文件，可满足查找一个词条只需访问一次磁盘的要求。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.3724/SP.J.1089.2019.17435

发表时间：2019

DOI：10.7498/aps.68.20181682

发表时间：2019

DOI：10.3969/j.issn.1000-0844.2017.05.0820

发表时间：2017

张永奎的其他基金

批准号：69575011

批准年份：1995

资助金额：8.00

项目类别：面上项目

批准号：29876024

批准年份：1998

资助金额：14.00

项目类别：面上项目

批准号：60475022

批准年份：2004

资助金额：22.00

项目类别：面上项目

批准号：20576082

批准年份：2005

资助金额：25.00

项目类别：面上项目

批准号：20176032

批准年份：2001

资助金额：20.00

项目类别：面上项目

相似国自然基金

基于集成学习的生物医学文本信息抽取方法研究

批准号：61402099

批准年份：2014

负责人：王浩畅

学科分类：F0211

资助金额：24.00

项目类别：青年科学基金项目

医疗对话文本中的信息抽取关键技术研究

批准号：61906196

批准年份：2019

负责人：张元哲

学科分类：F0606

资助金额：25.00

项目类别：青年科学基金项目

基于多源信息融合的元数据自动抽取方法研究

批准号：61202232

批准年份：2012

负责人：高良才

学科分类：F0211

资助金额：21.00

项目类别：青年科学基金项目

面向专利文本中实体关系抽取的远程监督方法研究

批准号：71704169

批准年份：2017

负责人：陈亮

学科分类：G0414

资助金额：19.00

项目类别：青年科学基金项目

文本中信息的自动抽取方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

信息熵-保真度联合度量函数的单幅图像去雾方法

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

铁路大跨度简支钢桁梁桥车-桥耦合振动研究

张永奎的其他基金

利用多种机读资源建造汉语语义机用词典的方法研究

微生物分解磷矿的基础性研究

Web突发事件新闻内容过滤中的若干关键技术研究

微生物法脱除天然气中硫化氢的基础研究

微生物及Fe3+溶液烟气脱硫的基础研究

相似国自然基金