从文本中抽取信息的过程可粗略地分解为文本分析和信息抽取两个阶段。我们研制了一个基于文本的信息检索实验系统,利用自然语言处理技术从无结构的自由文本中提取相关信息并构造结构化的包括相关知识的数据库,从而实现智能信息检索。该系统采用了语义驱幼的文本分析技术,可把一个自由文本转换成一个结构化的文本表示。信息的表示和抽取是通过一种灵活的结构模板来实现的。数据库的检索及自然语言查询采用了定子句语法和差别表方法。结构模板中的部位名词汇的获取采用了基于统计分析和电子词典相结合的计算机辅助编辑方法。电子词典的快速查找问题通过Trie索引来解决,从而避免了重新组织词典文件,可满足查找一个词条只需访问一次磁盘的要求。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于集成学习的生物医学文本信息抽取方法研究
医疗对话文本中的信息抽取关键技术研究
基于多源信息融合的元数据自动抽取方法研究
面向专利文本中实体关系抽取的远程监督方法研究