XBRL领域本体的自动构建研究

基本信息
批准号:71771104
项目类别:面上项目
资助金额:47.00
负责人:潘定
学科分类:
依托单位:暨南大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:郭葆春,汤胤,温秋华,梁倬骞,翁秀木,曹志鹏,郑桦,许亚
关键词:
计算术语学描述逻辑领域本体财务报告本体学习
结项摘要

There is conflict in usability and formal representation of XBRL financial reporting, we have focused on building formal representation language of XBRL taxonomy before. This project will introduce domain ontology on the taxonomy, to enhance overall semantic representation mechanism. Since the manual construction of ontologies is an expensive and time consuming task, the automatic construction of the XBRL domain ontology will be faced with two challenges: building formal financial reporting terms system and generating the terms automatically or semi-automatically from financial statement text.. The project researches into building accurate semantic representation system of XBRL financial reporting terms, and exploring automatic method producing terms from financial report notes, using description logic theory and ontology learning methods. The main research includes financial reporting terms system based on multi-spaces perspective, XBRL domain ontology based on extended description logic, annotated corpus of listed company financial reporting and terms analysis, automatic extract method of terms and relations from financial statement note, and semantic similarity computing of accounting terms. The project conduces to improve financial data quality and information share, and facilitate application of Chinese domain ontology construction. The utility of research outcomes will establish the foundation of generating automatically XBRL financial reporting, and provide the scientific evidence in order to national macro policy making and enterprise investment decision-making.

XBRL财务报告的易用性与形式化语义表达存在冲突,我们前期研究重点是为XBRL分类标准构建形式化表达语言。本项目拟在分类标准之上引入领域本体,增强整体语义表达机制。XBRL领域本体自动构建面临的主要挑战:建立形式化的财务报告术语体系、从财务报告文本中自动或半自动生成术语。. 本项目运用描述逻辑理论和本体学习方法,研究建立XBRL财务报告的术语精确语义表达,探索从财务报告附注文本中自动抽取术语的方法。主要研究内容包括基于多空间视角的财务报告术语体系、基于扩展描述逻辑的XBRL领域本体、上市公司财务报告的标注语料库与术语分析、财务报表附注术语及其关系的自动抽取方法,以及基于术语语义空间模型的会计术语语义相似度计算。这些研究有助于提高财务数据质量和信息共享,促进中文本体自动构建技术的实用化。其成果的应用将为自动生成XBRL财务报告奠定基础,为国家政策制定和企业投资决策提供科学依据。

项目摘要

经过多年推广应用,XBRL财务报告仍然受困于易用性与形式化语义表达的平衡,导致XBRL分类标准的术语歧义和术语随意性问题。本项目试图通过引入领域本体,增强语义表达机制,并建立XBRL领域本体的自动构建方法。项目的主要研究内容是:财务报告术语体系、基于扩展描述逻辑的XBRL领域本体、上市公司财务报告的标注语料库与术语分析、财务报表附注术语及其关系的自动抽取方法,以及基于术语语义空间模型的会计术语语义相似度计算。项目主要研究成果有:.(1)评估现有XBRL分类标准的质量情况,通过构建会计词典有向图,并利用改进的PageRank算法提取环路上的点,保证语义基元提取的全面性和科学性。.(2)运用动态描述逻辑,将财务报告中跨领域知识推理问题转换成知识节点及其属性关联路径的推理过程,并提出一个基于相似度的节点语义关联算法,为面向多情境决策场景的数据重构提供推理机制。.(3)对企业采纳XBRL技术因素的博弈研究表明,无政府监管下企业群体采纳意愿的演化稳定策略并不唯一;在政企非对称博弈中,均衡结果与XBRL成本效益、监管力度、惩罚力度和采纳初始状态有关。.(4)采用机器视觉的方法,提出一个考虑标题层次结构和上下文信息的标题自动标注模型,实现财务报告内容标题和文本内容的自动标注,并构建年报标注语料库。.(5)将代表会计术语特征的短文本通过LDA文本分类建立语义基元,构建了一个财务报告领域本体学习模型,实现财务报告领域本体的系统构建。.(6)提出一个财务报告附注代表性事件抽取框架,基于ELMo预训练模型构建事件类别分类器,再构建基于句法依存树的事件抽取模型对事件元素进行识别和标注。.(7)在社会比较对消费者行为影响的研究发现:思维聚焦方式会调节比较差异对消费者自控行为的影响,其次,自我效能感在这一影响机制中起到中介作用;最后,自我接纳对这一机制起到调节作用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

青藏高原狮泉河-拉果错-永珠-嘉黎蛇绿混杂岩带时空结构与构造演化

DOI:10.3799/dqkx.2020.083
发表时间:2020
4

结核性胸膜炎分子及生化免疫学诊断研究进展

结核性胸膜炎分子及生化免疫学诊断研究进展

DOI:10.3760/cma.j.issn.1674-2397.2020.05.013
发表时间:2020
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

潘定的其他基金

批准号:70771044
批准年份:2007
资助金额:21.00
项目类别:面上项目
批准号:71171097
批准年份:2011
资助金额:45.00
项目类别:面上项目

相似国自然基金

1

中文领域本体学习及半自动构建方法研究

批准号:71201032
批准年份:2012
负责人:于娟
学科分类:G0112
资助金额:19.00
项目类别:青年科学基金项目
2

基于主动学习的半监督领域本体自动构建

批准号:60903098
批准年份:2009
负责人:彭涛
学科分类:F0210
资助金额:17.00
项目类别:青年科学基金项目
3

基于领域本体的Petri网自动集成机理与应用模式研究

批准号:60903099
批准年份:2009
负责人:马炳先
学科分类:F0211
资助金额:17.00
项目类别:青年科学基金项目
4

诊疗本体自动构建方法与过程驱动的本体进化机制研究

批准号:71171132
批准年份:2011
负责人:姜丽红
学科分类:G0112
资助金额:40.00
项目类别:面上项目