基于语义的上市公司年报文本信息质量测度方法及应用

基本信息
批准号:71201052
项目类别:青年科学基金项目
资助金额:19.00
负责人:蒋艳辉
学科分类:
依托单位:湖南大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:姚靠华,杨艳,丁方飞,曹越,姚铮,周双文,王薇
关键词:
计算语言学语义测度方法信息质量公司报告
结项摘要

The narrative information of corporate reporting is very important for information user's decision making. It is the key element for understanding and using corporate reporting that measuring the quality of corporate reporting narrative information correctly. Nowadays, the method for measuring the quality of the narrative information is mainly based on person's manual analysis .this method is difficult to measure the text's semantic information. The development of computational linguistic provide some theory and technology for the measuring of semantic information of corporate reporting effectively. Based on the computational linguistics theory, this program will construct a listed companies' corporate reporting ontology. Using this ontology, the rule hiding in the narrative reporting will be extracted. The extracting algorithm is mainly about the similarity computing. The similarity is very important for the measuring of information. In this program, the similarity is used to compute the indexes. Within a integrate indexes, through a basic algorithm, the quality of listed companies' corporate reporting can be measured effectively. The basic contributions of this program are that the research will extend the measuring contend of narrative information quality, and provide a bridge for the integrated research of accounting and computational linguistics. This will be benefit to human's senior knowledge share.

上市公司年报文本信息对决策者越来越重要。正确测度年报文本信息质量,是 正确理解和使用年报的关键。而当前会计学界对上市公司年报文本信息质量的测度,受限于当前以人工手动分析主的测度方法,很难对年报中表述灵活的中文叙述性信息进行语义层面的有效分析和提取。计算语言学的飞速发展,为上市公司年报文本语义信息的分析和处理提供了很好的理论和技术支撑。本项目基于计算语言学理论,构建上市公司年报领域本体,抽取上市年报文本信息规则,基于规则相似度对文本信息质量指标进行计量,建立综合评价模型,对上市公司年报文本信息质量进行有效测度。本项目提出的测度方法不仅能拓展年报文本信息质量测度的深度和宽度,而且也可实现计算语言技术从通用语言的语法分析到专业领域语言的语义分析的跨越,提高专业领域文本信息的智能化处理程度,促进人类高级专业知识的共享。

项目摘要

上市公司披露的信息形式越来越多元化,年报中70%以上的信息都是以非数字形式存在的文本信息。文本信息成为管理决策中的重要信息来源。然而,文本信息不像数字信息,具有模糊、多义,难以测度与量化的特性。基于此,本项目应用计算语言理论与方法,基于财务领域知识,开发设计智能化的文本语言测度方法,并应用于管理决策。.在上市公司年报文本信息抽取与质量特征描述方面,本项目采用自主开发的网络爬虫程序,自动从我国证交所、各上市公司官方网站收集了中国A股上市公司(2695家) 2003~2014年的年报26800份,及相关的财务文本信息630000条。构建了中国上市公司财务会计领域本体库、中国上市公司财务词典和中国上市公司财务情感词典。.在上市公司年报文本信息质量测度模型方面,本项目基于计算语言学,基于会计领域文本的领域特征与其对应的语义特征,开发了基于语义相似度的文本信息质量测度模型和基于信息熵的文本信息高维度质量约减模型。特别完成了对年报有关“风险信息”和“研发信息”的信息抽取和测度。.在上市公司年报文本信息质量应用方面,本项目结合上市公司财务数字信息和资本市场信息,对文本信息披露质量进行验证,特别完成了对上市公司研发信息,MD&A,风险信息,盈余管理信息等的质量进行了分析与应用,研究发现,通过分析年报文本信息质量,可优化投资决策和公司风险管理决策。.本项目取得的研究成果主要表现在三个方面:.1..自建的数据库:.*中国上市公司年报文本数据库,抽取了中国A股2695家上市公司2003~2014年的年报文本信息;.*中国上市公司财务会计领域词典,基于会计领域知识和财务报告,构建了包含会计专业术语和核心词汇及词汇间基本关系的会计词典;.*分析师报告数据库,形成中国A股2695家上市公司相关的分析跟踪报道630000条;.*中国财务会计文本情感词典,利用上市公司年报等渠道获得的财经语料结合财务知识进行标注,共标注10000条,然后应用机器学习算法,自动习得其他所有年报中出现的情感语料,得到财务会计领域情感词典。.2..自主开发的上市公司文本信息分析算法.3..基于上市公司年报文本信息的管理决策优化科研论文17篇,.发表在《中国管理科学》,《中国软科学》,《科研管理》,《系统沟工程》,《International journal of Applied Mathematics》

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
2

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

DOI:10.3969/j.issn.1002-0268.2020.03.007
发表时间:2020
3

气载放射性碘采样测量方法研究进展

气载放射性碘采样测量方法研究进展

DOI:
发表时间:2020
4

肉苁蓉种子质量评价及药材初加工研究

肉苁蓉种子质量评价及药材初加工研究

DOI:10.11842/wst.2017.02.019
发表时间:2017
5

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021

蒋艳辉的其他基金

相似国自然基金

1

企业描述性创新信息披露的影响因素和经济后果:基于上市公司年报文本分析的视角

批准号:71772150
批准年份:2017
负责人:胡楠
学科分类:G0209
资助金额:48.00
项目类别:面上项目
2

基于网络文本语义的信息隐藏方法研究

批准号:61472092
批准年份:2014
负责人:李福芳
学科分类:F0206
资助金额:86.00
项目类别:面上项目
3

面向文本信息安全的类别语义模型分类方法研究

批准号:61202226
批准年份:2012
负责人:周晓飞
学科分类:F0607
资助金额:22.00
项目类别:青年科学基金项目
4

上市公司文本信息分析研究:基于大数据的视角

批准号:71472113
批准年份:2014
负责人:何贤杰
学科分类:G0206
资助金额:57.00
项目类别:面上项目