面向宏观经济监测预警的互联网信息挖掘方法研究

基本信息
批准号:71571180
项目类别:面上项目
资助金额:49.30
负责人:尚维
学科分类:
依托单位:中国科学院数学与系统科学研究院
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:徐山鹰,谢刚,田素芬,杨铭,鲍勤,朱荣,霍琳,王伟,吴超
关键词:
开源指数宏观经济预警数据挖掘互联网信息挖掘用户搜索
结项摘要

Mission of this research is to incorporate public available open source data from the Internet into national macroeconomic monitoring and early warning. Existing web data mining models are to be improved according to the sequential nature of economic early warning analysis. A methodology framework is to be proposed, and economic and financial ontology and sentiment database are to be developed with the research on enhanced models of text mining, opinion extraction, economic sentiment and attention index. Tasks of this project include: 1) theoretical research on the mechanisms of incorporating the Internet data into macroeconomic early warning; 2) Internet text mining and opinion extraction; 3) Information retrieval and data sampling of the price and transaction information on e-business websites; 4) open source economic index modeling and assessment; 5) macroeconomic monitoring and early warning modelling and empirical researches integrated with open source data. The research focus to solve the theoretical foundations of using Internet data to reflect economic system dynamics, to propose a rigorous approach for opinion aggregation and user search keywords selection, big data sampling and open source index assessment. This research will hopefully achieve generalizable theoretical foundations and methodologies for the application of web data mining in macroeconomic analysis domain, offer a richer data source for economic early warning, and also improve the timeliness of macroeconomic early warning empirical tasks.

本研究旨在将来自互联网的公开可获得的开源数据用于国家宏观经济监测预警,针对经济监测预警时序分析的特点,改进已有的互联网信息挖掘相关模型方法,设计面向宏观经济监测预警的互联网信息挖掘方法框架,建立经济金融本体体系和语义词库,提出一系列改进的文本挖掘、观点提取、经济舆情与经济关注指数模型方法。主要内容包括:互联网信息用于宏观经济监测预警的机理研究、互联网文本信息挖掘与观点提取方法研究、电子商务网站价格及交易信息提取与抽样方法研究、开源指数建模与评价方法研究和集成开源数据的宏观经济监测预警模型方法与实证研究。本研究拟重点解决互联网数据用于经济预测预警的理论基础、观点聚合及用户搜索关键词选择的规范性、互联网交易大数据样本抽样和开源指数评价等问题。研究成果有望为互联网信息挖掘方法在宏观经济分析领域的应用提供科学规范的理论基础和模型方法,拓展经济监测预警数据来源,提高经济监测预警实证分析工作的及时性。

项目摘要

互联网公开可获得的开源数据已成为企业商业决策和国家经济政策决策的重要信息来源。本研究着重解决如何从互联网数据中提取经济舆情信息,用于宏观经济和金融的监测预警。研究内容包括:互联网信息用于宏观经济监测预警的机理、互联网文本信息挖掘与观点提取方法、电子商务网站信息获取与清洗、开源指数建模与评价方法研究和集成开源数据的宏观经济监测预警模型方法与实证研究。.本研究构建了面向宏观经济监测预警的互联网信息挖掘方法体系,通过文本挖掘和基于统计与机器学习的方法,建立了从微观个体网络观点到宏观经济态势预期的机理模型及技术框架。在宏观经济监测预警领域相关的语义分析和观点提取方面,对现有文本分类模型、主题分析模型、情感分析模型进行改进,引入了深度学习模型,用于处理经济金融文本数据,构建了以物价、房地产、原油、股市、财政补贴等宏观经济金融领域本体体系和语义词库。在前述成果基础上,开发基于用户搜索、互联网新闻文本和互联网交易数据的宏观经济监测预警开源指数模型及相应的算法库。在经济增长、通货膨胀、房地产景气、居民食品消费、贸易摩擦、股票市场和原油市场监测预警领域的实证检验结果表明,所提出的模型方法和算法工具能够有效提取目标经济领域相关的互联网文本信息,服务于监测预警和政策分析任务。.本研究所提出的构建预警场景相关词典的方法,解决了采用互联网信息进行经济预警领域最为重要的关键词选择问题。采用该方法构建的经济舆情指数,与现有依据经验或词频选择关键词的方法相比,更加尊重数据内在特征,在保证预警有效性的前提下最大化了关键词的覆盖范围,从而使预警效果更为稳定。本研究提出的深度学习神经网络进行新闻文本处理的方法,是深度学习在经济文本处理中的早期应用之一,所设计的语言模型和网络结构是经济舆情数据挖掘方法的重要突破。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
4

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
5

生物炭用量对东北黑土理化性质和溶解有机质特性的影响

生物炭用量对东北黑土理化性质和溶解有机质特性的影响

DOI:10.19336/j.cnki.trtb.2020112601
发表时间:2021

尚维的其他基金

批准号:70801059
批准年份:2008
资助金额:8.00
项目类别:青年科学基金项目
批准号:71171186
批准年份:2011
资助金额:42.00
项目类别:面上项目

相似国自然基金

1

基于互联网信息挖掘的旅游需求预测及预警方法研究

批准号:71601021
批准年份:2016
负责人:李新
学科分类:G0104
资助金额:17.00
项目类别:青年科学基金项目
2

面向宏观经济预警的群决策支持问题研究

批准号:70801059
批准年份:2008
负责人:尚维
学科分类:G0112
资助金额:8.00
项目类别:青年科学基金项目
3

癫痫发作早期预警信息的监测理论与方法研究

批准号:61102042
批准年份:2011
负责人:于喆
学科分类:F0124
资助金额:24.00
项目类别:青年科学基金项目
4

面向互联网的跨媒体挖掘与搜索引擎

批准号:90920303
批准年份:2009
负责人:庄越挺
学科分类:F0603
资助金额:280.00
项目类别:重大研究计划