The searching for housing prices control policies is an incomplete information dynamical games, in which equilibrium would be approximated under the conditions of the optimal tradeoff between the overall social welfare and overall social cost in the complex of a close system, consisting of the government, banks, and real estate developers. The study, extending the analysis of two-two games to the games among government, banks, and real estate developers, will first demonstrate the dynamical transition and composition process of social welfare and social cost within the system. Secondly, using the government as the starting and ending point of the complete loop system, our study developed an algorithm for approximating the overall social welfare and social cost based on the incomplete information dynamical game and equilibrium. Finally, constrained to the optimal condition mention above, the feasible solution set could be simulated based on dynamical programming approaches. Furthermore, the optimal solution set could be selected within the feasible solution set based on the optimal tradeoff between the marginal welfares and marginal costs. As a result, this study could be utilized for housing prices control policies evaluation and therefore provide long-term equilibrium for the cooperation and conflict conducts among the government, banks, and real estate developers.
研究抑制房价快速上涨的调控政策应该是在由政府、银行和房地产三个节点构成的完整系统中,在经济增长目标及社会总福利与社会总成本最优配置的约束条件下,重复不完全信息博弈和动态均衡的寻优过程。本研究首先将上述三个节点的两两合作与冲突行为扩展到三者之间进行分析,建立完整系统。通过多主体、多方向的博弈分析,完整地展现系统内合作与冲突行为的传导与叠加过程。其次,将政府作为系统合作与冲突行为的起点和终点,建立三节点合作福利和冲突成本算法,构建不完全信息下重复博弈和动态均衡模型。最后,在上述约束条件下,通过对动态规划进行数值寻优和模拟,结合近年来我国房地产调控的实际经验数据,估算可行解空间范围内的最优解集。通过设定最优解集的递进关系,即根据社会总福利和社会总成本的边际增加(减少)域,来对解集进行排序,从而建立调控政策集的福利和成本精确量化评估方法,进而获得长期均衡下的最优房地产调控政策域。
近年来,抑制房价快速上涨的调控政策一直在监管层面和学术领域进行研究和讨论。调控政策从单纯的行政手段(限价、限贷和限购)向以市场为导向(供需和价格)的经济学措施进行扩展和转变。本研究首先通过多主体、多方向的博弈分析,完整地展现系统内合作与冲突行为的传导与叠加过程。其次,将政府作为系统合作与冲突行为的起点和终点,建立房价调控政策、宏观经济指标以及社会福利与社会成本之间的桥式不完全信息下重复博弈和动态均衡模型。最后,通过深度增强学习算法对动态规划进行数值寻优和模拟,结合近年来我国房地产调控的实际经验数据,估算可行解空间范围内的受限于不受限最优政策解集。本研究的科学意义主要包括以下三点:1、在Srinivasan and Wei(2008)和Gottlob(2008)等人研究的基础上,提出一个可供宏观博弈决策演绎过程进行仿真的理论框架和实践平台,将不可实验和不可重复的社会科学研究问题,转化为类似于自然科学的可实验和重复研究手段,为多学科、跨专业的交叉应用,提供了一个很好的参考案例;2、在Insua, etc(2009)等人研究的基础上,将决策演绎过程进行展示,可以较为清晰的窥视处于不同竞争地位的对手,是如何基于自身收益最大化和风险承受最小化角度进行政策博弈的,这对了解宏观政策决策过程和博弈风险评估关键点,具有很好的理论参考价值;3、在Gottlob(2008)和Zheng(2006)等人研究的基础上,创造性地采用深度增强学习的算法来研究决策过程,这对决策论的研究有非常好的可借鉴性。首先,增强学习也是分步式的逐步演进过程,而决策(Decision Making)也是一个逐步根据最新信息进行调整的过程。因此增强学习的学习过程(Learning Process)比较符合决策的进化过程(Revolver Process)。其次,增强学习通过转化概率(Transition Probability)也考虑了决策结果的不确定性,这比较符合决策结果以及博弈过程不确定性的实际情况。最后,结合不完全动态博弈的框架与模型,深度增强学习能够较为准确地把握到主体(entity)在实际政策环境中的决策过程,能够提供一个很好的实践应用平台。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
硬件木马:关键问题研究进展及新动向
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
拥堵路网交通流均衡分配模型
内点最大化与冗余点控制的小型无人机遥感图像配准
基于DSGE模型的房价波动研究与房地产调控政策效应模拟
银行系统风险的建模与估计:基于银行同业复杂网络和货币政策视角
广义非合作博弈的均衡和优化算法研究
房价动态指数、房价波动和最优货币政策——信息冲击和金融中介的作用