本研究拟通过学习结构化定义提高规划领域知识的自动获取能力,增强规划技术的可用性.动作模型和派生谓词规则均为规划领域描述中的结构化定义,手工编写这些定义费时又易错. 已有研究多从规划例中学习确定性动作模型,本课题拟从规划例中学习不确定性动作和派生谓词规则.具体研究内容包括:用基于归纳的方法学习一阶派生谓词规则,并将该方法扩展到不确定规划和部分观测环境中;结合约束满足学习不确定动作模型,并将该方法扩展到部分观测环境;将上述方法用于WSC问题产生WS的不确定动作模型,验证动作模型学习且可增强规划在WSC领域的可用性.其中重点和难点是一阶派生谓词规则的学习以及利用结构相似性提出不确定动作模型的学习.这是首次提出派生谓词规则的学习方法,首次学习不确定动作模型并扩展到部分观测环境.本课题可丰富规划领域知识自动获取技术,验证动作模型学习进而增强规划技术的可用性.
本项目通过学习不确定动作模型和派生谓词规则来提高规划领域知识的自动获取能力。动作模型和派生谓词规则均为规划领域描述的主体内容,虽用途不同但具有相似的结构化定义。但是手工编写这些定义既费时又易出错。已有不少研究从规划例中学习确定性动作模型或提取公理规则,但鲜有研究提取不确定动作模型(比确定性动作模型更一般)或者派生谓词规则(特殊的公理规则),更少见的是在部分观测的环境下提取二者。本项目先提出在完全观测环境下自动获取派生谓词规则和不确定动作模型的方法,然后将其扩展到部分观测的环境中。.所有原定研究目标均以实现。具体研究成果分类列举如下。(1)实现派生谓词规则的自动获取。分为两个情况。a)学习过程在基本的完全观测环境下进行,状态信息是完备的。提出产生训练例的基本规则,并利用谓词依赖关系增加规则候选式以改进一阶规则学习方法,从而实现派生谓词规则的自动获取。b)学习过程在一般的部分观测环境下进行,状态信息是不完备的,特别是动作的非直接效果(用派生谓词描述)是未知的。引入观测来产生待学习谓词的训练例,并基于实验探讨学习精准率与环境观测率之间的关系。(2)实现不确定动作模型的自动获取。同样分为两个情况。a)在基本的完全观测环境下,通过谓词变化集合来产生动作模型中前提和效果的候选式,对样例的不同解释程度产生不同的效果集合从而形成不确定的动作模型。b)上述方法扩展到一般的部分观测环境,使用观测来构成部分状态信息。计算命题在信念状态中成立的概率,根据概率变化来抽取效果模式和前提模式,并对效果模式进行聚类以去除冗余。(3)扩展派生谓词规则的应用。包括两点内容。a)使用派生谓词规则显式描述目标子集的存在条件,使用偏好表示目标子集的效益,从而扩展规划系统处理目标效益依赖的能力。b)使用派生谓词规则表示衍生目标与动作效果之间的依赖关系,借助角色来识别规划解的循环结构,从而实现在派生谓词规划领域提取通用规划解。(4)用数据库直接进行规划求解。对规划领域各组成要素建立实体关系模型,并使用存储过程来进行规划求解。
{{i.achievement_title}}
数据更新时间:2023-05-31
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
货币政策与汇率制度对国际收支的影响研究
智能规划中派生谓词的处理改进与应用扩展研究
智能规划中领域知识获取和知识推理算法的研究
基于谓词规划树的规划方法的研究
基于智能规划的空间信息服务组合模型自动构建