对话管理为中心的双向多模态口语人机交互研究

基本信息
批准号:90820303
项目类别:重大研究计划
资助金额:280.00
负责人:徐波
学科分类:
依托单位:中国科学院自动化研究所
批准年份:2008
结题年份:2012
起止时间:2009-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:陶建华,陈益强,高佳卿,孟猛,刘军发,王晓瑞,陈道新,周可艳,倪崇嘉
关键词:
多模态人机对话口语对话管理口语分析理解多模态信息融合
结项摘要

本课题选择汽车导航和交互式口语学习两个典型展示领域,研究实现以口语为主,融合行为、情感等信息的双向多模态人机交互。研究内容以对话管理为重点,包括对话管理模型、用户模型、基于对话预测的口语分析与理解、多模态响应信息生成等,突破多模态信息在识别理解尤其在对话管理层次的深度融合。本课题通过融入对话结构和对对话建模状态空间的分类,减少用户模型和管理模型对数据资源规模的要求,同时通过用户模型加强对话模型的建模能力。通过综合集成语音等多模态信息识别,本研究成果可广泛应用于改善各种人机对话系统的效率和方便程度,从而提高社会的信息化程度。

项目摘要

本项目以对话管理研究为中心,以双向多模态口语人机对话为表现形式,通过典型应用场景实现对话管理和多模态信息对口语信息分析和理解的支撑。研究成果包括:(1)建立了具备详细标注的典型对话口语语料库(CASIA-CASSIL)和面向市政服务领域的多轮回、长对话的真实口语对话语料库,并建立了多模态数据采集平台,通过该平台已构造多场景的多模态对话语料库;(2)完成了基于“云模式”的高性能语音识别、合成和翻译技术和服务,能满足不同多模态人机交互中不同领域、不同环境下对语音交互性能要求;(3)完成了面向多模态人机交互的拟人化的虚拟人原型系统,虚拟人能够理解包括语音在内的来自用户的典型多模态输入和输出行为(包括头姿、手势、表情、典型指令等);(4)研究建立了基于MDP的对话模型,MDP能够比较有效地刻划对话的结构,具有一定的领域无关特性,同时MDP预测结果的加入提高了SVM识别的正确率,加上利用基本名词短语、邻接对、主题、频率、位置等特征,能进一步对话行为的理解正确率;(5)形成了比较系统的多模态对话生成架构和语言描述,同时研究了口唇、手势、表情等自然生成算法,有效地解决了语音与其它模态信息在强耦合和弱耦合情形下的融合问题,并完成了一系列的多模态相应生成,为研究可交互的虚拟人打下了结实的基础;(6)基于上述研究完成了面向天气预报和交通信息查询的2个多模态对话演示系统:“北京市的交通信息查询系统”和“面向世界著名城市的天气信息查询系统”,系统建立的多模态对话管理模型,能灵活处理具有置信度的语音、视觉、行为和情感等多模态信息,对于用户输入的指定查询信息,通过预测能有效降低意图识别错误率;(7)目前在国内和国际重要期刊和会议上已发表论文60余篇,申请和授权发明专利12项,申请软件著作权5项,在执行期间与中新数字媒体研究院与新加坡国立大学(NUS)等展开了学术交流。本项目完成了预期目标,研究成果为基于语音感知的多模态新型人机方式的发展提供理论和技术基础,可方便地作为人机交互界面集成到各种人机对话系统中,改善对话系统的效率和方便程度,从而提高社会的信息化程度。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
4

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
5

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018

徐波的其他基金

批准号:60272041
批准年份:2002
资助金额:20.00
项目类别:面上项目
批准号:21301069
批准年份:2013
资助金额:24.00
项目类别:青年科学基金项目
批准号:81672743
批准年份:2016
资助金额:63.00
项目类别:面上项目
批准号:51772260
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:31760438
批准年份:2017
资助金额:38.00
项目类别:地区科学基金项目
批准号:11264014
批准年份:2012
资助金额:50.00
项目类别:地区科学基金项目
批准号:10904054
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:51409227
批准年份:2014
资助金额:26.00
项目类别:青年科学基金项目
批准号:30770933
批准年份:2007
资助金额:30.00
项目类别:面上项目
批准号:11664012
批准年份:2016
资助金额:40.00
项目类别:地区科学基金项目
批准号:61906035
批准年份:2019
资助金额:24.00
项目类别:青年科学基金项目
批准号:11204123
批准年份:2012
资助金额:24.00
项目类别:青年科学基金项目
批准号:61773130
批准年份:2017
资助金额:65.00
项目类别:面上项目
批准号:81100826
批准年份:2011
资助金额:23.00
项目类别:青年科学基金项目
批准号:31500319
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:31371204
批准年份:2013
资助金额:15.00
项目类别:面上项目
批准号:31460047
批准年份:2014
资助金额:50.00
项目类别:地区科学基金项目
批准号:51072175
批准年份:2010
资助金额:37.00
项目类别:面上项目
批准号:31060208
批准年份:2010
资助金额:25.00
项目类别:地区科学基金项目
批准号:31570196
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:31571225
批准年份:2015
资助金额:52.00
项目类别:面上项目
批准号:31360372
批准年份:2013
资助金额:50.00
项目类别:地区科学基金项目
批准号:60076024
批准年份:2000
资助金额:18.00
项目类别:面上项目
批准号:50871097
批准年份:2008
资助金额:33.00
项目类别:面上项目
批准号:31200169
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

面向口语对话系统的用户情感识别研究

批准号:61472117
批准年份:2014
负责人:全昌勤
学科分类:F0211
资助金额:81.00
项目类别:面上项目
2

面向自然口语对话的深层次信息感知与表达方法研究

批准号:61375027
批准年份:2013
负责人:吴志勇
学科分类:F0605
资助金额:78.00
项目类别:面上项目
3

服务机器人灵巧操作的多模态感知融合与人机交互

批准号:U1613212
批准年份:2016
负责人:刘华平
学科分类:F0306
资助金额:260.00
项目类别:联合基金项目
4

面向聋儿言语康复的多模态人机交互模型及技术研究

批准号:61502052
批准年份:2015
负责人:赵剑
学科分类:F0209
资助金额:21.00
项目类别:青年科学基金项目