Taking the cross language information retrieval service for China-ASEAN Free Trade Area as the research background, and Vietnamese, Chinese and English as the research object, the project, in the first place, uses the subject knowledge and methods such as deep learning, transfer learning, text mining, artificial intelligence and linguistics to study the query text representation based on word embeddings and its semantic deep learning model, along with query semantic transfer learning model. Their highly effective learning algorithm are designed, as well as target language query semantic deep learning model based on transfer learning in the cross language query expansion. Secondly, ASEAN countries language oriented cross language query expansion model and methods are studied based on deep learning and transfer learning, and their efficient expansion algorithms are designed to solve the bottleneck and difficulties of the current international prevailing query topic drift, word mismatch, query translation ambiguity and polysemy problem in cross language information retrieval, which provide new ideas and methods that can be used for reference for the improvement and enhancement of performances of cross language information retrieval system . Finally, the above research results are applied to the ASEAN cross-border commercial affairs big data retrieval, the model and methods of cross-border commercial information cross language retrieval are discussed and the cross language information system prototype of ASEAN cross-border business is designed and implemented based on deep learning, transfer learning and query expansion, which will effectively provide cross language information retrieval service for the China-ASEAN Free Trade Area and cross-border E-commerce.
本项目以中国-东盟自由贸易区跨语言信息检索服务为研究背景,以越南语、汉语和英语为研究对象,运用深度学习、迁移学习、文本挖掘、人工智能以及语言学等学科知识,首先研究查询文本向量化表示及其语义深度学习模型,查询语义迁移学习模型以及跨语言查询扩展中基于迁移学习的目标语言查询语义深度学习模型,设计其学习算法,然后深入研究面向东盟国家语言基于深度学习和迁移学习的跨语言查询扩展理论模型及方法,设计高效扩展算法,以解决当前国际上跨语言信息检索中普遍存在的查询主题严重漂移、词不匹配、查询项翻译歧义和多义性等问题,为跨语言信息检索系统查询性能的改善和提高提供可借鉴的新思路和新方法。最后,将研究成果应用于东盟跨境商务大数据检索,研究跨境商务信息跨语言检索模型及方法,设计和实现基于深度学习、迁移学习和查询扩展的东盟跨境商务跨语言信息检索系统原型,为中国-东盟自由贸易区及跨境电商事务提供有效的跨语言信息检索服务。
随着中国-东盟自由贸易区建设进程的加快,消除中国-东盟国家之间的语言障碍成为一个亟需解决和刻不容缓的重要问题。跨语言查询扩展是解决该问题的关键技术之一。本项目研究面向东盟语言的基于深度学习和迁移学习的跨语言查询扩展理论模型和方法,探讨项目理论成果在中国-东盟商务信息跨语言检索中的应用,设计和实现中国-东盟跨语言信息检索系统原型。.项目完成了研究任务和预期的目标,发表学术论文11篇,其中,北大中文核心期刊10篇,EI期刊4篇,CSCD期刊10篇,CSSCI期刊2篇,CCF推荐中文期刊A类3篇和B类4篇,人大复印报刊资料库全文转载1篇,申请发明专利31件,其中已授权6件,获得软件著作权11件,培养骨干教师7人和硕士研究生1人。主要工作及成果如下:.(1)研究融合深度学习和迁移学习的查询扩展模型:首先探索基于深度学习的查询文本向量化表示及其语义学习模型,然后建立基于高层语义词向量表示的扩展词提取机制和深度学习与关联模式挖掘融合的查询扩展理论模型,提出3种关联模式挖掘方法以及6种基于深度学习和关联模式挖掘的查询扩展模型及算法,申请该研究领域发明专利8件。这些成果在跨语言信息检索和文本挖掘等具有重要的理论意义和应用价值。.(2)研究面向东盟语言的跨语言查询扩展模型:建立基于深度学习和关联模式挖掘的面向东盟语言的跨语言查询扩展理论模型和方法,提出6种东盟跨语言查询扩展模型及算法,申请该研究领域发明专利6件。这些成果为解决跨语言信息检索中普遍存在的查询主题漂移、词不匹配、查询项翻译歧义和多义性等问题提供可借鉴的新思路和新方法。.(3)研究面向东盟的跨语言信息检索模型及其在中国-东盟商务信息跨语言检索中的应用:设计和实现基于深度学习和查询扩展的中国-东盟跨语言信息检索系统原型,提出3种东盟跨语言信息检索模型及算法,申请该研究领域发明专利17件,软件著作权登记11件。这些成果具有重要的应用价值和推广前景,可为中国-东盟自由贸易区及中国-东盟跨境电子商务活动等提供有效的跨语言信息检索服务。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
面向东盟国家语言的基于完全加权正负模式挖掘的跨语言查询扩展研究
基于迁移学习的跨语言情感分类研究
面向小数据语音建模的跨语言迁移学习研究
基于深度迁移学习的跨领域文本情感分类方法研究