Since the purchase decision is largely determined by reviews on the target product, the ranking-oriented manipulating behavior has become increasingly rampant, which is seriously threatening the banign development of the Internet. Fraud detection, (a.k.a. spammer detection) has therefore been an important issue in both academia and industry circles. However, the evidence that could indicate the fraudulence of users is usually hidden inside the heterogeneous data, and thus how to mine and fuse these evidences is crucial to the success of detectors. In light of this, we will first build a systematical framework for mining two evidences via structured topic analysis and spectral graph analysis, respectively. We then develop a quantitative system that could characterize the fraudulence of users and items effectively. Moreover, we propose to utilize the multi-task learning for fusing the multi-source evidences, and design a set of detection algorithms combing text topics and network features. Finally, a prototype system will be designed and implemented, upon which thorough experiments will be conducted to demonstrate the effectiveness of our research on both open datasets and real-world datasets.
由于用户的购买决策很大程度上受到商品评论的影响,以操榜为目标的电子商务欺诈行为泛滥成灾,正严重威胁着互联网的良性发展。电子商务欺诈检测成为当今学术界和工业界均关注的重要议题,而能有效反映欺诈行为的证据往往藏匿于不同类型的异质数据之中,因此,如何挖掘异质数据中的欺诈证据并进行有效融合是检测欺诈用户的关键问题。为此,本项目以评论文本和“用户-商品”二部图两种典型异质数据为切入点,研究短文本主题分析及二部图谱分析方法,以期从这两类数据中获得欺诈证据;然后,研究层次化主题与二部图谱特征的虚假度量化体系,实现异质化数据的知识对齐;接着研究基于多任务学习的多源证据融合模型和算法,设计融合文本主题和网络特征的欺诈检测算法。最后,研制欺诈检测原型系统,在开放数据集上、及电子商务企业真实环境中验证理论成果的有效性。
本项目主要用于检测操榜等电子商务欺诈用户,具体来说主要通过分析用户和商品丰富的交互行为来提交检测性能。主要检测基于机器人操纵和基于利益操纵的恶意用户。本项目主要集成短文本信息和用户-商品图信息数据来实现电子商务欺诈用户检测,主要成果包括:(1) 短文本主题分析的欺诈证据挖掘,主要采用上下文的文字层注意力来表达更为精确的状态信息和问题导向的句子层注意力来更好的对上下文信息进行建模实现交互式问答系统,基于用户日志等短文本数据来找到用户的拖延症的行为特征;(2) 图模型分析与应用:主要基于结构和属性信息实现深度属性图嵌入模型,并基于用户-歌曲二部图实现卡拉OK推荐应用,同时基于用户-POI二部图实现POI推荐;(3) 电子商务欺诈检测应用研究:主要基于网上众筹行为来预测一个特定的竞价活动的资金数额和未来几天的津贴,同时为了对人才流失行为进行建模,我们将一个时间序列的生存状态预测为一个多任务学习问题,此外针对企业网络舆情实现了基于最大边际相关性的企业所宣称内容的可靠性分析方法。本项目研究在相关领域实现了一定的理论突破,从而形成了以下几个方面的成果:(1)发表(含录用)期刊论文4篇,包括IEEE/ACM汇刊论文2篇;(2)发表国际会议论文6篇,包括SIGKDD、IJCAI等CCF A类会议4篇;(3)培养博士生2名。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
电子商务和电子服务的信任网络结构模式挖掘研究
融合网络特征的文本观点挖掘
异质文本主题挖掘研究及应用于癌症子类型的发现
高性能基于主题的文本聚类研究