The unconstructed high-dimensional, multi-source and heterogeneous data analysis of mobile Internet is a key point for data analysis and applications. .This project mainly focuses on the approach to structure mobile internet data for analysis. Based on context awareness technology, the project makes the deeper sight of user behavior and patterns. There are three main aspects. Firstly, the project studies the classification and described method of mobile internet users from high-dimensional scale. We define the user's behavior characteristics from time, environmental and data stream. Then we propose a map-spectrum model for user behavior characteristics description. Secondly, the project studies the method of analyzing user behavior from multiple spatial and temporal scales. We will do some researches on mining the users’ shifting law among different applications by context awareness. More importantly, we will analyze the relationship of several different law. Thirdly, the project studies the mining approach of mobile internet users. We use Renyi cross entropy to classify the users with similarity profiles into groups and expecting the users in the same groups have similar behavior profiles..The research work for the project realize the data mining and analyzing the mobile internet. It also provide support to the content recommendations and business intelligence. .
移动互联网高维度、多源、异构的非结构化用户数据分析是移动互联网数据分析与应用的关键切入点。本项目通过结合情境感知与信息熵度量对用户的行为规律深入挖掘、描述和分类,从用户行为模式角度研究将移动互联网数据结构化的分析处理方法。主要有三个方面工作,首先研究从时间特征、环境特征和数据特征等多维度尺度下建立用户行为图谱模型,统一描述用户行为特征的方法。其次研究多时空尺度下用户使用不同类型应用之间的迁移规律,挖掘行为的潜在习惯,并对各种规律进行关联分析。最后研究采用基于互信息雷尼熵的相似性度量方法,度量不同用户行为图谱之间的相似性,实现用户的聚类,深度掌握用户的兴趣特征和行为特点。项目的研究工作将图像的信息熵分析方法引入移动互联网用户数据挖掘,能够实现移动互联网数据的深度分析,为针对性业务推送和商业智能决策等细粒度、精密化服务提供支撑。
本项目主要通过Airbnb、新浪微博等移动互联网平台挖掘用户数据分析用户行为,并扩展了相关研究向移动互联网用户评论信息语义的情感分析、用户定价博弈策略和公共安全敏感信息监测等应用领域。主要有一下几方面内容:(1)从时间特征、环境特征和数据特征等多维度尺度下建立用户行为模型,统一描述用户行为特征的方法。(2)多时空尺度下用户使用不同类型应用之间的迁移规律、挖掘用户行为的潜在习惯,并对各种规律进行关联分析。(3)通过用户兴趣特征和行为特点,研究用户行为的相似性度量方法,实现用户聚类。(4)探索在多个移动互联网平台上对用户行为进行分析,实现监督与半监督的定价策略、情感分析、敏感信息监测和主题发现等应用。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
面向移动用户个性化服务的情境数据挖掘方法及应用研究
基于用户情境感知的低能耗移动数据访问机制及技术
多源异构数据中的攻击关联模式挖掘方法研究
融合压缩感知与张量理论的多参量异构WSN高维数据感知重建研究