Low-rank matrix approximation in sparse representation is a big challenge in collaborative filtering recommendation area. This project will merge the social network feature data into the low-rank matrix factorization model in which we apply a new regularization method to learning the latent low-rank information within the related user space after exploring the latent relationship between users in social network. The new model aims to provide a new approach on recommendation research with good theoretical explanation. The main research details will include: to explore latent relationship between users based on SNA, redefine the influence factors of trust between related users in social network applications, improve the existed trust propagation algorithm and construct effective trust metric model; develop low-rank matrix factorizations model based on social relation data, propose novel regularizations with prior knowledge in order to handle low-rank approximation with good performance; research cluster-based low-rank matrix factorization in massive data sets, divide the original user space using Genetic-Kmeans algorithm and develop new regularizations to learn the latent structures within each sub-spaces; finally, to complete the empirical study with some real social network applications, and the research model and method will apply to practical areas such as user behavior predicting in electronic market、Web community recommendation and E-commerce item recommendation.
数据缺失下的矩阵低秩分解是协同过滤推荐领域中一个具有挑战性的课题,本项目将用户的社会网络信息引入矩阵低秩分解模型,在研究Web社会网络信息的关联用户信任度问题的基础上,提出了新的社会化正则方法,引导模型学习关联用户空间的潜在低秩结构,理论上具有很好的解释性,为个性化推荐技术研究提供新思路。内容包括:基于社会网络分析的理论挖掘用户之间潜在联系,重新定义关联用户之间信任的描述方法,研究信任传播算法和构建有效的信任测度模型;提出基于社会网络用户信任关系的低秩矩阵分解模型,利用新的先验知识来构造正则项惩罚系数,引导模型向真实评分逼近;研究大规模数据下基于聚类的局部低秩矩阵分解模型,采用遗传聚类方法对原始空间进行划分,在每个子空间上构造新的社会化正则项学习该子空间的潜在低秩结构;最后结合Web社会网络应用进行实证研究,将所研究的方法应用于电子市场行为预测、Web社区推荐和荐和电子商务产品推荐等领域。
考虑到推荐系统中的在线用户和项目规模的快速增长,导致原始数据极度稀疏并含有大量噪声。现有的基于矩阵分解推荐模型在学习向量特征时极小化评分值的均方误差会导致模型的过度拟合而无法建立用户的真实兴趣。融合隐式信息增强预测的准确性已经成为了目前的主流思想,项目组将大规模高维数据所包含的社会化信息、隐式内容特征信息与低秩矩阵分解技术相结合,利用新的先验知识来构造正则项惩罚系数,优化机器学习过程,在提升预测模型的准确性和可扩展性等方面取得了一定的进展。项目组首先构建了社会网络信任度正则因子惩罚项,新的正则项由用户间的社会信任关系来引导,同时加强物品隐特征的约束,提出双重约束的矩阵分解推荐模型;为了体现了用户之间的兴趣差异性,提出一种基于用户内容偏好隐式反馈信息的矩阵分解模型,模型首先使用改进的基于搜索的遗传聚类算法对物品进行内容划分,然后在矩阵分解的目标函数中加入的新的内容偏好向量,该向量可视为用户对某特定类型物品的偏好而产生的对原偏好的偏差值,新模型在训练过程中体现出用户对内容偏好的自适应变化,能够更好的向真实评分逼近;考虑到社交信任关系的动态性对用户真实偏好的影响,提出了基于时间感知的社会化推荐模型,在新的模型中我们把时间感知因素作为对原用户隐向量的一个偏置向量,体现了最近时间内目标用户偏好的变化;探索了矩阵分解的并行计算方法,提出通过遗传聚类划分原始矩阵,分别在子空间上进行社会化矩阵分解的推荐模型,虽然取得了初步的实验结果,但是模型的维度约简优化方法,子空间上的约束惩罚项等细节还需要进一步深入研究;以上模型分别对3个真实数据集进行了实证研究,结果表明融合社交关联信息和物品隐式特征的推荐技术能够提高稀疏数据集上预测评分的准确性,而且时间感知的社会化推荐模型在可扩展性方面比目前主流的社会化推荐算法表现更加优秀,因此可以尝试应用在实际的推荐场景中。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
黄河流域水资源利用时空演变特征及驱动要素
拥堵路网交通流均衡分配模型
低轨卫星通信信道分配策略
卫生系统韧性研究概况及其展望
融合异构信息的低秩分解推荐模型研究
面向低质量图像数据的稀疏低秩矩阵回归与分解方法研究
时变稀疏信号压缩观测的低秩稀疏分解研究
基于低秩与稀疏矩阵分解的心肌灌注动态PET图像重建方法研究