Lightfm学习记录

2024-02-21 22:36:02
开发
55

推荐参考资料

官方文档

仓库地址

论文地址

LightFM推荐系统框架学习笔记

LightFM推荐模型库

(利于入门)how-i-would-explain-building-lightfm-hybrid-recommenders-to-a-5-year-old

(用处不大)协同推荐 + lightfm + 根据用户已读诗词推荐

(可能有用)Recommendation System in Python: LightFM

(进阶调参有用)针对推荐系统隐式和显式反馈的混合模型——lightFM（下：python场景实例）

上面的引用资料都很有用！

矩阵分解

日常业务中可以得到用户的行为数据(交互)，如点赞/评分等，如三元组{userID,itemID,rate},但是复杂业务中矩阵会很大，且矩阵十分稀疏(可能1w个物品，用户A只点赞了5个，我们在lightfm中使用的就是scipy的coo_matrix和csr_matrix)。我们的推荐，实际上就是预测这些空白项的值。因此我们引入矩阵分解，将这个大矩阵分解为两个较小的矩阵以实现降维，如M x N分解为M x k和k x N，即把他们投射到k维(这个k无法解释，此时就成为隐向量了)。此时两个小矩阵重新一乘，原来有的项会近似相等，原来的空白项此时也有值，那么这些值就是预测值了。
而对于这个分解过程，就有一些算法和目标函数了，我暂时还没搞懂
按照论文的说法，至少比MF模型和CB要好

混合模型

由于协同过滤需要历史交互数据，存在冷启动问题；同时由于基于内容的推荐没有使用交互，用户之间是孤立的，所以实际效果不如协同过滤。所以提出了混合模型，结合了基于内容的推荐(CB)和协同过滤的基于模型推荐(CF协同过滤，MF矩阵分解)两种方式，训练者可以传入用户/物品的特征信息(如地理位置/年龄)等，同时也传入交互信息{userID,itemID,rate},那么在数据少时仍可以基于用户物品的特征进行适当的推荐
所以，如果没有传入用户物品的特征信息，那么模型只是一个单纯的MF模型，基于内容是通过embedding实现的
而embedding是通过矩阵分解得到的，事实上M x k的矩阵都是embedding

论文解读(我是科研新人，如有不对欢迎指正)

模型的需求：1. 如果物品A和B经常同时被推荐，那么应该学到A和B非常相似 2. 模型能即时根据新数据进行更新
对于需求一，使用latent representation，根据交互信息确定两个物体的embedding的距离。
对于需求二，将用户和物体表示为内容特征的线性组合

对于predict，就是是对用户/物品的已分解出的特征矩阵进行点积，再加上偏置，得到一个值 $\hat r_{ui}$ ，这个就是MF模型的方法。但是这个 $q_u$ 和 $p_i$ 还有那两个偏置都是各特征之和(也算线性组合)，所以也融入了一点CB的思想。
$\hat r_{ui} = f (q_u · p_i + b_u + b_i)$

目标函数是求最优化的分解出的矩阵，利用了交互信息，即对于交互信息(有正向和负向的交互)，每个{user,item}对求出 $\hat r_{ui}$ 然后根据正负属性进行操作，累乘后再两部分相乘。
在这里插入图片描述
论文中提及的模型结构如下

原文地址:https://blog.csdn.net/qq_51955445/article/details/136187872 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1760312425690828800.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

Lightfm学习记录

矩阵分解

混合模型

论文解读(我是科研新人，如有不对欢迎指正)

相关推荐

最近更新

热门阅读