Apache Spark ALS建议

怪物

我已经运行了一个使用MllibApache Spark网站上找到的ALS推荐程序系统程序当使用评级为1-5的数据集(我使用过MovieLens数据集)时,它会给出建议的预测评级超过5!我在小型测试中发现的最高分数是7.4。显然,我或者误解了代码的意图,或者某些地方出了问题。我已经研究了潜在因子推荐系统,并且给人的印象是Spark Mlib ALS实现是基于此系统的

为什么它返回的评分超出可能的水平?这个不成立。

我误解了算法还是程序有缺陷?

肖恩·欧文(Sean Owen)

您正在寻找正确的论文,但是,我认为您期望算法能够完成它不打算执行的操作。作为两个矩阵的乘积,它会为您的输入生成一个低秩近似,但乘以矩阵并不会限制输出值。

您可以钳制或四舍五入这些值。您可能不希望这样做,因为您获得了有关预测等级比5强多少的额外信息。我认为该算法在技术上也不可能假定最大可能值是输入中的最大观察值。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章