Bootstrap

2021-CIKM-SimpleX: A Simple and Strong Baseline for Collaborative Filtering

  • CF三大块:交互Encoder、损失函数、负采样

  • 本文提出余弦对比损失,整合到一个简单的统一的CF模型—SimpleX

个人认为亮点在损失函数上,模型大道至简,表现很好;但是拿CCL和BPR比 相当于对于每个正样本pair,使用了更多(采样数量)并且权重不等(margin)的负样本,类似于阿里的EBR(21kdd)中提到softmax优于pairwise

2 BACKGROUND AND RELATED WORK

2.1 CF 定义
  • 交互Encoder,目的是学习到用户和物品的嵌入*(这篇文章的Encoder默认是基于表示的CF中的Encoder,不是说基于u-i匹配函数中的交互函数)*
  • 损失函数
  • 负采样
2.2 代表性CF工作总结
  • 基于矩阵分解
  • 基于自编码器
    • Q:为啥说这类模型适合inductive recommendation呢?从一组用户中学习模型,在另一组用户上进行推荐
  • 基于图
  • 其他

3 SIMPLEX

3.1 余弦对比损失
  • BPR loss、binary cross-entropy、softmax cross-entropy 、pairwise hinge loss

本文提出CCL,一个正样本pair(u,i), ∣ N ∣ |N| N 个负采样&

;