上一节我们已经讲了CB算法这一次我们就来介绍推荐系统下一个算法:
CF(Collaborative Filterin)基于协同过滤的推荐算法
CF算法包含如下两类:
User-Base CF 和 Item-Base CF
CF算法和CB算法不同的是数据源是基于用户历史行为和物品的矩阵数据即UI(User—Iterm)矩阵数据,用户的行为通过一个表格来归纳起来。
协同过滤输入数据只需要三个维度:userid ,itemid, score :就是这个人对这个物品的打分,打分就是对一个物品的喜爱程度。
工作原理:
1.从用户的历史行为信息里抽取出了UI矩阵。UserA->item:score item:score
2.得到了UI矩阵,就可以生成UI的转置IU矩阵*UI矩阵 得到 II矩阵【行和列都是Item】就是我给你一个itemA->item1:score item2:score 和UI矩阵*IU矩阵得到UU矩阵【行和列都是User】,UserA->user1:score user2:score
3.将得到的II矩阵放入II矩阵 NoSQL数据库中和UU矩阵放入UU矩阵 NoSQL数据库。
4.若此时用户点击《张学友的爱情片》,这时系统会拿到这个item将《张学友的爱情片》作为key 去查 II 矩阵 NoSQL数据库的其他的item1:score item2:score
5.若此时业务场景为QQ一个用户B,在用户的首页去推荐给