Bootstrap

推荐系统三十六式学习笔记:产品篇35 | 说说信息流的前世今生

信息流,就是Feed,包括社交动态信息流,也有图文资讯信息流,短视频信息流。

在前面说过,推荐系统是一种注意力存储器,注意力是信息经济时代的稀缺商品,广告商向平台方购买注意力,平台方把存储的注意力分一点给广告商,然后通过推荐系统收集更多注意力补充回来。

在今天,最厉害的注意力存储器就是信息流,尤其是个性化信息流,也叫做兴趣Feed,这也是推荐系统的一种。

前世今生

说信息流,就不得不提到NewsFeed。2004年,Facebook问世,2006年,信息流鼻祖NewsFeed横空出世,经过十多年,NewsFeed已经是日收入几千万美金的现金大牛。

在NewsFeed上线前,经历过两个抗议阶段,第一个是把新鲜事公布出来,原先的新鲜事被大家认为是隐私,在时间线中呈现出来被好友看见不妥,而事实是,每个人在意的除了自己的隐私被公布,更在意的是朋友的八卦,数据表明新鲜事被公布后,用户活跃度大幅上涨。

第二个就是NewsFeed上线,用户广泛抗议,原来按照时间先后顺序阅读新鲜事,现在却按照重要程度阅读,非常不习惯,然而数据表明,用户互动行为再一次大幅度提高。

这些年来,NewsFeed有数不清的改进,甚至每天线上会同时部署很多算法版本进行AB测试。后来的故事大家都知道了,Facebook上市,股价逐年上涨。

NewsFeed的成功,验证了几个常识:

数据驱动比舆论驱动靠谱,别听人们嘴上是怎么说的,只看人们是如何行动的;
窥探隐私,向群体靠拢,害怕孤单是普遍人性,把新鲜事公开这件事验证了这一点;
注意力非常有限,用推荐系统的方法更好地储存注意力,基于兴趣的信息流验证了这一点。
后来,Twitter,微博,Instagram,老牌的时间线信息流方式如今都换成了按照兴趣筛选内容,原因都是信息泛滥,用户错过的信息量越来越多,注意力耗散很多,无法将耗散的注意力变现成了这些平台最大的痛。

今天,搜索公司Google、百度,都已经押注了信息流,更不说那辆行驶在注意力收割航道里的短视频新兴巨轮。

这些公司,尤其是其中的上市公司,在财报里也会提及信息流,可以说,信息流在今天已经是红透了半边天。

配套设施

信息流是一个低衰减的注意力存储器,但是光有信息流是不完整的,最大的问题可能有两个:

  1. 内容源不足,无法形成信息过载,注意力就不会稀缺,注意力是无法待价而沽的商品;
  2. 在注意力变成稀缺的事物后,存储的注意力无法变现,反哺平台自身。

针对这两个问题,完整的信息流产品还需要配套设施。以NewsFeed为例,讲讲信息流的配套设施。

1.内容源

内容源是注意力的重要间接影响因素。“内容哪里来”是信息流要不断思考的问题,对于NewsFeed来说,就是社交关系上的人发布新鲜事。

NewsFeed存在的前提是要依赖用户建立大量的社交联系,这样才会出现信息过载,因此NewsFeed的一个重要的配套设施就是“你可能感兴趣的人”推荐系统。

这是一个我们在产品形式上比较熟悉的推荐系统,它是一套大规模矩阵分解算法,在前面的专栏已经专门讲过,这套推荐系统希望用户和用户,用户和App、公共主页等都建立起大量的连接。

建立起连接,相当于变相地增加了内容源,这些用户发布的新鲜事,App产生的内容,公共主页发布的帖子,都会通过这些连接流进用户的个人信息流。

社交信息流中,内容源依赖于社交关系的数量。而图文资讯信息流,则更多依赖爬虫技术,“不生产内容,只是内容的搬运工”。

依赖爬虫的信息流内容源,质量非常不可控,会有涉黄、涉政、涉暴力等敏感内容,甄别工作量非常巨大,而且一旦控制不好就是社会事件,代价惨重,这一点在2018年,你一定感受很深。

内容源是信息流的一种重要基础设施,要想尽办法建设好。内容源应该考虑下面几种。

  1. 质量:虽然群体喜欢消费低质量的内容,便宜商品,但是一旦出现敏感内容, 不合格的商品等,代价还是很高昂。
  2. 多样性:信息只有多样了才有信息量,有了多样性才能满足更多的用户,才能在存储海量注意力时不衰减。
  3. 数量:数量自不必说,推荐系统解决信息过载问题,没有信息过载问题怎么办呢?就是先制造信息过载问题,要制造信息过载,信息的数量就要有保障。

2.广告系统

NewsFeed还有另一个配套设施,也是它为什么每天能吸金几千万刀的原因:那就是广告系统。

Facebook的广告形态多样。

  1. Suggested Page (你可能喜欢的公众页)
  2. Page Post (公众号帖子推广)
  3. Suggested App (你可能喜欢的应用)
  4. Video Ads (视频广告)

广告主花钱购买信息流存储的注意力,俗称信息流变现。实际上就是信息流产品供应注意力,广告主消费注意力。注意这枚硬币的另一面:广告主供应的什么,用户是否消费了,则是另外一套看待角度。

以前,Facebook鼓励商业机构花钱投广告增加粉丝,彼时的NewsFeed算法允许随意发广告,看上去就是公共主页发布了新鲜事。

这一阶段对应着增加用户和内容源之间的连接阶段,是一个非常必要的步骤。看上去广告主增加了自己的粉丝,用户增加了内容源,而本质上则是让注意力买主先看到他种草的商品,这个阶段只让广告主每天摸摸自己种草的商品,并不是真的给他。

直到后来,平台方开始严格限制商业广告与普通用户触达,不只是Facebook,任何的信息流平台,在广告主吸引了足够粉丝之后,都会果断限制广告无节制地触达用户。种草的商品突然提价,广告主就只能剁手买买买,这就是广告系统了。

跟据某个专门做NewsFeed推广的公司追踪结果,1000个公共主页的50000条内容以原生方式触达用户的比例,从2012年16%降低到了2014年的6.51%,降了一倍还多。

当然也可能是因为用户平均关注的公共主页增多了,而本质上的原因就是,注意力市场开市了。

在注意力这边,存储注意力要做的事就是基于兴趣筛选信息流,重新排序展示,这样的好处就是用户不会错过自己感兴趣的,而本质上就是留住注意力,不要衰减。在注意力购买方这边,通过广告系统,大家去购买自己看中的注意力。

信息流,看上去就是这么一个简单的商业逻辑。广告主这边一开始和信息流平台方有非常甜蜜的日子,直到要花钱购买自己帮忙存储的注意力时,就会有怨言了。

曾经就有广告主对Facebook抗议道:那你干脆不要干涉NewsFeed排序啊,按时间线自然展示,用户错过就错过,大家都公平。对此Facebook的解释则是:数据显示,重排序后的NewsFeed可以让用户阅读积极性提高很多。这句话的意思是:这样做才能存储注意力啊。

关于到底要不要重排序的争吵,我们要看清楚,双方都是商业机构:一边是要消费注意力,一边在销售注意力。

这本身就是买卖嘛,不要谈什么情怀,商业社会永远是逐利的,逐利的手段就是制造信息不对称,并且在制造过程中不断提高效率和降低成本。

显然,“大家一起穷,完全拼人品”的时间线,不符合基本商业逻辑,信息流才符合商业逻辑。

世界上最遥远的距离就是:手握大把粉丝,却不能随心所欲地曝光自己的产品。

总结和展望

具体信息流会怎么发展,我们无法预测,但是可以肯定的有三点:

  1. 信息流是推荐系统在商业上最成功的应用;
  2. 完全依赖数据驱动的信息流会面临黑天鹅事件,所以人和算法协同进化的信息流会是最有生命力的;
  3. 数量上,注意力已被大厂囤在自己了手中,那么下一步要关注的是注意力的质量,这是信息流平台方的商品,毕竟广告主购买了注意力后,发现是地摊货,生意也不会长久的。
;