Bootstrap

KDD 2023 | 美团技术团队精选论文解读

总第571

2023年 第023篇

2ddbd7a1714a2f3782da9b161da6f426.png

本文精选了美团技术团队被KDD 2023收录的7篇论文进行解读,论文覆盖了Feed流推荐、多模态数据、实例分割、用户意图预测等多个方向。这些论文也是美团技术团队与国内多所高校、科研机构合作的成果。希望给从事相关研究工作的同学带来一些启发或者帮助。

ce91408475514ddc0d9ea4735126eff1.png

ACM SIGKDD(国际数据挖掘与知识发现大会,简称KDD)于1995年首次举办,自此成为数据挖掘领域的重要国际会议之一,也是研究数据挖掘和知识发现这一领域的学者和企业人士分享研究成果、讨论前沿话题、推动技术进步和发展的重要平台。ACM SIGKDD的宗旨是促进数据挖掘的应用和理论研究,支持和推动先进技术和方法的开发和创新,并推广数据挖掘和知识发现领域的教育、培训和普及。该组织致力于提高数据挖掘和知识发现的社会价值,推动其在各个领域的应用和发展。

01《PIER: Permutation-Level Interest-Based End-to-End Re-ranking Framework in E-commerce》

论文作者:晓文、杨凡(共同一作)、王泽、晓旭、国钢、永康、兴星、王栋等,均来自美团技术团队。

论文类型:长文

论文下载:PDF

7114efb887f494519708de632c347b4f.png

论文简介:Feed流推荐作为目前最主流的推荐载体,其推荐质量直接影响用户体验/商家效益/平台收入等多个核心指标。Feed推荐特点是为每个用户的请求生成并展示多个items,用户的点击行为会同时受到上文和下文影响。由于传统point-CTR预测是在展现items产生之前进行的,导致无法利用上下文信息,推荐质量受损。目前工业届更多考虑重排方案,然而由于排列的多样性,穷举会导致排列个数过多,实际很难落地。目前业界通常存在两种近似方案:

  1. 只考虑位置偏置和上文信息,但忽略下文影响效果;

  2. 同时考虑上下文,Listwise预估后重新排序,该方案存在Evaluation Before Reranking的问题。

以上两个方案在效果上均有损,因此如何在重排阶段同时考虑上下文,并且降低复杂度兼顾可落地性,是一个非常重要的问题。针对以上问题,论文提出了一个名为PIER的端到端重新排序框架,该框架遵循两阶段范式并包含两个主要模块,分别称为FPSM 和OCPM。

基于用户页面兴趣偏好,在FPSM中应用SimHash从全排列中快速的生成候选列表集合,降低了落地复杂度;然后在OCPM中设计了一种新颖的全向注意力建模机制,以更好地捕获列表中的上下文信息;最后,通过引入对比学习损失以端到端的方式联合训练这两个模块,使用OCPM的预测值来指导FPSM生成更好的列表。离线实验结果表明,PIER在公开和工业数据集上均优于基线模型,目前已经部署到美团外卖广告场景,取得了较为显著的成果。

02《A Collaborative Transfer Learning Framework for Cross-domain Recommendation》

论文作者:张伟、鹏业、张波、兴星、王栋等,均来自美团技术团队。

论文类型:长文

论文下载:PDF

5a285899c89eb97297330f9f343fe53b.png

论文简介:在推荐系统中,为了满足用户多样化的兴趣和需求,催生出多种业务领域(Domain)。每个领域的点击率(CTR)可能会有较大差别,这导致了对不同业务领域的CTR预测建模需求。为了提升目标域效果,越来越多的学者尝试综合利用多域数据改善模型表现,也被称为知识迁移。这其中主要有2种迁移学习的范式:1)预训练+微调:源域的最优解对于目标域可能是局部最优,导致负迁移(Negative Transfer);2)混合样本+多任务训练:不同域之间数量和特征存在差异,梯度容易被数据量大的域主导(Seesaw Effect)。

针对以上问题,该论文提出了一种协同跨域迁移学习框架(简称CCTL)来解决这些问题,通过协同训练的方式,评估源域样本对目标域的信息增益,以此作为反馈计算源域样本权重,从而使目标域获得更多有益的迁移知识。框架整体上分为两个模块:IFN模块用于输出源域样本表征及权重,SCN模块用于主模型训练及源域增益计算及反馈。同时,通过REN模块使用对比学习强化不同域的差异性信息,使用SAN模块对齐源域目标域在多个Token的表征。CCTL被部署在美团外卖展示广告场景,并取得较为明显的收益。

03《Modeling Dual Period-Varying Preferences for Takeaway Recommendation》

论文作者:玉婷(美团)、吴贻清(中国科学院计算技术研究所)、朱勇椿(中国科学院计算技术研究所)、庄福振(北京航空航天大学)、瑞东(美团)、北海(美团)、展博(美团)、安竹林(中国科学院计算技术研究所)、徐勇军(中国科学院计算技术研究所)

论文类型:长文

论文地址:PDF

9f5972037f64b031a4835da80b35029f.png

论文简介:外卖推荐系统旨在为用户提供含有符合用户兴趣偏好的菜品的商家,已经服务于数十亿用户。与传统推荐不同,外卖推荐面临两大挑战:

  1. 双重交互感知偏好。传统推荐往往关注单一层次的用户对商品的偏好,而外卖推荐则需要综合考虑用户对商家和菜品的双重偏好。

  2. 一天内的用户偏好变化。传统的推荐通常从会话级别或天级别的角度对用户偏好的连续变化进行建模。然而,在实际的外卖系统中,一天中的早、中、晚、深夜时段,用户的偏好差异显著。

为了应对这些挑战,该论文提出了一种针对于外卖推荐场景的双重时段变化偏好建模模型(DPVP)。具体而言,论文设计了双重交互感知(Dual Interaction-Aware) 模块,旨在根据用户与商店和食品的交互来捕捉用户的双重偏好。此外,为了模拟用户一天中不同时段变化的偏好,论文提出了基于时间的分解(Time-based Decomposition) 模块以及时间感知门控机制(Time-Aware Gate)。离线和在线实验均表明,论文模型在现实世界的数据集上优于最先进的方法,并且能够捕捉用户的双重时段变化的偏好。此外,该模型已经在美团外卖平台上线,取得了较为明显的成绩。

04 《A Multi-stage Framework for Online Bonus Allocation Based on Constrained User Intent Detection》

论文作者:王超、晓巍、徐帅、王哲、志强、冯岩、游安、陈彧等,均来自美团技术团队。

论文类型:长文

论文地址:PDF

0901f02a4162a05c5c745c84bd4b9afa.png

论文简介:奖励分配是营销领域的一个重要问题,通常可以建模为一个背包优化问题,主流的解决方案通常是两阶段的方法。第一阶段是用户意图检测,预测用户在每个奖励下的转化概率。在第二阶段求解运筹优化问题,得到最优分配策略。然而,该解决方案通常面临以下挑战:

  1. 在用户意图检测阶段,由于交互和噪声的稀疏性,传统的uplift估计方法缺乏可解释性,常出现违背边际效用为正的领域知识;

  2. 两个阶段之间存在最优性差距,限制了第二阶段所获得最优值的上界;

  3. 由于线上环境的变化,实际奖励成本消耗经常违反给定的预算限额。

为了解决上述挑战,论文提出了一个由三个模块组成的框架,即用户意图检测模块、在线分配模块和反馈控制模块。对于第一个挑战,在用户意图检测模块中,论文基于深度表示学习对效用增量进行隐式建模,提出单调约束结构增强模型解释性。为了减小两阶段最优性差距,进一步提出了凸约束模型来提高最优值的上限,以解决第二个挑战。针对第三个挑战,为了应对在线成本消耗地波动,论文利用框架中的反馈控制策略,使实际成本更准确地接近给定的预算限制。基于真实的美团支付数据评估以及线上A/B实验均证明了该方案的优势和有效性。

05《C-AOI: Contour-based Instance Segmentation for High-Quality Areas-of-Interest in Online Food Delivery Platform》

论文作者:奕达、丽影、大平、水平、方潇、井华、仁清、致钊等,均来自美团技术团队。

论文类型:长文

论文下载:PDF

3224b482accd371d27bba22c6d434af0.png

论文简介:AOI是配送业务数字化运营的基础设施,也是关键决策算法的基础单元。现有的AOI自动生成相关研究主要依赖于三种方式:1)预定义的形状;2)基于密度的聚类;3)需要多个模型进行后处理的语义分割方法。上述研究方法降低了AOI轮廓的生成质量上限从而限制了自动生成AOI轮廓的落地。

为了解决上述问题,该论文将其构建为基于实例分割的轮廓回归问题并提出了一种端到端的AOI轮廓自动生成框架C-AOI。在C-AOI中,提出了Contour Transformer、循环位置编码以及自适应匹配损失优化顶点回归路径。该模型在美团配送业务数据集上进行了实验,大幅提升AOI边界生成质量的同时具备较快的推理速度。此外,该模型已投产并应用于美团履约场景。

06 《NEON: Living Needs Prediction System in Meituan》

论文作者:兰孝翀(清华大学)、高宸(清华大学)、诗琪(美团)、秀琦(美团)、影格(美团)、张晗(美团)、华周(美团)、恒亮(美团)、李勇(清华大学)

论文类型:长文

论文地址:PDF

4c8bf1a57d6d64e2f04acb386f1739ad.png

论文简介:用户意图包含人们日常生活中的各类需求,如吃、住、娱乐等。美团作为连接用户和服务提供者的生活服务平台,用户意图预测问题往往被定义为预测用户当前的业务需求。准确理解用户意图对于生活服务平台而言至关重要,理解结果能够广泛应用于平台推荐系统、精准化营销等多种业务场景。然而,当前平台在用户意图预测问题上的探索并不是很多,且面临如下两个严峻挑战:

  1. 用户需求,经常受人物、地点、时间、自然环境等多种复杂因素的影响;

  2. 用户意图存在多样化特点,并非用户的所有需求都会在美团App上体现。

为了应对上述两个挑战,本论文设计了一个名为NEON的用户意图预测系统,其主要包括三个阶段:特征挖掘、特征融合和多任务预测。

  1. 在特征挖掘阶段,基于时、空、人、环境等维度进行用户消费场景定义,并重点提取了不同场景下的群体行为特征用于建模,通过人群共性行为辅助进行系统冷启优化,有效缓解了数据稀疏问题。

  2. 在特征融合阶段,构造了融合用户个体及所属群体行为特征的网络结构,该网络可以有效学习不同场景下的用户意图变化。

  3. 在多任务预测阶段,除了预测用户业务意图之外,引入辅助任务,用来预测用户履约方式偏好(送货到家、到店消费),以此来增强模型对时、空上下文的学习。

论文中的NEON系统,已部署至美团的推荐、营销、运营算法引擎中,大规模在线A/B测试评估实验表明,NEON在上述多个应用场景下均可带来业务效果的显著提升,实验结果证明了NEON系统在细粒度用户需求刻画、履约方式偏好识别、潜在需求预测等方面的有效性。

07 《A Hybrid Approach of Statistics and Embeddings for Multilingual and Multi-Locale Recommendation》

论文作者:伟佳(美团)、詹金(DataRobot) 、黄钟山(Freelance)、王露(微软)、王强(美团)

论文类型:Workshop

论文下载:PDF

fe7e15afa6b6824d4e56cce2bc22ec62.png

论文简介:为了鼓励多语言推荐系统的发展,亚马逊发布了一个多语言和多地区购物会话数据集,并基于该数据集举办了KDD Cup 2023多语言多地区会话推荐挑战赛。本论文介绍了美团在此次比赛中的解决方案。按照推荐系统中广泛使用的设定,美团的解决方案包括两个阶段:召回和排序。在第一阶段,利用各种召回策略检索一组候选Item,包括基于共同访问矩阵的I2I召回、基于GraphEmbedding的I2I召回、基于TextTransformer的I2I搜索和基于BPR的U2I召回。在第二阶段,训练了一个模型来预测每个用户与候选产品互动的概率。该模型是两个GBDT模型的集成,包括丰富的统计特征和Embedding相似度特征。该团队在在Track2中获得了第3名,在Track1中获得了第4名。

----------  END  ----------

 活动推荐 

4088b1e8644fb57a0849b22133ab7747.jpeg

随着《无人驾驶航空器飞行管理暂行条例》出台,低空经济在法律层面上有了明确的定义。美团作为城市低空物流的先行者,从2017年就开始探索无人机配送能力。2021年1月,我们实现第一单面向真实用户的无人机配送。至今为止已经完成超过17万单无人机配送。

美团于2023年7月5日在上海发布了第四代城市物流无人机,其多天候、高安全、低噪音等特点助力美团无人机配送开拓更多场景。本期沙龙将介绍城市低空物流无人机背后的设计挑战与应对。

8月19日(周六)下午,深圳线下+线上直播,美团技术专家们将分享以下6个议题,欢迎报名👏🏻

066dce265975d34e8b41ee68cbae2b91.jpeg

 美团科研合作 

美团科研合作致力于搭建美团技术团队与高校、科研机构、智库的合作桥梁和平台,依托美团丰富的业务场景、数据资源和真实的产业问题,开放创新,汇聚向上的力量,围绕机器人、人工智能、大数据、物联网、无人驾驶、运筹优化等领域,共同探索前沿科技和产业焦点宏观问题,促进产学研合作交流和成果转化,推动优秀人才培养。面向未来,我们期待能与更多高校和科研院所的老师和同学们进行合作。欢迎老师和同学们发送邮件至:[email protected]

 推荐阅读 

  | KDD 2022 | 美团技术团队精选论文解读

  | KDD Cup 2020多模态召回比赛亚军方案与搜索业务应用

  | 7次KDD Cup&Kaggle冠军的经验分享:从多领域优化到AutoML框架

;