2019Recsys参会流水记录

参会记录

Posted by BY on September 21, 2019

记录一下会上自己提前预习以及一些后续要做的事情的记录,其中有5篇标注的重点阅读文章,每一篇都会重点阅读之后发出来。

Recsys 2019其实相对往年人数差不多,来了大约840多人,相比去年没有增加多少,不知道是不是因为酒店礼堂大小的限制,明年在巴西的里约热内卢,据说能容纳两千人,预计人数会翻倍。论文提交数目基本全球还是挺分散的,最多是美国,22%占比,其次就是中国9.3%,还有提升的空间。涉及到的问题真的是挺广的,基本上推荐系统各个环节你能想到的都有。然后国内上台讲的貌似只有阿里巴巴,有三篇paper,然后估计是为了照顾本地,本地的学校和企业讲的还挺多,但都基本上没有什么干货,参会的华人也挺多的,但是过来过来的貌似比较少,都是google,facebook之类过来的。

今年的Best Full Paper是给了《Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches》,也是会议上反响最热烈的Paper了,讲完导致后面讲的人都说,我们的结果一定是可以复现的,贼逗。

Recsys有一个特点就是鼓励提出问题,Paper如果你能提出一个好的问题,基本就能通过。还是挺有意思的,看今年的Best Paper就能看出来,实际问题中其实也是提出问题比解决问题更重要,在公司中能够提出好问题的人很少,但是你要找个能解决问题的人,还是很容易能招到一大把的。

2019-09-16

AM

  • Rude Awakenings from Behaviourist Dreams. Methodological Integrity and the GDPR 会议PPT的标题是Law for computer Scientists,挺大的一个题目,布鲁塞尔大学的一个教授讲的,主要是讲欧洲这边的隐私保护相关的GDPR,欧洲人特别注重隐私,很多大厂Facebook,Google之类的都被罚了好多次了,李彦宏说过中国人没有隐私,所以目前还问题不大。

  • Paper Session 1: Ranking and Deep Learning in Recommenders

  1. LPPersonalized Re-ranking for Recommendation 会上的第一篇paper,阿里巴巴的哥们,讲的是通过一个深度模型解决Rerank问题,就是ranking层筛选出要推荐的10个item,但是这10个item到底应该按什么顺序排才会最大化优化目标。

  2. Online Ranking Combination 组合排序模型来提升效果的一种方法。

  3. A Pareto-Efficient Algorithm for Multiple Objective Optimization in E-Commerce Recommendation 排序中多目标优化的一篇文章,也是阿里巴巴的。叫 Pareto-Efficient learning to Rank,多目标优化中在不损害现有目标的情况下尽可能的提升效果。我们已知的多目标优化中存在最大的问题就多个目标往往不能同时提升,提升一个目标往往意味着另一个指标下降,比如说点击率和完度率。

  4. From Preference into Decision Making: Modeling User Interactions in Recommender Systems 这个也是特别有意思的一个文章,我们显示中的排序模型一般分为三种,pointWise/pairWise/listWise。隐含三种假设,点击是独立的,有成对的偏好,以及真个list都会有影响。但是这篇文章基于Decision Field Theory,更关注人的变化,意思是人在作出决策的时候是会变化的,简单例子,假设推荐了一个美女图集,而正好你喜欢的女生在旁边,你很可能不会点击,等到晚上回去疯狂点击,哈哈哈。

  5. Deep Generative Ranking for Personalized Recommendation 这是一篇北交大的博士论文,通过设计porbabilistic latent-veriable model模型结果,对于收到的pointWise的点击反馈,用PairWise去排序。

  6. Recommending What Video to Watch Next: A Multitask Ranking System 重点阅读文章,主要场景是youtube的Next Watch,大家都知道youtube论文的质量,这次会议有两篇,另一篇是涉及到online learning的,也是这个场景。

PM

  • Industry Session 1: Novel Uses
  1. Using AI to Build Communities Around Interests on LinkedIn LinkedIn出品,核心意思他们的目标是让用户发现,参与,共享。怎么通过人工智能技术作者写的,作者给出一个blog

  2. The Trinity of Luxury Fashion Recommendations: Data, Experts and Experimentation farftch时尚领域推荐,特点是趋势变化很快,所以他们推荐从刚开始的协同转变到了embedding。三个特点是1.编辑会精选时尚趋势,2.会有人工运营页面3.基于计算机视觉的技术

  3. Just Play Something Awesome: The Personalization Powering Voice Interactions at Pandora Pandora音乐推荐

  4. Future of In-Vehicle Recommendation Systems Bosch车载系统推荐,属于复杂应用场景,主要说了未来的车载系统,技术比较少

  5. Designer-Driven Add-to-Cart Algorithms 宜家推荐技术。

  • Paper Session 2: User Side of Recommender Systems
  1. Users in the Loop: A Psychologically-Informed Approach to Similar Item Retrieval 这也是很有意思的一篇论文,大概意思是我们做推荐的基础假设是有问题的,实际的相似度sim(A,B) != sim(B,A),提出了一个Tversky相似度,通过参数调整更合理的定义相似度。

  2. Explaining and Exploring Job Recommendations: a User-driven Approach for Interacting with Knowledge-based Job Recommender Systems 找工作职位匹配推荐技术。

  3. Designing for the Better by Taking Users into Account: A Qualitative Evaluation of User Control Mechanisms in (News) Recommender Systems 通过给推荐系统中加入用户控制机制,解决缺乏多样性,透明度之类的问题

  4. Efficient Privacy-Preserving Recommendations based on Social Graphs 社交推荐中怎么样避免隐私问题而进行推荐

  5. PrivateJobMatch: A Privacy-Oriented Deferred Multi-Match Recommender System for Stable Employment 就业匹配,不需要提供隐私信息,只要给出理想职位的顺序就可以做推荐。依然是规避GDPR

  6. User-Centered Evaluation of Strategies for Recommending Sequences of Points of Interest to Groups 旅游中的团体推荐问题。

2019-09-17

AM

  • Whose Data Traces, Whose Voices? Inequality in Online Participation and Why it Matters for Recommendation Systems Research 学术:数字不平等的差异,社会人口特征以及互联网技能差异导致行为跟踪中的bais,并解释这种偏差意味着什么。 真实世界的数据中存在很多的bais,这样有什么问题吗。 维基百科的编辑者偏差导致的影响。 编辑者男性多、观看者女性多。

  • Paper Session 3: Deep Learning for Recommender Systems

  1. Are We Really Making Much Progress? A Worrying Analysis of Recent Neural Recommendation Approaches 深度学习技术真的很优秀吗,其中很多论文提供的代码都不可复现,甚至不如一些基础的方法。 这是今年的bast paper,挺有意思的,算是整个会讨论反响最热烈的。作者把最近几年的顶会Paper拿出来复现,发现18篇只有7篇能够复现,有61%的是无法复现的,而这其中Recsys是最差的7篇中只有一篇是能够复现结果的,86%的都无法复现。其中的最大问题就是baseline训练不充分,以及weak baselines。

  2. A Deep Learning System for Predicting Size and Fit in Fashion E-Commerce 通过深度学习技术给客户推荐衣服的尺码,并且能够学习出一个账号后面的多个人的差异。(zalando)

  3. Relaxed Softmax for PU Learning 深度学习和nlp中很多都是用softmax公式作为损失函数,本文提出一种基于Boltzmann formulation的改进softmax(criteo)

  4. Style Conditioned Recommendations 条件变分自动编码器(CVAE)技术改进推荐的多样性问题?(overstock) 可以用自编码器学习user profile,他们是学习style

  5. Deep Language-based Critiquing for Recommender Systems 在推荐中引入评论的nlp特征,学习进而对评论内容进行推荐? 自然语言理解,做新闻推荐!类似于阅读理解后面加推荐

  6. Predictability Limits in Session-based Next Item Recommendation 通过引入行为序列的强烈顺序关系,推荐用户的下一个行为。

PM

  • Industry Session 2: Novel Approaches
  1. Groupon  团购网站,类似国内的美团,推荐场景很复杂。
  2. Spotify 重点阅读,主要是讲bandit算法在spotify中的应用,音乐推荐技术

  3. Home Depot 最大的装修材料提供商,一个场景时关联推荐,存在数据稀疏性和用户意图变化的挑战。 首先用embedding技术,然后结合CV技术,提升很明显,有详细做关联推荐的可以研究一下这个论文

  4. BBC 类似人民日报,一方面是垃圾或者涉黄涉政内容发现,另一方面是推荐需要时效性和多样性,以及根据编辑的配合到系统的推荐中。

  5. Salesforce 最大的CRM系统提供商,用推荐技术来预测下一步最佳行为(Next best action ) 主要用MAB技术

  6. Chegg 类似教育网站,二手书籍购买之类的,好像国内没有对标的公司,通过nlp技术给各种类型的物料打标签进行推荐。 他们用Snorkel去做训练数据生成,是一个解决数据标注的框架,后续可以调研一下。
  • Paper Session 4: Recommendations in Advertising, Promotions
  1. A Comparison of Calibrated and Intent-Aware Recommendations 没看懂是个什么,用户意图分析类的?

  2. LORE: A Large-Scale Offer Recommendation Engine with Eligibility and Capacity Constraints 在线营销推荐,这个比较有意思,比如有两类优惠券,固定折扣比如减多少,另一类是百分比折扣,比如五折, Min-Cost Flow network optimization技术。是个带约束的优化问题,一方面是总的优惠量,另一方面是流量多少,大规模聚类别。(重点听)(亚马逊)

  3. Domain Adaptation in Display Advertising: An Application for Partner Cold-Start 广告中商户冷启动和物品冷启动方法,通过合并子领域相似性解决 (criteo)

  4. Addressing Delayed Feedback for Continuous Training with Neural Networks in CTR prediction 广告推荐系统中存在因为季节性,广告活动变化之类,从而使得点击率随着时间会变化。正常的推荐系统中需要很长的时间才能修正点击率,而且新的物品由于特征比较少在模型中会比较吃亏。(重点阅读) (twiter)回去好好看看论文

  5. Ghosting: Contextualized Inline Query Completion in Large Scale Retail Search 电商搜索中的搜索词推荐算法,就是词的联想,你输入然后就下面一堆给你推荐你可能想要搜什么,做相关方面的同学可以看看。 (亚马逊)

  6. FiBiNET: Combining Feature Importance and Bilinear feature Interaction for Click-Through Rate Prediction 推荐ranking环节对组合特征的优化探索,通过FiBiNET网络首先用SENET学习特征重要性,然后组合特征。(重点听)

2019-09-18

AM

  • Paper Session 5: Applications of Recommenders in Personal Needs
  1. Collective Embedding for Neural Context-Aware Recommender Systems 把时间序列建模在深度模型中,主要听网络设计(salling group)

  2. A Recommender System for Heterogeneous and Time Sensitive Environment 游戏中的活动推荐,场景应用比较有意思,主要再将MAB(EA)

  3. Latent Factor Models and Aggregation Operators for Collaborative Filtering in Reciprocal Recommender Systems Latent Factor Models 用于解决在线匹配应用中的匹配算法,社交app做配对相关的可以研究下。

  4. CB2CF: A Neural Multiview Content-to-Collaborative Filtering Model for Completely Cold Item Recommendations Microsoft Store的应用,给CF中加入内容,从而提升冷启动(重点听) 挺基础的

  5. Online Learning to Rank for Sequential Music Recommendation last.fm提出的实时模型,音乐推荐可以关注下,也是冷启动相关的 dueling bandits (重点阅读)

  6. Pace My Race: Recommendations for Marathon Running 跑马拉松的推荐,哈哈哈

  • Responsible Recommendation 推荐系统的社会责任讨论

PM

(感觉都是干货)

  • Paper Session 6: Algorithms: Large-Scale, Constraints and Evaluation
  1. Efficient Similarity Computation for Collaborative Filtering in Dynamic Environments 高纬稀疏的数据中的协同过滤的计算,我们有类似场景,作者分享了开源的github

  2. Personalized Diffusions for Top-N Recommendation Top-N推荐计算方法,i2i graphs 随机游走推荐 (重点听)

  3. Sampling-Bias-Corrected Neural Modeling for Large Corpus Item Recommendations Youtube双塔结构流式模型(NB)(重点阅读)文章,no shuffle better

  4. Leveraging Post-click Feedback for Content Recommendations 音乐和段视频推荐中,播放率相关指标的运用,作者对比了,用播放率比直接用点击/非点击能有很明显的提升,代码github

  5. When Actions Speak Louder than Clicks: A Combined Model of Purchase Probability and Long-term Customer Satisfaction 对电商的整体推荐考虑,除了最大化收益之外,考虑用户满意度。

  6. Uplift-based Evaluation and Optimization of Recommenders 推荐本身就有目的,所以反馈会有偏导致模型受影响。提出一种解决方案,随机流量?

  • Paper Session 7: Using Side-Information and User Attributes and Cold-Start in Recommender Algorithms
  1. Deep Social Collaborative Filtering DSCF 基于社交信息的协同过滤,来自京东,github

  2. Attribute-Aware Non-Linear Co-Embeddings of Graph Features 把内容(context)信息融合到行为推荐算法中,解决冷启动问题。

  3. Adversarial Attacks on an Oblivious Recommender 推荐系统的对抗,设计case骗过推荐系统。有点意思 Google 通过损失函数去摘掉这些、下来详细度以下论文。看能否用在我们的金币用户之类的scene下

  4. HybridSVD: When Collaborative Information is Not Enough svd中运用用户和物品特征

  5. Variational Low Rank Multinomials for Collaborative Filtering with Side-Information 协同过滤加入物品特征

  6. Quick and Accurate Attack Detection in Recommender Systems through User Attributes 这个有点意思,行为造假检测。从正常的行为数据中学习攻击检测算法