Facebook推荐工程师交流笔记

背景

与facebook某工程师交流,记一下交流的信息

具体说明

自己总结:

Q1:facebook的推荐PM跟推荐RD怎么配合,推荐PM的需要涉及到model的工作吗?

A:因为feed是一个会涉及到多个业务的部门,所以PM会做很多协调,管理方面的工作,来推动各方支持。推荐PM不会涉及到model部分。

Q2:如果是纯富媒体内容(比如纯图片,纯视频,非文本类),在推荐中的学习使用情况。

A:facebook没有对内容有任何的学习处理,会提取用户发布的#hashtag#,但是不会自己再对内容做理解。所以也没有处理过图像,facebook实验室针对图像做的一些东西,instagram在用,但是facebook feed本身story没用。

——延展:这里才想起来,facebook其实只有一种召回,就是关系召回,他们的机器学习重点用在排序上,facebook允许你刷feed没有内容,如果你关系少的时候,就会引导你去加关系,这部分是growth团队负责。

Q3:如果实现多目标融合,还是有一个终极目标,可以代替多目标

A:几个点,1)facebook对每个重要的event都有prediction模型(多目标),每个event 预测本身,是不能干预的,最终产品策略会干预,某个event加大概率。(model内部参数不会人工调整,只调整目标策略),最终使用多目标融合      2)针对不同的国家,不同的page(比如small /new   page),会有一些个性化的model做辅助,跟大模型的结果做merge。

Q4:特征挖掘,新特征补充,是什么流程

A:早期的重要特征都是人工去挖掘,facebook到现在,基础的显性特征几乎都有了,新的特征几乎都是靠GBDT去学(这块不是很确认)

Q5:如何保证推荐多样性

A:靠规则

Q6:非story类的item,在推荐的时候怎么推荐

A:给配额插入,但是会做打散

Q7:是否会使用本地模型,对服务端返回的结果再做排序

A:facebook有包的大小限制,本地目前没有做很多,好像有人在尝试

以下是别人总结:

Q1:是否使用在线学习的框架。

A:暂时没有

Q2 判断该放弃LR并使用更复杂模型的边界是什么?

A:没有,但是任何新模型都是先用LR试,然后迭代,根据迭代效果去决定是否选择换模型,换模型的主要原因就是尝试,或者其他部门有用了,自己也试一下

Q3:听说是早就应用深度学习了,当初应用的DL的出发点是什么?可否谈谈DL现在的效果及各milestone?DL在排序模型中的应用该注意什么?

A:没有具体回答

Q4:大规模ID类型特征,比如UID,在做特征处理、训练的时候有什么要注意的地方 

A:线上没有使用

Q5: 当文本内容很少的时候,加入多媒体(图片,视频)内容增加识别准确率,如何平衡两类内容权重.

A:对多媒体内容没有做任何分析.

Q6:头部账号与普通账号内容热度不可比,怎么办。

A:根据需要可以多大号的特征进行衰减

Q7:曝光位置是否使用?

A:离线训练的时候用,在线预测的时候可以设置成缺省值



机器学习 2018-01-04
上一篇: 下一篇:

评论已关闭。