与facebook某工程师交流,记一下交流的信息
自己总结:
Q1:facebook的推荐PM跟推荐RD怎么配合,推荐PM的需要涉及到model的工作吗?
A:因为feed是一个会涉及到多个业务的部门,所以PM会做很多协调,管理方面的工作,来推动各方支持。推荐PM不会涉及到model部分。
Q2:如果是纯富媒体内容(比如纯图片,纯视频,非文本类),在推荐中的学习使用情况。
A:facebook没有对内容有任何的学习处理,会提取用户发布的#hashtag#,但是不会自己再对内容做理解。所以也没有处理过图像,facebook实验室针对图像做的一些东西,instagram在用,但是facebook feed本身story没用。
——延展:这里才想起来,facebook其实只有一种召回,就是关系召回,他们的机器学习重点用在排序上,facebook允许你刷feed没有内容,如果你关系少的时候,就会引导你去加关系,这部分是growth团队负责。
Q3:如果实现多目标融合,还是有一个终极目标,可以代替多目标
A:几个点,1)facebook对每个重要的event都有prediction模型(多目标),每个event 预测本身,是不能干预的,最终产品策略会干预,某个event加大概率。(model内部参数不会人工调整,只调整目标策略),最终使用多目标融合 2)针对不同的国家,不同的page(比如small /new page),会有一些个性化的model做辅助,跟大模型的结果做merge。
Q4:特征挖掘,新特征补充,是什么流程
A:早期的重要特征都是人工去挖掘,facebook到现在,基础的显性特征几乎都有了,新的特征几乎都是靠GBDT去学(这块不是很确认)
Q5:如何保证推荐多样性
A:靠规则
Q6:非story类的item,在推荐的时候怎么推荐
A:给配额插入,但是会做打散
Q7:是否会使用本地模型,对服务端返回的结果再做排序
A:facebook有包的大小限制,本地目前没有做很多,好像有人在尝试
以下是别人总结:
Q1:是否使用在线学习的框架。
A:暂时没有
Q2 判断该放弃LR并使用更复杂模型的边界是什么?
A:没有,但是任何新模型都是先用LR试,然后迭代,根据迭代效果去决定是否选择换模型,换模型的主要原因就是尝试,或者其他部门有用了,自己也试一下
Q3:听说是早就应用深度学习了,当初应用的DL的出发点是什么?可否谈谈DL现在的效果及各milestone?DL在排序模型中的应用该注意什么?
A:没有具体回答
Q4:大规模ID类型特征,比如UID,在做特征处理、训练的时候有什么要注意的地方
A:线上没有使用
Q5: 当文本内容很少的时候,加入多媒体(图片,视频)内容增加识别准确率,如何平衡两类内容权重.
A:对多媒体内容没有做任何分析.
Q6:头部账号与普通账号内容热度不可比,怎么办。
A:根据需要可以多大号的特征进行衰减
Q7:曝光位置是否使用?
A:离线训练的时候用,在线预测的时候可以设置成缺省值