信息流之内容策略

背景

对于所有的信息流产品来说,物料池(内容池)是推荐的最底层,是基础。一个优质,充满多样性的物料池,对内容消费,有事半功倍的效果。

简单来说,一个内容的一生主要经历以下几个系统:内容的创作系统,内容的加工链路,推荐消费互动。

一切对内容体系做的功,无非是改变内容的数量、结构。结构主要是指在不同特征上的分布。这篇文章,总结一下信息流里常见的内容策略。

具体说明

一、存量内容的"挑肥拣瘦""惩恶扬善",改善分布结构

在搭建起自己的物料池后,就需要对已经有的物料池基础,做一定的筛选,利用人的经验或者后验数据指标等,对内容做一定的筛选,提高推荐的效率。当然因为作者是内容的源头,有一些时候这种策略会直接同步作用到作者身上。

典型的比如:人为定义的优质低质,后验指标里常见的CTR,完播率,互动率等。这里有两个难题,第一个是动态的评价指标往往涉及到很多识别的准确率问题,需要人工做映射转化(人的评估理解的准确)。第二个是需要对分布有一个先验的标准答案判断,这个往往没有经验,都是瞎拍。(比如娱乐就是应该比科技多,但是要多多少?比如10s以下的短视频不配称视频?)

动态指标部分,我理解类似于排序模型的多目标融合一直指导到了物料阶段,把user特征全部置为空时候的item打分。

1、人为定义指标

低质:标题党、低俗、虚假、广告、抄袭,恶心,语句不通等。有兴趣的可以看看程祝华老师的分享:https://new.qq.com/omn/20181123/20181123A1TX57.html

优质:一般由各个垂直品类的专家评估给出,有大量的行业标准经验。

2、后验动态指标

一般跟多目标排序模型里的目标一致,但是主要针对单个内容/分类/tag维度,包括完播率,时长,互动率,ctr等。也有一些单特征的贡献度等指标。

这类特征识别后,对于要加强的,提权,保量,给固定位,前端加特殊标志等。对于要打击的,删除,降权,控制分发范围等。

二、内容新增:提升整体的内容规模跟多样性

内容增长,是随着用户群体泛化,内容持续泛化,保证用户群体跟内容匹配的核心手段。内容增长主要包括两点。

1、内容增长手段:包括线索获取,线索投放测试,线索价值评估,线索批量触达,头部作者的运营人工维护,维护记录,竞品监控等

特别强调一下,内容的消重。

2、内容增长方向:包括泛化人群的喜好评估,核心人群或者内容壁垒的方向探索。

关于内容新增的优先级问题,目前主流的认知认为,从同样的特征维度看,内容的供给比例跟消费比例应该近似。所以一般用 消费比例/内容比例作为排序分。(有待考究准确性,每个品类的基尼系数不一样)

三、其他内容特征:提升分发效率以及准确

辛辛苦苦搞来的内容,一定要得到充分的消费利用,才能对得起作者的辛苦创作,审核人员的辛苦审核,公司的资源投入。

1、内容特征构建:包括内容的分类特征,地域特征,类型,时长等等,以及提供给前端展现的标签,封面图等。各种特征模型的标注,构建,评估,更新等。

2、内容的多样性:在上述的特征挖掘背后,是内容在不同特征上的分布情况,内容的分布上具有多样性,才能保证消费侧可以满足多样性的消费。包括:

分类维度:体育,科技等

长短维度:长文章,短文章,长视频,短视频,小视频

时效维度:短时效,中时效,长时效等

3、内容的消费后验评估:是否存在分发的过于集中,头部的内容是否过于低质(比如软色情,标题党)。是不是有很多内容没有得到很好的分发,推荐不出去。

四、作者生态

主要包括,toB的作者留存,跟生产效率。

1、作者留存:作者分成,作者等级,作者运营机制,作者的奖惩,作者金字塔结构分布

2、生产效率:生产工具,生产指导,生产素材提供,生产反作弊

五、内容链路

1、安全审核:保证内容不涉及法律法规,违反当地政策,敏感时期/敏感地区的特殊安全机制

2、质量审核:内容低质广告等过滤,内容去重

3、复审:各种复审召回,包括热门复审等

4、机制层面 :包括审核的队列排序,审核的准确率保证,审核人员的培训,审核延时监控,审核队列拓展,审核后台等

产品用研 2020-05-15
上一篇: 下一篇:

评论已关闭。