分类模型总结

背景 分类任务是最常见的NLP任务之一,也是推荐模型里,对内容的最常见的特征描述形式。 正确的分类模型对分类任务十分关键,本文重点整理一下常见的分类模型。   具体说明  
生活琐事 08-08 评论已关闭

数据统计里经常遇到的问题

背景 在平时统计数据,做数据处理的过程中,经常会遇到一些意识不到的问题,这些问题奇奇怪怪,各式各样,此文章简单的整理一下场景的坑   具体说明 1、幸存者偏差 例题: 二战期间,统计者发现,飞回来的飞...
产品用研 08-07 评论已关闭

常见的数据分布总结

背景 我们在日常的生活中,会统计很多的数据,而很多的数据,有各种各样的分布,常见的比如正态分布。 此日志重点总结一下常见的分布形式。数据分为 离散数据与连续数据。   具体说明 1.均匀分布 若连续型...
机器学习 08-07 评论已关闭

文本转化为向量的各种方法总结

背景 在机器学习的任务里,尤其是在NLP任务里,经常需要对文本转化为可以计算的向量的形式。目前市面上出现了各种各样的方法,各有所长,所以在这里简单的整理一下。   具体说明 文本转化为向量的方法,一般...
机器学习 08-07 评论已关闭

内容消重算法总结

背景 在内容推荐业务中,因为用户发布的内容经常有重复,而重复消费相同/相似内容,对用户的价值不大。 所以一般在推荐的物料池中,我们会对内容进行相似消重。本文重点总结一下常见的消重算法,以及在消重算法中...
机器学习 08-05 评论已关闭

机器学习里的距离与相似度量方法

背景 在机器学习里,有很多的任务,是基于比较而产生的。往往最常见的比较就是 距离与相似的比较。这篇文章主要整理一下距离与相似的各种比较计算方法。 具体说明 一、一个距离函数d(a,b)要满足的条件 d(a,a)=...
机器学习 07-16 评论已关闭

商业化产品:广告行业相关概念整理

背景 整理一下广告行业相关概念。 具体描述 第一部分:媒体广告营收相关 1、广告行业两个营收公式(来自朱时雨文章)     Ad revenue =DAU*人均PV*广告展现率*CPM     Ad revenue = DAU*人均feed*Ad load*CPM 2、具体解释 DUA:日均用户规模 人均PV:人均的展现量 人均Feed:人均浏览信息流数量(feeds per  user) 广告展现率:该展现广告的位置,广告的展现概率 Ad load:调节广告在feed里进入的阀门,可以近似理解为广告数量占比 CPM:展现成本,或者叫千人展现成本 3、公式说明 第一个公式里:人均PV趋近于稳定,广告展现率接近100%(在页面的不同空间展现不同的广告,自己卖不掉也可以...
产品用研 05-04 评论已关闭

PM daily work

背景 早上来发现自己每天的工作不规律,整理一下每天work的一些 general work。 具体描述 早上: 1、查看昨天的数据情况,如果有异常,尽快在群里或者邮件抛出异常,让人查。 2、昨天的工作进度,确定一下今天的工作list(今天要fix的问题) 3、看一下最近的科技新闻,有没有需要关注的。 下午 1、自助安排
产品用研 05-03 评论已关闭

新户冷启动里的哲学

背景 新户冷启动问题,在任何平台都是一个非常棘手的问题。新户问题不好做的核心在于两点: 1、新户对平台的第一次接触,不了解,不信任。 2、平台对用户的不够了解,无法快速建立信任。 所以,各家各户,都使劲浑身解数的努力的留住新户,与新户类似的,还有流失用户的重新召回。这篇文章针对新户的问题,提出自己的一些想法。 具体说明 先说两个先决条件: 1、任何产品所提供的核心功能,是新户冷启动无法改变的。不能因为微信留存高就把支付宝的新户流程改成微信,这一定是错的。 2、新户冷启动的上限,是跟他有某些共同属性的中低频用户的均值。
产品用研 04-13 评论已关闭