先验概率与后验概率

背景 使用topic召回的时候,先要做平滑,发现对先验概率理解不够,查资料补充了一下知识,特此记录。 具体说明 -什么是先验概率与后验概率 先验概率与后验概率,简单的说:先验概率是由因求果中的因,而后验概率,由果寻因中的因。 先验概率是在缺乏某个事实的情况下描述一个变量; 而后验概率是在考虑了一个事实之后的条件概率.  先验概率通常是经验丰富的专家的纯主观的估计。后验概率可以根据通过Bayes定理, 用先验概率和似然函数计算出来. 后验概率是基于新的信息,修正原来的先验概率后所获得的更接近实际情况的概率估计。 先验概率和后验概率是相对的。如果以后还有新的信息引入,更新了现在所谓的后验概率,得到了新的概...
机器学习 12-07    

置信度与置信区间

背景 在平时做实验的过程中,使用ab平台去分配流量,大家其实对分配多少流量"合适",并没有谱。一般都是靠经验拍一个值,特此整理一下,如何知道,我的流量够不够。 在统计学里, 我们一般使用"抽样" 来预估 "总体"的情况。做这个事情,可行的前提是: 抽样样本能够很好的拟合总体的情况。即我们通常说的具有代表性。统计学里用 置信度 ,来衡量 样本实验与总体用户的"相似情况"。     具体描述 1、为什么要用区间估计? 一个例子:你打枪打10次,你可以得到一个平均值,比如是8.那么总体的期望是不是就是8呢?显然不是,因为你再打10次可能就是7了,那么总体的期望就变成7了嘛? 总体的期望是客观存在不会变的,既然样本是从总体中...
机器学习 12-04    

FFM(Field-aware Factorization Machine)

FFM:基于域的分解机模型 符号说明: x表示样本特征数据 y表示样本目标数据 第i个训练样本为(xi,yi),为了方便也可以用x=xi表示第i个样本 1.1 线性模型 C1表示x中非零元素索引的集合 1.2 二次多项式模型 C2表示x中非零元素索引的集合 1.2 分解机模型(FM) W是二维矩阵,表示第i行向量,长度为k,k是自定义参数,也称之为隐向量 1.3 域分解机模型(FFM) 因为前面的一次线性项容易解,则可以写成另外一种形式
机器学习 12-04    

工业界机器代替人工整理

生活服务 1、机器包饺子 工业生产 1、机器制鞋子 医疗领域 1、机器抓药
产品用研 08-21    

今日头条非技术岗笔试回忆版题目

背景 在知乎上看到这个文章,觉得不错,转载过来。 原地址:https://zhuanlan.zhihu.com/p/26099928   具体内容 考试时间从7点到9点,满分100分,10道单选题,全是逻辑推理和数列预测,占20分;主观题8道,各十分。 我的第一题是今日头条小流量测了一下广告样式B比广告样式A的点击率高,但全部换成B之后广告收入下降了(广告收入是按点击率来算的),请分析下原因? 第二题是写一个你熟悉的app,最近有什么重大的改版,说说功能逻辑,以及竞品的优缺点和区别; 第三题是让你设计滴滴订单的分发系统,从哪一个纬度来设计; 第四题是让你解释为什么2016年直播很火,直播的发展趋势及你的看法; 第五题是让你增加或者去掉今日头条的一个功能...
产品用研 08-20    

中国城市新分级名单

2017年5月25日,第一财经·新一线城市研究所按照商业资源集聚度、城市枢纽性、城市人活跃度、生活方式多样性和未来可塑性5个维度,评估了中国城市的商业魅力,得到的新的城市新分级名单如下 2017年中国城市分级完整名单(包含338个地级市) 一线城市(4个) 北京市、上海市、广州市、深圳市 新一线城市(15个) 成都市、杭州市、武汉市、重庆市、南京市、天津市、苏州市、西安市、长沙市、沈阳市、青岛市、郑州市、大连市、东莞市、宁波市 二线城市(30个) 厦门市、福州市、无锡市、合肥市、昆明市、哈尔滨市、济南市、佛山市、长春市、温州市、石家庄市、南宁市、常州市、泉州市、南昌市、贵阳市、太原市、烟台市、嘉兴市、南通市、金华市...
产品用研 08-16    

内容推荐

背景 去过头条,应该对推荐系统有一个比较全面的了解,不管是产品架构上,还是技术架构上。 所以从今天起,陆陆续续整理一下,整个 基于内容消费的推荐系统上的一些产品架构,以及对应的技术实现方案。...
产品用研 08-04    

泽华相关推荐文章整理

背景 泽华是我在头条的同事,他有过推荐研发的经历,对推荐产品应该是国内产品专家级的人物。 他在自己的知乎上更新了一些自己对推荐系统的观点,特此整理。 具体文章 泽华的专栏:https://zhuanlan.zhihu.com/yanzehua 文章1:#内容推荐# 1 个性化内容推荐是怎么干活的? 文章2:#内容推荐# 2 内容冷启动:看命与改命? 文章3:#内容推荐# 3 内容推荐:探索与信息茧房 文章4:#内容推荐# 4 为什么这篇好内容没有推荐量? 文章5:#内容推荐# 5 策略产品:输给算法狗不冤、训练算法狗才重要 文章6:兴趣探索?半瞎猫碰上死耗子 文章7:分享文章:论推荐系统的Exploitation和Exploration 文章8:分享...
产品用研 08-01    

互联网公司怎么赚钱

背景 长期做用户产品,对商业产品的敏感度不够,所以总结一下,方便自己学习。随时保持更新。 商业化是一个相对的概念,用大白话说,如果你做的事情,是为公司赚钱的事情,那就是商业化。不同的企业/产品/业务,商业化的方式不一样,盈利方式也不一样。一般来说,商业化有以下几种分类 从盈利对象来看:有前向收费(向用户收费),后向收费(向商户收费) 从盈利模型来看:有广告,增值服务等 大公司怎么赚钱的 下面简单的总结一下,常见的一些互联网公司以及其盈利方式: 1.腾讯 腾讯一个月赚大概赚160个亿,主要由:增值服务,广告以及其他(支付,云服务等)构成。腾讯营收里的增值服务,大头是游戏,游...
产品用研 06-01