机器学习

先验概率与后验概率

背景 使用topic召回的时候,先要做平滑,发现对先验概率理解不够,查资料补充了一下知识,特此记录。 具体说明 -什么是先验概率与后验概率 先验概率与后验概率,简单的说:先验概率是由因求果中的因,而后验概率,由果寻因中的因。 先验概率是在缺乏某个事实的情况下描述一个变量; 而后验概率是在考虑了一个事实之后的条件概率.  先验概率通常是经验丰富的专家的纯主观的估计。后验概率可以根据通过Bayes定理, 用先验概率和似然函数计算出来. 后验概率是基于新的信息,修正原来的先验概率后所获得的更接近实际情况的概率估计。 先验概率和后验概率是相对的。如果以后还有新的信息引入,更新了现在所谓的后验概率,得到了新的概...
机器学习 12-07 评论已关闭

置信度与置信区间

背景 在平时做实验的过程中,使用ab平台去分配流量,大家其实对分配多少流量”合适”,并没有谱。一般都是靠经验拍一个值,特此整理一下,如何知道,我的流量够不够。 在统计学里, 我们一般使用”抽样” 来预估 “总体”的情况。做这个事情,可行的前提是: 抽样样本能够很好的拟合总体的情况。即我们通常说的具有代表性。统计学里用 置信度 ,来衡量 样本实验与总体用户的”相似情况”。     具体描述 1、为什么要用区间估计? 一个例子:你打枪打10次,你可以得到一个平均值,比如是8.那么总体的期望是不是就是8呢?显然不是,因为你再打10次可能就是7了,那么总体的期望就变成7了嘛? ...
机器学习 12-04 评论已关闭

FFM(Field-aware Factorization Machine)

FFM:基于域的分解机模型 符号说明: x表示样本特征数据 y表示样本目标数据 第i个训练样本为(xi,yi),为了方便也可以用x=xi表示第i个样本 1.1 线性模型 C1表示x中非零元素索引的集合 1.2 二次多项式模型 C2表示x中非零元素索引的集合 1.2 分解机模型(FM) W是二维矩阵,表示第i行向量,长度为k,k是自定义参数,也称之为隐向量 1.3 域分解机模型(FFM) 因为前面的一次线性项容易解,则可以写成另外一种形式
机器学习 12-04 评论已关闭