FM和FFM原理

全栈程序员-用户IM • 2022年5月20日下午7:00 • 未分类

FM和FFM原理模型用途FM和FFM，分解机，是近几年出的新模型，主要应用于广告点击率预估（CTR），在特征稀疏的情况下，尤其表现出优秀的性能和效果，也数次在kaggle上的数据挖掘比赛中拿到较好的名次。FM原理特征编码时常用的one-hot编码，会导致特征非常稀疏（很多0值）。常用的特征组合方法是多项式模型，模型表达式如下： y(x)=w0+∑i=1nwixi+∑i=1n∑j=i+1nwijxixjy(x)=w…

大家好，又见面了，我是你们的朋友全栈君。

模型用途

FM和FFM，分解机，是近几年出的新模型，主要应用于广告点击率预估（CTR），在特征稀疏的情况下，尤其表现出优秀的性能和效果，也数次在kaggle上的数据挖掘比赛中拿到较好的名次。

FM原理

特征编码时常用的one-hot编码，会导致特征非常稀疏（很多0值）。常用的特征组合方法是多项式模型，模型表达式如下：

y (x) = w 0 + \sum i = 1 n w i x i + \sum i = 1 n \sum j = i + 1 n w i j x i x j

其中
xi
表示第i列特征，
n
表示特征数，
w0,wi,wij
为模型参数。模型参数为
n2
个。在对模型进行训练时，采用SGD(随即梯度下降)，由于特征较稀疏，大部分
wij
的梯度值为0，那么参数
wij
的值就不准确，会影响模型的效果。

FM模型，将参数
wij
对应的矩阵
W
，利用矩阵分解表示为
W=VTV
, 矩阵
V
∈Rk×n
, 可以通过调节k来调节模型的泛化能力。

k影响

FM模型则表示为：

y (x) = w 0 + \sum i = 1 n w i x i + \sum i = 1 n \sum j = i + 1 n < v i, v j > x i x j

模型参数减少为kn个。训练方法还是采用SGD，在预测时，可以通过下式将计算复杂度从
O(kn2)
降低为
O(kn)
：

\sum i = 1 n \sum j = i + 1 n < v i, v j > x i x j = 1 2 \sum f = 1 k ((\sum i = 1 n v i, f x i) 2 - \sum i = 1 n (v i, f x i) 2)

FFM 原理

FFM模型是在FM特征组合的基础上给特征加上了field属性，于是模型表示为

y (x) = w 0 + \sum i = 1 n w i x i + \sum i = 1 n \sum j = i + 1 n < v i, f j, v j, f i > x i x j

其中
fi
表示特征i所属的field，需要训练的
V
为
n×k×f
,
f
为field的个数，具体案例见
ppt

由于FFM加入field，使得训练和预测过程参数计算不能简化，复杂度为
O(kn2)

参考文献

转自：https://blog.csdn.net/Leo00000001/article/details/71330927?locationNum=13&fps=1

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。

发布者：全栈程序员-用户IM，转载请注明出处：https://javaforall.cn/143838.html原文链接：https://javaforall.cn

【正版授权，激活自己账号】： Jetbrains全家桶Ide使用，1年售后保障，每天仅需1毛

【官方授权正版激活】： 官方授权正版激活支持Jetbrains家族下所有IDE 使用个人JB账号...

赞 (0)

全栈程序员-用户IM

0 0

tkMapper整合「建议收藏」

tkMapper整合「建议收藏」目录一.简介二.tkMapper整合2.1基于SpringBoot完成MyBatis的整合2.2整合tkMapper三.tkMapper使用四.TkMapper提供的方法4.1添加4.2更新4.3删除4.4查询4.5连表查询一.简介tkMapper就是一个MyBatis插件，提高开发效率。提供了针对单表的数据库操作方法逆向工程(根据数据表生成实体类、dao接口、映射文件)二.tkMapper整合2.1基于SpringBoot完成MyBatis的整合1.新建SpringBoot项目

全栈程序员-用户IM
2022年10月7日
《FFmpeg从入门到精通》读书笔记（二）[通俗易懂]

《FFmpeg从入门到精通》读书笔记（二）[通俗易懂]写在前面2019.06.18第三章知识点（未进行排版）第三章FFmpeg转封装一、MP4格式标准MP4文件由许多个Box与FullBox组成;每个Box由Header和Data两部分组成;FullBox是Box的扩展，其在Box结构的基础上，在Header中增加8位version标志和24为flags标志;Header包含了整个Box的长度的大小（size）和类型（ty…

全栈程序员-用户IM
2022年6月26日
实现关联条件的casewhen效果

实现关联条件的casewhen效果 selectp.pcmxid, j.csjtf*p.jsrs+j.dpf*p.jsrs+j.zsf*p.jsrs*p.sjts+ j.clbzf*p.jsrs*p.sjts+j.bxf*p.jsrs*p.sjtsasjsxj frompcmxp leftjoin(—-关联一个过渡表 sele…

全栈程序员-用户IM
2022年9月5日
从ZERO开始系列：大数据软件之1.Hadoop的安装与wordcount运行

从ZERO开始系列：大数据软件之1.Hadoop的安装与wordcount运行

全栈程序员-用户IM
2021年9月26日
pycharm将python程序打包_python 程序打包

pycharm将python程序打包_python 程序打包关于使用Pycharm对python文件进行打包首先建立python项目的时候要按照标准来建设我使用的python配置的解释器,没有使用python的虚拟环境,因为虚拟环境建设出来的项目不是我想要的项目结构,包结构比较多,看着不是很舒服4.配置完成后点击创建创建完成后可以自己创建合适包结构创建完合适的包结构后,就可以编写python代码了,但要python代码运行开,需要配置运行环境9.环境配置调试好就可以运行调试python代码..

全栈程序员-用户IM
2022年8月26日
对象数组（C++学习笔记 20）[通俗易懂]

对象数组（C++学习笔记 20）[通俗易懂]一、对象数组的定义所谓对象数组，指每一个数组元素都是对象的数组，即若一个类有若干个对象，我们把这一系列的对象用一个数组来存放。对象数组的元素是对象，不仅具有数据成员，而且还有函数成员。定义一个一维数组的格式如下：类名数组名[下标表达式]与基本数据类型的数组一样，在使用对象数组时也只能访问单个数组元素，其一般形式为：数组名[下标].成员名在建立数组时，同样要调用构造函数。有几个数组元…

全栈程序员-用户IM
2022年7月12日

发表回复

关注全栈程序员社区公众号