逻辑回归

逻辑回归

大家好,又见面了,我是全栈君,祝每个程序员都可以多学几门语言。

二元逻辑回归(Logistic Regression, LR)模型
<span>逻辑回归</span>

几率(odds:
<span>逻辑回归</span>
对数形式:
<span>逻辑回归</span>
基于LR的点击率预測
<span>逻辑回归</span>
Where, x代表一个(query, ad)相应的特征向量, y 属于{1,0}分别代表点击和不点击,p(y=1|x)就代 表给定query下,某ad的点击率

点击率预測特征
广告创意特征:
图片,标题文字,价格,销量 
推广商品所属类目,包括属性
创意组,推广计划,广告主
Query信息:包括的Terms-Query分析:类目,属性-Query扩展:同义词,相似query
环境特征: 用户,时间
名义特征: 时间,创意ID等
点击反馈特征 :计算历史上包括该特征的(query, ad)的点击率
ad所属广告计划的历史点击率
组合特征 :query与ad标题匹配的term个数

位置偏差
位置偏差(position bias) 
–如果:不同位置上的广告被用户看到的概率不 同,排位靠前的广告被看到的概率更大,导致其点击率“天然”更高一些
解决方式一:
–(Cheng and Cantú-Paz, 2010)
• 计算广告CTR时用不同排位上的平均ctr进行调整
解决方式二:
–Online Learning from Click Data for Sponsored Search. (Ciaramitaet al., 2008) 
• 仅仅有当排位低的广告被点击而排位高的广告没有被 点击时,才使用这些广告作为训练数据

个性化

Personalized Click Prediction in Sponsored Search. –HaibinCheng, Erick Cantú-Paz. WSDM. 2010. 
• 如果:query同样时,不同user对不同ad的点击率 也相差较大 
• 解决方式:添�user特征到LR模型里,预估 p(c|q,a,u) 
–Demographic特征
• 如年龄,性别,婚姻状况,职业,兴趣等
–User-specific特征
• 如用户历史CTR,user组合特征(User-Ad, User-Query)

广告间相互影响
Relational Click Prediction for Sponsored Search –ChenyanXiong, TaifengWang, WenkuiDing, YidongShen,  
Tie-Yan Liu. WSDM 2012.
• 如果:某条广告的点击率会受到同一时候展现的其它广 告的影响 
• 解决方式:同一时候预估全部广告的点击率,考虑广告 间的相互影响 
–广告间的相似度
–Continuous CRF model with MLE

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/118982.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)
blank

相关推荐

  • 你走后,我才真的爱上你

    你走后,我才真的爱上你你走后,我才真的爱上你

  • Mysql 主从复制 作用和原理

    Mysql 主从复制 作用和原理一、什么是主从复制?主从复制,是用来建立一个和主数据库完全一样的数据库环境,称为从数据库,主数据库一般是准实时的业务数据库。您看,像在mysql数据库中,支持单项、异步赋值。在赋值过程中,一个服务器充当主服务器,而另外一台服务器充当从服务器。此时主服务器会将更新信息写入到一个特定的二进制文件中。并会维护文件的一个索引用来跟踪日志循环。这个日志可以记录并发送到从服务器的更新中去。当一台从服务器连…

  • 关于ip地址 :局域网 广域网 ip 公网 私网 ipv6 ipv4的区别、hosts文件和DNS域名解析说明

    关于ip地址 :局域网 广域网 ip 公网 私网 ipv6 ipv4的区别、hosts文件和DNS域名解析说明1.ip地址说明1.1网络基本知识说明(局域网/广域网/ip地址)场景分析:假如只有一台电脑,那么这台电脑的数据只会全部储存在此电脑的硬盘上,与其它的电脑不会产生任何关系,但是一台电脑干的事情比较少,往往需要多台电脑协同办公提高效率。问题1:多台电脑协同工作势必产生数据交互,如何进行数据交互呢???解决1:可以使用u盘之类的移动存储介质拷贝数据(缺点:需要手动的进行操作、无法做到数据的实时传输)解决2:使用线缆把2台电脑连接起来,通过这根线缆进行传输数据,这根线缆就叫做网线。如下图所示。问

    2022年10月18日
  • jar 包与 war 包区别

    jar 包与 war 包区别参考:https://www.jianshu.com/p/3b5c45e8e5bdhttps://www.cnblogs.com/banml/p/11767305.htmlhttps://blog.csdn.net/cjw12581/article/details/107463971文章目录1.jar包jar与zip异同jar包主要用途2.war包war包部署优势开发阶段不适合使用war的原因部署war包到tomcat3.jar包vs.war包SpringB

  • 2005中文博客排名报告「建议收藏」

    2005中文博客排名报告「建议收藏」2005中文博客排名报告发布机构:时代财富科技公司 摘要:2004年11月时代财富科技公司推出了中文Blog排行榜,得到了大众及媒介的广泛关注,也成为众多同行和资本市场了解中文博客网站的重要参考。历经2005年上半年中文Blog托管网站的飞速发展时期,博客网站也正经历着重新的洗牌和残酷的市场竞争。经过长时间的调查和分析,结合大量的用户体验,时代财富科技公司于2005年8月隆重推出《

  • cms开源网站管理系统_javaweb开源商城

    cms开源网站管理系统_javaweb开源商城笔者整理了八款.Net优秀的开源CMS内容管理系统,推荐给广大的.net开发者。

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号