阿里游戏大数据sesson2_RF&GBRT(上)

阿里游戏大数据sesson2_RF&GBRT(上)

大家好,又见面了,我是全栈君,今天给大家准备了Idea注册码。

———-一个小的游戏体验,对于不太熟悉Xlab RF和GBRT同学们都叫参考,不喜勿喷,大神绕道,米姆达。

。。

。———-

6月初的时候LR 做到4.9后一直上不去,看群里火热的讨论RF。转而使用RF,几经折腾上手后。在当时的那批对LR来说非常好的特征处理下,结果F1仅仅有3.5左右。心灰意冷。。

。然后又看到火热讨论GBRT,再转gbrt,刚上手。效果和RF差点儿相同。看到别的同学直接从LR转到RF和GBRT都效果好非常多,那个急啊。然后又是考试周。就一直拖拉到6月下旬,最终下定决心又一次做一遍。由于gbrt训练时间比較长。且RF和GBRT对特征的效果相当,RF预測时间相对较短一些,便又一次做RF。慢慢的有效果了,停止了F1最终開始往上涨:4.9->5.16->5.66…近期開始再加入特征。相信还会有提升,以下把我们的RF和GBRT的训练和预測方法大概讲一下(主要以截图为主)

1、Xlab GBRT上手


1.1、训练特征表准备

训练的特征表gbrt_offline_section_one_24格式为:user_id,brand_id,feature1,feature2…Label      

见下图:

阿里游戏大数据sesson2_RF&GBRT(上)


1.2 、建立特征稀疏表。为训练做准备

特征稀疏表可直接在Xlab由原始特征表转换得到,截图例如以下

阿里游戏大数据sesson2_RF&GBRT(上)

进入普通表转稀疏矩阵界面后。在选择列里填上: user_id相应的列号(表默认从0列開始)。brand_id相应的列号,以及想要使用的众多特征相应的列号(不须要填写标签相应的列号!。!

);然后在输出表里填上转换成的稀疏矩阵gbrt_offline_section_one_24_1;例如以下图

阿里游戏大数据sesson2_RF&GBRT(上)

1.3 、GBRT训练

       利用训练的特征表gbrt_offline_section_one_24,进行GBRT训练,例如以下图所以

阿里游戏大数据sesson2_RF&GBRT(上)

进入配置界面。勾选训练的标签,稀疏矩阵名处输入刚才转好的稀疏矩阵gbrt_offline_section_one_24_1。模型输出表处填写模型输出表名。參数配置处依据效果进行配置(最開始默认就能够的)。例如以下图所看到的:

阿里游戏大数据sesson2_RF&GBRT(上)

阿里游戏大数据sesson2_RF&GBRT(上)

配置好仅仅好就能够进行训练了,等待训练好之后等到GBRT预測模型:gbrt_offline_section_one_25;


1.4、GBRT预測特征表准备

训练的特征表gbrt_offline_section_two_11格式与训练特征表格式一样,为:user_id, brand_id, feature1, feature2…Label      见下图:

阿里游戏大数据sesson2_RF&GBRT(上)

1.5、建立预測稀疏矩阵表

特征稀疏表可直接在Xlab由原始特征表转换得到,方法和原来一样。直接截图例如以下

阿里游戏大数据sesson2_RF&GBRT(上)

须要注意的是,选择列必须和训练时候一样。。。

阿里游戏大数据sesson2_RF&GBRT(上)

1.6、GBRT预測

利用转好的预測稀疏矩阵表gbrt_offline_section_two_11_1进行预測,例如以下图所看到的

阿里游戏大数据sesson2_RF&GBRT(上)

进入界面例如以下:model 处填写刚才训练好的GBRT模型表:gbrt_offline_section_one_25;输出表名处填写预測结果输出表 gbrt_offline_section_two_13,然后进行预測。例如以下图所看到的:

阿里游戏大数据sesson2_RF&GBRT(上)

1.7、GBRT碎碎念

GBRT预測好之后。得到的结果为与原始预測表gbrt_offline_section_two_11一一相应的单列值y_var(搞不懂为什么不提供类似RF那样预測结果追加user_id,brand_id 列),例如以下图:

阿里游戏大数据sesson2_RF&GBRT(上)

所以。还得进行追加ID列,进行zxs_gbrt_offline_section_two_13_1和zxs_gbrt_offline_section_two_11_1两张表的合并,得到类似user_id,brand_id,y_val的表,取阈值进行推荐就能够了。下图为xlab里提供的脚本,追加ID列代码。

阿里游戏大数据sesson2_RF&GBRT(上)


另外:附上脚本实现的代码,方便測试:

阿里游戏大数据sesson2_RF&GBRT(上)

———–__———–PS———__———-

版权声明:本文博客原创文章。博客,未经同意,不得转载。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/117688.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • PS初学者实例教程——图层样式的学习[斜面和浮雕]

    PS初学者实例教程——图层样式的学习[斜面和浮雕]本系列教程由中国教程网互助课堂专为PS新手制作,在这里有系列的教程、练习,并有老师对练习进行点评与指导,欢迎朋友们的光临!本例我们学习“斜面和浮雕”图层样式斜面和浮雕是使用频率最高的一种图层样式,熟悉和掌握操作技巧,我们就可以制作出精彩的效果;特别是等高线,运用得当可以制作出与众不同的特殊视觉效果图象题后留有练习作业题,请选择练习.如果使用了附加方法,请加以说明

  • 搭建Socks5代理服务器[通俗易懂]

    搭建Socks5代理服务器[通俗易懂]搭建Socks5代理服务器本篇介绍在centos7上搭建一个socks5的代理服务器。1、安装依赖软件包[root@sg~]#yuminstallgccgcc-c++pam-developenldap-developenssl-devel-y2、下载源码、解压、编译、安装[root@sg~]#wget–no-check-certificatehttps://jaist.dl.sourceforge.net/project/ss5/ss5/3.8.9-8/ss5-3.8

  • html中的导航条制作「建议收藏」

    html中的导航条制作「建议收藏」在网页中一个这样的导航条该怎么做呢?用HTML中的无序列表(ul)做然后在给列表设置需要的样式即可:具体参考代码:<!DOCTYPEhtml><htmllang="en"><head> <metachar

  • python ==和is_python中issubset

    python ==和is_python中issubset前置知识点当我们创建一个对象时,我们要知道它内部干了些什么1.创建了一个随机id,开辟了一片内存地址2.自动声明了这个对象的类型type3.给这个对象赋值value小例子a=1pri

  • VS2015无法解析外部符号

    VS2015无法解析外部符号在使用VS编辑C++时,遇到了无法解析外部符号的错误严重性代码说明项目文件行错误LNK2019无法解析的外部符号"public:__thiscallEmployee::Employee(void)"(??0Employee@@QAE@XZ),该符号在函数"public:__thiscallmanager::manager(int,classstd::bas…

  • 解决Typora官方版本图片显示bug

    解决Typora官方版本图片显示bug问题:win10,官网下载的typorawinx64版,就是不显示图片,并不是路径问题!不是偏好设置问题!就是图片无法加载!,网上搜了一下发现很多小伙伴也遇到了这个问题;个人觉得这应该就是0.10版本的bug解决:换了一下0.9版本的,完美解决希望对你有所帮助!0.9版本的安装包pan链接:https://pan.baidu.com/s/1InBp08xV1DcOyiV9Ic65qQ提取码:1234复制这段内容后打开百度网盘手机App,操作更方便哦–来自百度网盘超级会员V3的分享…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号