用户画像阶段性总结

本文主要针对ctr预估场景下,对这次新开发的用户画像做一个阶段性的总结。整个过程主要包括特征、架构流程的设计和工程实现。新版用户画像特征维度从8维上涨到179维,上线已将近一个月后,用户覆盖率从原来的40-50%提升至75%-85%左右。其中长期用户画像中的一些需要时间累积的特征,随着时间推移表现越来越好。离线AUC和PR最近一段时间内也在稳步提升。入司半年,最近能够独立开发用户画像部分,自...
November 29, 2018

xgboost和LR模型级联

导语在各种推荐场景下,ctr预估使用最多的模型是LR(Logisitc Regression),简单且强大。而随着基于boosting思想的树算法(如GBDT、xgboost)在kaggle竞赛上大放异彩,这些树模型也开始被用于ctr预估中。两种模型的自身原理决定了两者各有优缺点,于是将两者进行融合的想法也油然而生,Facebook早在2014年就已提出并验证了该想法的有效性。半年前,在离线...
November 23, 2018

git使用心得(涉及msys2,JetBrains IDEs)

前言关于git,之前我在memo里瞎顺手写了一篇,主要内容是git方法和一些常用命令,链接:http://memo.rongzijing.win/index.php/archives/23/和上面那篇只是机械记录一些命令不同,这篇文章是我在使用git一段时间后,有了自己的经验和感受,所以打算再写一篇文章。本文总共分为三个部分:第一部分主要是针对windows用户,向你们疯狂安利msys;第二...
October 30, 2018

向windows用户疯狂安利msys2

msys2是一款能让windows用户也可以体验Linux丝滑环境的shell命令行开发环境,可以完全代替windows的cmd。而且自带 pacman 管理,可以安装任何有windowsz支持的linux软件。Mac土豪和Linux大佬请出门右拐(微笑)。当时被xc安利的时候我还不屑一顾,但用完之后表示真香,好东西要安利给大家。一、安装点击链接[http://mirrors.ustc.ed...
October 25, 2018

Nginx虚拟主机(Virtual Host)配置

前言虚拟主机(Virtual Host)可以在一台服务器上绑定多个域名,架设多个不同的网站,一般在开发机或者要部署多个小网站的服务器上需要配置虚拟主机。写一篇主博客非常费时,后来为了偷懒又开了两个子网站:memo.rongzijing.win和life.rongzijing.win,专门写一些短博客还有流水账,到现在为止已经用了三四个月了。今天整理收藏夹的时候,想起来还是补一篇博客吧。因为N...