September 24, 2019

xgboost和LR模型级联

导语在各种推荐场景下,ctr预估使用最多的模型是LR(Logisitc Regression),简单且强大。而随着基于boosting思想的树算法(如GBDT、xgboost)在kaggle竞赛上大放异彩,这些树模型也开始被用于ctr预估中。两种模型的自身原理决定了两者各有优缺点,于是将两者进行融合的想法也油然而生,Facebook早在2014年就已提出并验证了该想法的有效性。半年前,在离线...
September 16, 2019

线下AUC与线上CTR不一致问题

算法工程师经常会遇到一个问题——线下模型指标提高很多,但上线后的表现却无提升甚至下降。那么出现这种问题也一定是有原因的,根据过往的踩坑经验和调研,简单总结下可能的原因。
July 9, 2019

我的MacOS入门小记

最近刚入职,申请了一台Imac,但是自己之前从未接触过MacOS,最近几天需要把自己的办公开发环境搞起来,顺便简单记录一下。
March 9, 2019

git配置ssh以及JetBrains IDEs使用git教程

前言关于git,之前我在memo里瞎顺手写了一篇,主要内容是git方法和一些常用命令,链接:http://memo.rongzijing.win/index.php/archives/23/和上面那篇只是机械记录一些命令不同,这篇文章是我在使用git一段时间后,有了自己的经验和感受,所以打算再写一篇文章。本文总共分为三个部分:第一部分主要讨论下git的http和ssh的区别和ssh的配置方法...

推荐系统架构图

虽然我的研究方向是数据挖掘,细分到了粗糙集中基于辨析矩阵的属性约简算法,也可以认为是特征降维。但是自己在实习期间的工程实践是个性化推荐,所以自己的毕业开题选定了两者的结合。下图是我准备毕设开题答辩的时候画的推荐系统架构图,比较认真画的......后续还会完善。最近在写毕业论文,加了点内容,图懒得改了= =推荐系统架构在不同的业务情形下的设计也会有所区别,但必备的一些组件还是通用的。总结了自己...