March 9, 2019

git配置ssh以及JetBrains IDEs使用git教程

前言关于git,之前我在memo里瞎顺手写了一篇,主要内容是git方法和一些常用命令,链接:http://memo.rongzijing.win/index.php/archives/23/和上面那篇只是机械记录一些命令不同,这篇文章是我在使用git一段时间后,有了自己的经验和感受,所以打算再写一篇文章。本文总共分为三个部分:第一部分主要讨论下git的http和ssh的区别和ssh的配置方法...

推荐系统架构图

虽然我的研究方向是数据挖掘,细分到了粗糙集中基于辨析矩阵的属性约简算法,也可以认为是特征降维。但是自己在实习期间的工程实践是个性化推荐,所以自己的毕业开题选定了两者的结合。下图是我准备毕设开题答辩的时候画的推荐系统架构图,比较认真画的......后续还会完善。最近在写毕业论文,加了点内容,图懒得改了= =推荐系统架构在不同的业务情形下的设计也会有所区别,但必备的一些组件还是通用的。总结了自己...

用户画像阶段性总结

本文主要针对ctr预估场景下,对这次新开发的用户画像做一个阶段性的总结。整个过程主要包括特征、架构流程的设计和工程实现。新版用户画像特征维度从8维上涨到179维,上线已将近一个月后,用户覆盖率从原来的40-50%提升至75%-85%左右。其中长期用户画像中的一些需要时间累积的特征,随着时间推移表现越来越好。离线AUC和PR最近一段时间内也在稳步提升。入司半年,最近能够独立开发用户画像部分,自...
November 29, 2018

xgboost和LR模型级联

导语在各种推荐场景下,ctr预估使用最多的模型是LR(Logisitc Regression),简单且强大。而随着基于boosting思想的树算法(如GBDT、xgboost)在kaggle竞赛上大放异彩,这些树模型也开始被用于ctr预估中。两种模型的自身原理决定了两者各有优缺点,于是将两者进行融合的想法也油然而生,Facebook早在2014年就已提出并验证了该想法的有效性。半年前,在离线...
October 30, 2018

向windows用户疯狂安利msys2

msys2是一款能让windows用户也可以体验Linux丝滑环境的shell命令行开发环境,可以完全代替windows的cmd。而且自带 pacman 管理,可以安装任何有windowsz支持的linux软件。Mac土豪和Linux大佬请出门右拐(微笑)。当时被xc安利的时候我还不屑一顾,但用完之后表示真香,好东西要安利给大家。一、安装点击链接[http://mirrors.ustc.ed...