博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
推荐-线下AUC提升,线上CTR无提升
阅读量:2441 次
发布时间:2019-05-10

本文共 450 字,大约阅读时间需要 1 分钟。

线下AUC提升,线上AB测试无提升

1. 判断线上线下特征提取是否一致?

2. 数据是否泄露,简言之,倒因为果,某特征跟目标有很高相关性?

3. 是否需要一味地添加特征?

4. 线上线下样本空间分布是否一致?比如:推荐系统中,训练数据集合,仅包含有点击行为的用户,过滤了无点击行为的用户,这样的过滤是否合理,是否通过随机负采样保留仅负样本用户数据,通过AB测试检验

5. 训练数据中,高活跃user bias 是否去除,比如高活跃用户每天产生100个点击行为,而低活跃度用户,每天仅1-2个点击行为,这样,这样为处理的数据,训练出来的模型受高活跃用户影响较大,实际需要,降采样高活跃用户行为数据样本,使不同活跃用户样本基本一致 -- Youtube早期论文做法

6. 理解业务,负样本一定是负样本么?举例:某电影推荐场景,每次推荐6部电影,用户可能点击其中某一部,而,因为时间等因素,用户看完一部之后,不再看其它电影,而其他电影一定是负样本么? 这时,负样本应该怎么处理呢?这个值得考虑

未完待续。。

转载地址:http://jucqb.baihongyu.com/

你可能感兴趣的文章
关于Kerberos安装的几个问题(转)
查看>>
Solaris硬盘分区简介(转)
查看>>
gcc编译器小知识FAQ(转)
查看>>
Linux下多线程编程与信号处理易疏忽的一个例子(转)
查看>>
流氓和木马结合 强行关闭你的防火墙(转)
查看>>
SUSE一纸诉状控告SCO 捍卫知识产权(转)
查看>>
debian下编译2.6.13.2内核的步骤及感受(转)
查看>>
预装正版的市场意义(转)
查看>>
创建小于16M XFree86迷你Linux系统(转)
查看>>
shell中常用的工具(转)
查看>>
使用MySQL内建复制功能来最佳化可用性(转)
查看>>
一个比较vista的vista主题for rf5.0fb(转)
查看>>
推荐一款 Linux 上比较漂亮的字体(转)
查看>>
在Linux中添加新的系统调用(转)
查看>>
Fedora Core 5.0 安装教程{下载}(转)
查看>>
把ACCESS的数据导入到Mysql中(转)
查看>>
shell里边子函数与主函数的实例(转)
查看>>
Linux中MAXIMA符号运算软件的简介(转)
查看>>
银行选择Linux 则无法回避高成本(转)
查看>>
上网聊天需要防范的几大威胁(转)
查看>>