参考这篇: https://blog.csdn.net/jiandanjinxin/article/details/54633475 再论数据科学竞赛中的Data Leakage 存在和利用这种倒‘因’为‘果’的feature的现象,叫数据竞赛中的Data Leakage. Data Leakage的原因 以此我们可以看出,Data Leakage 基本都是在准备数据的时候,或者数据采样的时候出了问题,误将与结果直接相关的feature纳入了数据集.这样的纰漏,比较难以发现. 必须重视因果性 我…