1.简介 孤立森林(Isolation Forest)是另外一种高效的异常检测算法,它和随机森林类似,但每次选择划分属性和划分点(值)时都是随机的,而不是根据信息增益或者基尼指数来选择. 在建树过程中,如果一些样本很快就到达了叶子节点(即叶子到根的距离d很短),那么就被认为很有可能是异常点. 因为那些路径d比较短的样本,都是因为距离主要的样本点分布中心比较远的.也就是说,可以通过计算样本在所有树中的平均路径长度来寻找异常点. sklearn提供了ensemble.IsolationForest模…