1. 前言 这系列的文章主要讲述2006年评出的数据挖掘10大算法(见图1).文章的重点将偏向于算法的来源以及算法的主要思想,不涉及具体的实现.如果发现文中有错,希望各位指出来,一起讨论. 图1 来自IDMer的文章 在这些算法中,最引人注目的自然是Google的核心技术之一——PageRank.因此本系列就先来探索PageRank的诞生过程. 2. 核心思想 常言道,看一个人怎样,看他有什么朋友就知道了.也就是说,一个人有着越多牛X朋友的人,他是牛X的概率就越大.将这个知识迁移到网页上就是“被…