前言 最近在看Peter Harrington写的"机器学习实战",这是我的学习心得,这次是第12章 - 使用FP-growth算法来高效发现频繁项集. 基本概念 FP-growth算法 FP-growth算法的性能很好,只需要扫描两次数据集,就能生成频繁项集.但不能用于发现关联规则. 我想应该可以使用Apriori算法发现关联规则. FP代表频繁模式(Frequent Pattern). 条件模式基(conditional pattern base). 条件模式基是以所查找元素项为结…
前言 最近在看Peter Harrington写的"机器学习实战",这是我的学习心得,这次是第11章 - 使用Apriori算法进行关联分析. 基本概念 关联分析(association analysis)或者关联规则学习(association rule learning) 这是非监督学习的一个特定的目标:发现数据的关联(association)关系.简单的说,就是那些数据(或者数据特征)会一起出现. 关联分析的目标包括两项:发现频繁项集和发现关联规则.首先需要找到频繁项集,然后才能…
广度优先树 对于一个图G=(V,E)在跑过BFS算法的过程中会创建一棵广度优先树. 形式化一点的表示该广度 优先树的形成过程是这样的: 对于图G=(V,E)是有向图或是无向图, 和图中的源结点s, 我们定义图G的前驱子图为Gf={Vf, Ef}. 其中Vf = {v ->V : v.f <>NIL} AND {s}, Ef = {(v.f , v) : v->(Vf - {s})} 即,G的前驱子图Gf是这样定义的: Gf中的点集合Vf  中的点是G中的前驱(父结点)结点不为空的…
转载:http://blog.csdn.net/tjiyu/article/details/53983064 下面先来了解Java虚拟机垃圾回收的几种常见算法:标记-清除算法.复制算法.标记-整理算法.分代收集算法.火车算法,介绍它们的算法思路,有什么优点和缺点,以及主要应用场景. 1.标记-清除算法 标记-清除(Mark-Sweep)算法是一种基础的收集算法. 1.算法思路 "标记-清除"算法,分为两个阶段: (A).标记       首先标记出所有需要回收的对象: 标记过程如<…
一些小概念 1.反投影直方图的结果是一个概率映射,体现了已知图像内容出如今图像中特定位置的概率. 2.概率映射能够找到最初的位置,从最初的位置開始而且迭代移动,便能够找到精确的位置,这就是均值漂移算法做的事情. 3.均值漂移算法是以迭代的方式锁定函数的局部最大值的. 关于均值漂移算法的过程(opencv) 事实上均值漂移算法就是寻找提前定义寻找区域中数据点的重心,或者说加权平均值.将寻找区域中心移动到数据点的重心处,并反复这个过程直到寻找区域重心收敛到一个稳定点. OpenCV中定义了两种终止条…
这段时间笔者几篇文章介绍了改算法线性的文章. 关联文章的地址 这个算法我在我的博客里应用动态规划做过,详细实现请参阅我的dp板块,下面给出书上最快的算法,时间复杂度为O(n),称之为线性算法. #include <iostream> using namespace std; int x[10]={31,-41,59,26,-53,58,97,-93,-23,84}; int mmax(int a,int b) { return a>b?a:b; } int main() { int ma…
阅读书籍:[美]Aditya Bhargava◎著 袁国忠◎译.人民邮电出版社.<算法图解> 第1章 算法简介 1.2 二分查找 一般而言,对于包含n个元素的列表,用二分查找最多需要\(log_2n\)步,而简单查找最多需要n步 仅当列表是有序的时候,二分查找才管用 python猜数字代码(二分查找) def binarySeach (list,item): low = 0 high = len(list) - 1 while low <= high: mid = (low + high…
knn算法: 1.优点:精度高.对异常值不敏感.无数据输入假定 2.缺点:计算复杂度高.空间复杂度高. 3.适用数据范围:数值型和标称型. 一般流程: 1.收集数据 2.准备数据 3.分析数据 4.训练算法:不适用 5.测试算法:计算正确率 6.使用算法:需要输入样本和结构化的输出结果,然后运行k-近邻算法判定输入数据分别属于哪个分类,最后应用对计算出的分类执行后续的处理. 2.1.1 导入数据 operator是排序时要用的 from numpy import * import operato…
#include <stdio.h> void swap(int v[],int i,int j) { int temp; temp = v[i]; v[i] = v[j]; v[j] = temp; } void qsort(int v[],int left,int right) { int i,last; if(left >= right) return; swap(v,left,(left + right) / 2); last = left; for(i = left + 1;i…
第一章JavaScript的编程环境和模型 1.2JavaScript编程实践 1.2.1 声明和初始化变量 JavaScript中的变量默认为全局变量,如果初始化未被声明的变量,该变量就成了一个全局变量. javascript中使用关键字var声明初始化变量.  var 变量名:   var 变量名=初始化值: 例如: var name; var number=10; var text="Hellow World"; var bool=false; 1.2.2 Javascript中…