序列模式分析算法GSP的实现 一.算法简介 序列模式定义:给定一个由不同序列组成的集合,其中,每个序列由不同的元素按顺序有序排列,每个元素由不同项目组成,同时给定一个用户指定的最小支持度阈值,序列模式挖掘就是找出所有的频繁子序列,即该子序列在序列集中的出现频率不低于用户指定的最小支持度阈值. GSP是序列模式挖掘的一种算法.其主要实现步骤描述如下: 1)扫描序列数据库,得到长度为1的序列模式L1,作为初始的种子集 L1 C2 L2 C3 L3 C4 L4 -- 2)根据长度为i 的种子集Li …