某天,看到一些资料. 发现输入文件是一个使用SAX技术存储的文件格式.  于是在网上找了不少资料 ; 感慨计算机的世界真的是太有趣了.

在此做个简单的介绍.

时间序列数据挖掘是利用数据挖掘技术对一组与时间相关的数据对象进行信息和知识提取.由于 时间序列数据的高维特性不利于一般数据挖掘算法 的运用和扩展,因此,对时间序列进行数据降维成 为该领域的重要课题和主要研究方向.

目前有很多成熟的数据降维的方法(小波变换\ 傅立叶变换\ 分段线近似,分段聚合近似PPA), 其中以符号聚合近似方法(SAX)比较流行。 他是由Linhe Keogh在2003年提出的一种基于分段聚合近似的表示方法。他在时间序列数据的挖掘中得到了广泛应用并且读的了良好效果。

SAX具有快速降维、有界、高效查询等优点。

SAX是一种基于PPA的符号表示方法,他不仅能够对时间序列进行快速的降维,而且能够保证符号空间中相似模式之间的距离满足真实距离的下界要 求,防止发生漏报现象.它被广泛应用于时间序列 的数据降维和表示,以及相似性模式搜索和异常序 列检测.然而,由于SAX只保留了序列段的均值信 息,难免会存在一些不足。

为了了解他的不足,先了解它的处理过程。

给定长度为m的时间序列Q=(q1,q2,….qm)

把它转化为一个程度为w的序列, Q’=(q’1,q'2,,,,q’m)

(这个公式告诉我们是时间序列转化为以序列段的均值,并且把这些均值多维基本对象, 组成新的序列Q’)

从符号聚合近似过程中可以知道,它是一种基 于均值信息的表示形式,即利用一个均值数据来表 示原始时间序列的k个数据点,这样难免会出现信 息丢失的情况.特别地,当数据压缩比越大,均值 所代表的数据点就越大,那么反映数据信息的能力 就越弱.在有些情况下,这种以均值为信息对象的 数据表现形式将不能有效地对序列进行识别.

请看:

SAX (Symbolic Aggregate approXimation)[2]的一个网站上提出了相关的代码和理论基础)

[1] 李海林, 态特征的时间序列符号聚合近似方法 http://d.wanfangdata.com.cn/Periodical/mssbyrgzn201105010

[2] http://cs.gmu.edu/~jessica/sax.htm

关于SAX的更多相关文章

  1. Android之SAX解析XML

    一.SAX解析方法介绍 SAX(Simple API for XML)是一个解析速度快并且占用内存少的XML解析器,非常适合用于Android等移动设备. SAX解析器是一种基于事件的解析器,事件驱动 ...

  2. XML技术之SAX解析器

    1.解析XML文件有三种解析方法:DOM SAX DOM4J. 2.首先SAX解析技术只能读取XML文档中的数据信息,不能对其文档中的数据进行添加,删除,修改操作:这就是SAX解析技术的一个缺陷. 3 ...

  3. 四种解析和创建方式(DOM,SAX,DOM4J,JDOM)

    一.先导入jar包 DOM基于树形,SAX基于事件,DOM4J和JDOM基于底层API 二.代码如下 1 package com.sxt.test; import java.io.File; impo ...

  4. Android 使用pull,sax解析xml

    pull解析xml文件 1.获得XmlpullParser类的引用 这里有两种方法 //解析器工厂 XmlPullParserFactory factory=XmlPullParserFactory. ...

  5. SpringMVC org.xml.sax.SAXParseException: cvc-complex-type.2.4.c 报错处理方式

    使用SpringMVC的过程中需要访问静态文件,即在spring-servlet.xml文件中添加了 <mvc:default-servlet-handler /> 标签,以开启Sprin ...

  6. dom解析和sax解析的区别及优缺点

    dom解析一开始就将文档所有内容装入内存,每个元素(标签)都作为一个element对象存储,形成对象树,缺点是对内存占用大,不能解析数据量很大的文档:优点是方便进行crud操作. sax解析,逐行解析 ...

  7. JAVA使用SAX解析XML文件

    在我的另一篇文章(http://www.cnblogs.com/anivia/p/5849712.html)中,通过一个例子介绍了使用DOM来解析XML文件,那么本篇文章通过相同的XML文件介绍如何使 ...

  8. SAX解析技术

    SAX,全称Simple API for XML,既是指一种接口,也是指一个软件包.SAX工作原理简单地说就是对文档进行顺序扫描,当扫描到文档(document)开始与结束.元素(element)开始 ...

  9. SAX与DOM

    http://www.cnblogs.com/zhulin/archive/2012/05/03/2480962.html 在解析xml时(如浏览器解析html标签),主要存在两种方式:SAX模式和D ...

  10. java使用sax解析xml

    目的:解析xml文件,并存入mysql,并且要解析的字段能一一对应.这里解析的是微博的文件,想要利用里面的article和person_id字段. 思路: 为了能得到person_id和article ...

随机推荐

  1. backbone实例01

    backbonejs往简单说,就是一前端MVC框架,适合用于单页面.复杂的前端逻辑. 直接上代码,里面都有相关注释,重点是理解清楚view.collection.model这三者如何关联调用. < ...

  2. DOM节点

    DOM的一个想法 让我们从下面的HTML开始学习吧: <html> <head> <title>The title</title> </head& ...

  3. jquery 提交From表单

    /** * 异步提交From */ function ajaxSubmitFrom (btnId,fromId,url){ $(btnId).click(function () { var optio ...

  4. Makefile编译

    这篇文章演示多目录,c,c++混编的Makefile写法. 文件夹: $dir/bin/ $dir/deps/ deps/inc/ deps/lib/ deps/src/ $dir/obj/ $dir ...

  5. Dynamics AX 2012 R2 窗体系列 - 在窗体上修改字段时所触发的方法及其顺序

        在这个系列里,Reinhard将和大家一起探索在AX的窗体上执行操作时,都会触发窗体.窗体数据源和表上的哪些方法,并且是以怎样的顺序触发的.     这次,我们来看看在窗体上修改或录入数据的情 ...

  6. phpcms v9联动菜单的调用方法及get_linkage函数简单过程

    {get_linkage($r['areaid'],1,' >> ',1)} 复制代码 当然这个 $r 也不是绝对的.要看你的loop 是如何写的. {loop $data $n $r} ...

  7. [课程设计]Scrum 3.2 多鱼点餐系统开发进度(页面优化&下单详细信息页面)

    Scrum 3.2 多鱼点餐系统开发进度(页面优化&下单详细信息页面)  1.团队名称:重案组 2.团队目标:长期经营,积累客户充分准备,伺机而行 3.团队口号:矢志不渝,追求完美 4.团队选 ...

  8. [TCPIP] IP路由表及选路 Note

    TCP/IP IP路由表及选路 1.路由表信息 路由表一般包含信息:目的IP地址.下一站路由器的IP地址.标志. 为数据报传送指定的一个网络接口. 查看路由表信息mac-abeen:~ abeen$ ...

  9. sql中文日期格式转换(xxxx年x月x日)

    ) set @dd='2014年10月1日' select replace(replace( replace(@dd,'日',''),'月','-'),'年','-') 别人的方法 )='2012年1 ...

  10. PAT算法题学习笔记

    1001. 害死人不偿命的(3n+1)猜想 (15) 卡拉兹(Callatz)猜想: 对任何一个自然数n,如果它是偶数,那么把它砍掉一半:如果它是奇数,那么把(3n+1)砍掉一半.这样一直反复砍下去, ...