待尝试研究的可视化组件及产品:

  • 开源组件
  • 商业组件

开源组件


  • zeppelin
  • Caravel
  • D3.js
  • Flare
  • talend(ETL)
  • pentaho
  • spagoBI
  • NanoCubs
  • Dygraphs
  • Saiku
  • airpal
  • Chart.js
  • chartist.js
  • ECharts
  • FnordMetric
  • redash
  • zingchart

zeppelin


  • 主页:
  • apache 开源产品
  • 在编写 Flink,Spark,Hive 等相关作业时,要是能快速的将我们所编写的作业能可视化在我们面前的工具
  • http://www.pointtec.de/zeppelin/

Caravel


  • Caravel 是 Airbnb (知名在线房屋短租公司)开源的数据探查与可视化平台(曾用名Panoramix),该工具在可视化、易用性和交互性上非常有特色,用户可以轻松对数据进行可视化分析
  • 快速创建数据可视化互动仪表盘
  • 丰富的可视化图表模板,灵活可扩展
  • 细粒度高可扩展性的安全访问模型,支持主要的认证供应商(数据库、OpenID、LDAP、OAuth 等)
  • 简洁的语义层,可以控制数据资源在 UI 的展现方式
  • 与 Druid 深度集成,可以快速解析大规模数据集
  • https://github.com/airbnb/superset
  • https://segmentfault.com/a/1190000005083953

D3.js


  • 一个强调网页标准的用来创建数据可视化JavaScript库。使用HTML、SVG和CSS,可以让使用者以数据驱动的方式去操作DOM,能够满足现在浏览器的兼容性并且不受专用框架的限制。
  • 示例地址:https://github.com/d3/d3/wiki/Gallery

Flare


  • 处理复杂、交互式图表、支持数据管理、视觉编码、动画和交互作用,各种可视化表格从时间线到多层图表来说明关系
  • 演示地址:http://flare.prefuse.org/demo
  • 关注演示部分:
    1. layout -> intent

talend


  • 网址:https://www.talend.com/download/talend-open-studio/
  • 即提供免费版本,也提供收费版本
  • Pentaho Data Integration (Kettle)是Pentaho生态系统中默认的ETL工具。通过非常直观的图形化编辑器(Spoon),您可以定义以XML格式储存的流程。在Kettle运行过程中,这些流程会以不同的方法编译。用到的工具包括命令行工具(Pan),小型服务器(Carte),数据库存储库(repository)(Kitchen)或者直接使用IDE(Spoon)。

  • Talend Open Studio是 Talend 开发的ETL工具——Talend 是一家主营数据集成和数据管理解决方案的企业。Talend 采用用户友好型,综合性很强的IDE(类似于Pentaho Kettle 的 Spoon)来设计不同的流程。这些流程可以在IDE内部测试并编译成Java 代码。您可以随时查看并编辑生成的Java代码,同时实现强大的控制力和灵活性。 两者都非常优秀,都属于用户友好型的交叉平台(基于Java的)工具。它们的主要差异在于Kettle 将 ELT 流程编译为 XML 格式,然而Talend Open Studio 则生成 Java 代码

  • 易用性:

    1. Talend:有 GUI 图形界面但是以 Eclipse 的插件方式提供
    2. Kettle:有非常容易使用的 GUI,出现问题可以到社区咨询。
  • 技术支持:
    1. Talend:主要在美国
    2. Kettle:在美国,欧洲(比利时,德国,法国,英国),亚洲(中国,日本,韩国)都可以找到相关技术支持人员
  • 部署:
    1. Talend:创建 java 或perl 文件,并通过操作系统调度工具来运行
    2. Kettle:可以使用 job 作业方式或操作系统调度,来执行一个转换文件或作业文件,也可以通过集群的方式在多台机器上部署
  • 速度
    1. Talend:需要手工调整,对特定数据源有优化知识
    2. Kettle:比 Talend 快,不过也需要手工调整,对 Oracle 和 PostGre 等数据源做了优化,同时也取决于转换任务的设计
  • 数据质量:
    1. Talend:在 GUI 里有数据质量特性,可以手工写 SQL 语句。
    2. Kettle:在 GUI 里有数据质量特性,可以手工写 SQL 语句、java脚本、正则表达式来完成数据清洗。

pentaho


  • 网址:http://www.pentaho.com/product/big-data-analytics
  • pentaho自称为“全面的数据集成和商业智能平台”,该公司主要大力推销它的商业软件,该软件基于开源社区。
  • Pentaho是一个以工作 流为核心的、强调面向解决方案而非工具组件的BI套件,整合了多个开源项目,目标是和商业BI相抗衡。它偏向于与业务流程相结合的BI解决方案
  • 功能和特点
    ◆ 工作流引擎:Shark and JaWE
    ◆ 数据库:Firebird RDBMS
    ◆ 集成管理和开发环境:Eclipse
    ◆ 报表工具:Eclipse BIRT
    ◆ ETL工具:Enhydra/Kettle
    ◆ OLAP Server:Mondrian
    ◆ OLAP展示:JPivot
    ◆ 数据挖掘组件:Weka
    ◆ 应用服务器和Portal服务器:JBoss
    ◆ 单点登陆服务及LDap认证:JOSSO
    ◆ 自定义脚本支持:Mozilla Rhino Javascript脚本处理器

spagoBI


NanoCubs


Dygraphs


Saiku


airpal


  • Airpal 是一个基于 Web 的查询执行工具,利用 Facebook 的 PrestoDB 进行查询和获取结果。提供了查找表、元数据、浏览数据行,编写和执行查询的功能,这些功能全部通过浏览器完成。一旦查询开始执行,用户可跟踪查询进度获取并下载结果。查询的结果可生成新的 Hive 表用于进一步的分析
  • 源码地址:https://github.com/airbnb/airpal
  • 项目特性:
    •可选的用户访问控制
    •SQL语法高亮
    •查询结果导出到CSV文件,或者存到Hive表中
    •可查看SQL查询的历史记录
    •可保存查询
    •根据表名搜索对应的表
    •可查看表结构,并预览前1000行数据

Chart.js


  • chart.js 是一个简单、面向对象、为设计者和开发者准备的图表绘制工具库
  • ChartJS 使用HTML5 Canvas元素的Javascript图形库,支持6种统计图形,不依赖其他库
  • 网址:http://www.bootcss.com/p/chart.js/

chartist.js


ECharts


FnordMetric


  • FnordMetric是一个使用SQL语句来实现数据收集和可视化的框架,它使用chartsql扩展了标准的sql,允许你编写查询语句来返回图表而不是返回表,查询结果作为SVG向量图或者images来呈现出来。这些图表可以很容易嵌入一个web站点中,这样你就可以在短短几分钟内绘制漂亮的图表
  • 网址: http://fnordmetric.io/
  • 参考:http://blog.csdn.net/itas109/article/details/52311390

redash


  • re:dash 是一款开源的BI工具,提供了基于web的数据库查询和数据可视化功能
  • 访问地址: https://redash.io/

zingchart


商业组件


  • Ethink
  • Tableau
  • PowerBI
  • FineReport
  • Style Intelligence
  • sisense

EThink


  • 公司地址: http://www.ethinkbi.com/#
  • 演示: http://www.ethinkbi.com/try/
  • 说明:安徽象形信息科技有限公司(ETHINK)是国内大数据产品及方案服务商,专注于大数据,BI,大数据分析,大数据挖掘工具领域,是一家国内大数据分析产品领域的领导企业
  • 关注点:
    1. 地图下钻(缺点:不能按比例缩放) http://120.26.36.169:8088/ethinknew/user?type=item2
    2. K线图:关注下面关联的时间轴

Tableau


    1. 混合数据源
    2. 高效快速
    3. Tableau9.0版本开始支持中国地图
  • 产品分类:
    1. Tableau Desktop:收费,分个人版跟专业版,个人版只能连本地文件,专业版则无限制。Tableau制作端,创建可视化图表的软件
    2. Tableau Server:收费。可以发布做好的可视化图表,在浏览器或者移动设备上即可查看,共享、协作提高数据分析决策效率
    3. Tableau Online:收费,按年收取。基于云的服务,简单来讲就是云计算版server,企业不用自己部署Tableau server服务,通过Tableau自己的云端服务器,处理发布出去的可视化图表,同样能达到server的效果。不过由于服务器不在中国境内,运行效率可能会受到影响
    4. Tableau Public:免费。可在线分享自己的工作表、仪表板以及故事,与更多的人交流交互式数据故事
    5. Tableau Reader:免费。Tableau阅读器可打开并查看Desktop中生成的可视化图表,并且能进行可视化交互、筛选、钻取和查看明细
  • 关注点:
    1. 图表丰富,操作简单
    2. 交叉表

PowerBI


FineReport


Style Intelligence


sisense


可视化mark的更多相关文章

  1. 百度数据可视化图表套件echart实战

    最近我一直在做数据可视化的前端工作,我用的最多的绘图工具是d3.d3有点像photoshop,功能很强大,例子也很多,但是学习成本也不低,做项目是需要较大人力投入的.3月底由在亚马逊工作的同学介绍下使 ...

  2. Caffe学习系列(17):模型各层数据和参数可视化

    cifar10的各层数据和参数可视化 .caret,.dropup>.btn>.caret{border-top-color:#000!important}.label{border:1p ...

  3. Caffe学习系列(16):caffemodel可视化

    通过前面的学习,我们已经能够正常训练各种数据了.设置好solver.prototxt后,我们可以把训练好的模型保存起来,如lenet_iter_10000.caffemodel. 训练多少次就自动保存 ...

  4. 【转】Laravel+Angularjs+D3打造可视化数据,RESTful+Ajax

    http://897371388.iteye.com/blog/1975351 大致思路也就是下面,由于最近在学Laravel也在学Angularjs,加上之前做的项目用到了d3. 原来的方案如下: ...

  5. Echarts数据可视化全解注释

    全栈工程师开发手册 (作者:栾鹏) Echarts数据可视化开发代码注释全解 Echarts数据可视化开发参数配置全解 6大公共组件详解(点击进入): title详解. tooltip详解.toolb ...

  6. NLP︱词向量经验总结(功能作用、高维可视化、R语言实现、大规模语料、延伸拓展)

    R语言由于效率问题,实现自然语言处理的分析会受到一定的影响,如何提高效率以及提升词向量的精度是在当前软件环境下,比较需要解决的问题. 笔者认为还存在的问题有: 1.如何在R语言环境下,大规模语料提高运 ...

  7. R语言︱LDA主题模型——最优主题数选取(topicmodels)+LDAvis可视化(lda+LDAvis)

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 笔者寄语:在自己学LDA主题模型时候,发现该模 ...

  8. 大数据时代的图表可视化利器——highcharts,D3和百度的echarts

    大数据时代的图表可视化利器——highcharts,D3和百度的echarts https://blog.csdn.net/minidrupal/article/details/42153941   ...

  9. Python:数据可视化pyecharts的使用

    什么是pyecharts? pyecharts 是一个用于生成 Echarts 图表的类库. echarts 是百度开源的一个数据可视化 JS 库,主要用于数据可视化.pyecharts 是一个用于生 ...

随机推荐

  1. Oracle连接知识

    Oracle基本连接知识   登录sys用户或 sysdba用户权限的账号   Sqlplus         建用户 Create user test identified by 12345678 ...

  2. UVALive 4490 压缩DP

    转载自http://blog.csdn.net/zstu_zlj/article/details/9903589 没有接触过压缩DP.位运算也不太熟.所以理解了思路还是不懂代码.

  3. Scrapy-redis改造scrapy实现分布式多进程爬取

    一.基本原理: Scrapy-Redis则是一个基于Redis的Scrapy分布式组件.它利用Redis对用于爬取的请求(Requests)进行存储和调度(Schedule),并对爬取产生的项目(it ...

  4. Delphi 项目 结构 文件夹 组织

    Delphi Project Structure Folder Organization http://delphi.about.com/od/delphitips2008/qt/project_la ...

  5. mybatis 传递多个值的解决办法

    参考链接:http://www.2cto.com/database/201409/338155.html. 其中三种方案是正确的,有些例子的细节是错的,但是无关紧要

  6. 基于struts2和hibernate的登录和注册功能——完整实例

    1.该项目使用MySQL数据库,数据库名为test,表名info,如图所示: 2.配置web.xml(Struts2使用) <?xml version="1.0" encod ...

  7. python打包工具pyinstaller的使用

    安装PyInstaller pip install pyinstaller 安装完后,检查安装成功与否: pyinstaller --version 安装成功后,就可以使用下面的命令了: pyinst ...

  8. mysql5.7高可用架构之MHA

    一.MHA简介 MHA(Master High Availability)目前在mysql高可用方面比较成熟.是一套优秀的作为 mysql高可用性环境下故障切换和主从提升的高可用软件.在MySQL故障 ...

  9. IOS常用代码整理

    常用代码整理: 12.判断邮箱格式是否正确的代码: //利用正则表达式验证 -(BOOL)isValidateEmail:(NSString *)email { NSString *emailRege ...

  10. 显式(静态)调用: LIB + DLL + .H

    1.编程时用ad.h,ad.lib,放在项目当前目录里2.在头文件中加入#include "ad.h"3.在Project Setting–>Link–>Object/ ...