大数据最后一公里——2021年五大开源数据可视化BI方案对比

个人非常喜欢这种说法，最后一公里不是说目标全部达成，而是把整个路程从头到尾走了一遍。

大数据在经过前几年的野蛮生长以后，开始与数据中台的概念一同向着更实际的方向落地。有人问，数据可视化是不是等同于数据大屏。数据大屏是数据可视化的一部分，其承载更多的是展示与监控的功能。

而真正对业务产生影响的，确是比较低调的自助数据可视化系统（商用的一般称之为BI系统），支撑着公司的指标体系，为业务的发展，企业的数字化驱动提供帮助。

本文将对比Superset，Redash，Metabase，Davinci，DataEase五大开源的数据可视化分析工具。

商用方案不在此次讨论之中。将这些开源的数据可视化分析工具用好，用熟练。并在其基础上进行二次开发，形成与公司业务密切结合的技术方案，并随着公司业务的发展不断的改进，是让大数据落地的一个不错的选择。

Superset

Superset是由 Airbnb 开源的数据探索与可视化平台。

官网地址：https://superset.apache.org/

源代码库：https://github.com/apache/superset

目前最新的release版本为1.3.0。社区活跃，颜值较高。

支持丰富的数据源。

提供了五十多种图表的支持，如丰富的分布，趋势，相关性图表，并且支持如Echarts等插件的方式自定义图表。

Redash

Redash 是一个可协作数据可视化和仪表板平台，旨在使用更简单的方式（SQL）进行数据可视化。

支持超过 35 个 SQL 和 NoSQL的数据源。

支持线形，饼形，漏斗，地图，旭日，词云等十几种图表。

官网地址：https://blog.redash.io/

源代码库：https://github.com/getredash/redash

2020 年 6 月 24 日 redash宣布被 Databricks（Spark，Delta Lake所属公司）收购。相信未来会发展的越来越好。

Metabase

metabase是一款开源的BI分析工具,开发语言clojure+js为主、也有高阶的收费版。

从设计理念上来说，metabase更注重非技术人员的使用体验。

官网地址：https://www.metabase.com/

源代码库：https://github.com/metabase/metabase

Davinci

Davinci是一个DVAAS（Data Visualization as a Service）平台解决方案。

Davinci是一款国产的开源数据可视化工具。由宜信数据团队开源。

官网文档地址：https://edp963.github.io/davinci/docs/zh/1.1-deployment

源代码库：https://github.com/edp963/davinci

DataEase

DataEase 是开源的数据可视化分析工具，帮助用户快速分析数据并洞察业务趋势，从而实现业务的改进与优化。DataEase 支持丰富的数据源连接，能够通过拖拉拽方式快速制作图表，并可以方便的与他人分享。

源代码库：https://github.com/dataease/dataease

体验环境地址：https://demo.dataease.io/
用户名：demo
密码：dataease

以上五大方案均为相对成熟的开源技术方案，但是各有千秋，选择最适合自己公司的方案才是最重要的。

欢迎关注 大数据流动 加入Superset学习交流群，大家共同学习进步。

更多大数据相关技术与方案实践，欢迎关注 大数据流动