导入数据源

与各类数据源建立连接关系,是使用tableau探索分析数据的第一步,本节内容包括:

  • 数据源类型
  • 连接数据源

数据源类型

打开tableau,可以在左侧窗口看到连接选项,目前tableau可以连接70多种数据源类型,这些数据源大体可以分为两类,分别是本地数据源和服务器数据源。

“数据源”:数据的来源,包括文件、数据库、服务器等。

tableau支持的本地数据源包括Excel、txt、csv、json等各类常见的源数据格式,还支持多种空间文件, 为使用地图分析提供了条件。

tableau支持的服务器数据源包括各类数据库(如Mysql、Oracle、MongoDB)、在线数据服务(如google analtics)等,可以根据使用需要,与目标服务器数据源建立连接关系,实时或提取数据进行分析。

连接数据源

tableau自带的超市示例的字段比较多,刚开始学习tableau的时候,会有一种眼花缭乱、不知从何下手的感觉。因此,在此专门构造了一个数据集demo,以便于更直观的学习数据连接操作。该数据集demo为EXCEL工作簿,包含有“书籍”和“作者”两张数据表单,其中“书籍”数据表包括书名、作者、作者ID、出版社4个字段,“作者”数据表包括作者、作者ID、国籍3个字段。

通过EXCEL导入数据集

操作步骤:

  1. 打开tableau,在左侧连接窗口点击“Excel”;
  2. 在文件对话框找到准备导入的数据集。

根据操作步骤,找到并打开需要导入的excel工作薄后,即可进入数据源管理页面。该页面分为四个功能区,分别是画布区、数据区、数据源区、工作表区,可以对导入的数据源进行各种管理操作,如连接多个数据源、确定数据源之间的连接方式、修改字段名、隐藏字段、调整字段属性等。

  • 数据源区:导入的数据源连接,可以是一个数据源,也可以是多个数据源。
  • 工作表区:对应每一个数据源的工作表,每个工作表都是一个数据表单。
  • 画布区:对某个工作表或多个工作表彼此间关系进行联接等操作的区域,比如选择数据提取方式(实时、提取)、确定多个工作表的连接方式(如内连接、外连接)等。
  • 数据网格区:对各个工作表的数据表单进行展现、操作的区域,可以查看及重命名字段名称、更换字段类型(如字符串、数字、日期)、创建计算等。

通过MySQL导入数据集

为测试tableau与MySQL的连接及数据导入,首先在本地MySQL数据库建立名为book的数据库demo,里面有一个“书籍2”数据表,该表包含书名、作者、作者ID、出版社4个字段。

操作步骤:

  1. 打开tableau,在左侧连接窗口点击“MySQL”;
  2. 在弹出的对话框填写MySQL服务器的地址、端口、用户名和密码,均正确无误后即可进入数据源页面。

完成对MySQL数据库数据的导入后,即进入数据源管理页面,该页面与Excel方式导入的数据源管理页面完全一致,只是在数据源区的连接位置显示了“MySQL”,表明该数据源的类型。

通过剪贴板导入数据集

在tableau中导入数据还有更简单的方式,即通过复制粘贴操作直接一步导入数据集。

导入步骤:

  1. 在数据源选择好目标数据,并进行复制操作(Ctrl+C );
  2. 打开tableau,在连接窗口进行粘贴操作(Ctrl+V );
  3. 数据导入成功,tableau跳转到数据源页面。

通过粘贴复制数据的数据源管理页面与其他方式导入的数据源管理页面完全一致,只是在数据源区的连接位置显示了“文本文件”,表明该数据源的类型。需要注意的是,通过复制粘贴数据进入到数据源页面后,在数据源区可能出现“使用数据解释器”的选择项,如此次操作就出现了该选择项,需要检查是否对其进行勾选。

数据解释器:tableau通过数据解释器自动对数据源的附加表、子表、分层页眉、无关的页眉和页脚,或者空白行和列进行检测,移除无关信息并优化准备用于分析的数据源。通常,在设置数据源之后,如果 tableau 检测到数据源存在如上问题,则会提示使用数据解释器。

个人理解,数据解释器就是tableau认为我们数据源中的数据存在这样或那样的问题,不适合开展数据分析,或者会影响分析的结果。为避免这些问题的出现,tableau就根据预设的一套规则,对导入的数据源进行优化。但优化的结果可能符合预期,也可能不符合预期,需要我们对其进行检测后,再确定是否要勾选启用数据解释器。

此次复制粘贴数据后出现数据解释器,表明tableau认为导入的数据可能存在问题,因此需要勾选“数据解释器” 看它自动优化的结果是否符合预期。 通过勾选,可以看到tableau将数据集中的三个字段标题复制到了数据表中,这样的处理结果不符合预期,因此针对该数据集,可以使用数据解释器,即取消勾选项。


本章来源

Tableau 之一 连接数据源的更多相关文章

  1. java连接数据源-读取tomcat数据源配置

    读取数据源配置,获取连接 1.配置数据源 D:\apache-tomcat-7.0.70\conf\context.xml <Resource name="jdbc/news" ...

  2. Access连接数据源配置(新手必知)

    今天要连接Access时发现win7 64位旗舰版控制面板中管理工具下的数据源(ODBC)配置竟然只有SQLServer的驱动,其他的都没有了,这可不好玩!上网百度了一番,有人也遇过这样的问题,我在此 ...

  3. linux tableau server 连接 presto

    记录一下这个弄个好久的难题 linux tableau server 版本  tableau-server-2018-2-0.x86_64.rpm 安装过程 我参照了这儿仁兄   http://ju. ...

  4. JDBC终章- 使用 DBUtils实现增删查改- C3P0Utils数据源/QueryRunner runner连接数据源并执行sql

    JDBC终章- 使用 DBUtils实现增删查改 1.数据库结构 Create Table CREATE TABLE `user` ( `id` ) NOT NULL AUTO_INCREMENT, ...

  5. springboot连接数据源,配置数据库

    Spring官方DriverManagerDataSource的配置 修改yml #配置数据源的属性 spring: datasource: driver-class-name: com.mysql. ...

  6. ApplicationContext 配置里dataSource mysql连接数据源,设置ssl和utf-8

    ?useUnicode&useSSL=false

  7. 从数据源支持、支持方式等角度深入了解Smartbi与Tableau

    对数据分析来讲,数据源支持是基本功.让数据分析工具与数据保持一个通道,建立会话.用数据分析应用服务器与我们需要分析的业务数据进行连接,拿到需要的数据进行分析.Smartbi.Tableau系统给我们提 ...

  8. Tableau学习Step3——数据的连接与基本图形的制作

    Tableau学习Step3--数据的连接与基本图形的制作 本文首发于博客冰山一树Sankey,去博客浏览效果更好. 一. 前言 本教程通过一个案例从浅到深来学习Tableau知识 案例概述 Nort ...

  9. wildfly jobss 同时连接多个数据源

    由于需要从一个远程机器取数据.处理后保存到本地数据库处理.用 wildfly datasource 会报: [com.arjuna.ats.arjuna] (default task-6) ARJUN ...

随机推荐

  1. iview render Datepicker 起止时间限制

    { title: '开始时间', key: 'planDateFrom', minWidth: 120, sortable: true, align: 'center', render: (h, pa ...

  2. 宝塔控制面板创建ftp后链接不上的解决方法

    很多的新手在安装宝塔面板并且创建完ftp管理后链接ftp居然链接不上?有许多朋友都不知道本站q302博客也是基于宝塔控制面板管理的,本站在安装网站完成后也和你们一样ftp链接不上,后面经过多次测试之后 ...

  3. Ubuntu本地文件上传至HDFS文件系统出现的乱码问题及解决方案

    1.问题来源及原因 用shell命令上传到HDFS中之后出现中文乱码,在shell命令窗口查看如图: 在eclipse中的文件HDFS查看工具查看如图: 原因:上传至HDFS文件系统的文本文件(这里是 ...

  4. [转帖]Oracle 补丁体系(PSR/PSU/CPU) 及 opatch 工具 介绍

    Oracle 补丁体系(PSR/PSU/CPU) 及 opatch 工具 介绍 原文:http://blog.csdn.net/tianlesoftware/article/details/58095 ...

  5. P3373 【模板】线段树 2

    线段树的模板,但是还应注意维护乘标记,乘法的优先级大于加法,一定记得还要取模. #include<bits/stdc++.h> using namespace std; ; struct ...

  6. String,StringBuffer与StringBuilder的区别?? 缓存

    转: String 字符串常量StringBuffer 字符串变量(线程安全)StringBuilder 字符串变量(非线程安全) 简要的说, String 类型和 StringBuffer 类型的主 ...

  7. idea安装成功后,设置字体、快捷键、配置jdk等操作

    设置字体 配置jdk 快捷键 复制当前一行: 设置自动提示,不区分大小写 关闭当前窗口 设置类头注释 自定义注释+注释快捷键 Lombok 插件安装  get.set方法报红cannot resolv ...

  8. 【BZOJ4032】[HEOI2015]最短不公共子串(后缀自动机,序列自动机)

    [BZOJ4032][HEOI2015]最短不公共子串(后缀自动机,序列自动机) 题面 BZOJ 洛谷 题解 数据范围很小,直接暴力构建后缀自动机和序列自动机,然后直接在两个自动机上进行\(bfs\) ...

  9. CentOS 常用Linux命令

    防火墙 开放端口 firewall-cmd --zone=public --add-port=80/tcp --permanent    (--permanent永久生效,没有此参数重启后失效) 重启 ...

  10. vim打开退出命令

    打开文件方法:cd /Users/liuchang/.jenkins/secrets && vim initialAdminPassword 退出方法:先按ESC,再输入冒号,在输入命 ...