Tableau 之一 连接数据源
导入数据源
与各类数据源建立连接关系,是使用tableau探索分析数据的第一步,本节内容包括:
- 数据源类型
- 连接数据源
数据源类型
打开tableau,可以在左侧窗口看到连接选项,目前tableau可以连接70多种数据源类型,这些数据源大体可以分为两类,分别是本地数据源和服务器数据源。
“数据源”:数据的来源,包括文件、数据库、服务器等。
tableau支持的本地数据源包括Excel、txt、csv、json等各类常见的源数据格式,还支持多种空间文件, 为使用地图分析提供了条件。
tableau支持的服务器数据源包括各类数据库(如Mysql、Oracle、MongoDB)、在线数据服务(如google analtics)等,可以根据使用需要,与目标服务器数据源建立连接关系,实时或提取数据进行分析。
连接数据源
tableau自带的超市示例的字段比较多,刚开始学习tableau的时候,会有一种眼花缭乱、不知从何下手的感觉。因此,在此专门构造了一个数据集demo,以便于更直观的学习数据连接操作。该数据集demo为EXCEL工作簿,包含有“书籍”和“作者”两张数据表单,其中“书籍”数据表包括书名、作者、作者ID、出版社4个字段,“作者”数据表包括作者、作者ID、国籍3个字段。
通过EXCEL导入数据集
操作步骤:
- 打开tableau,在左侧连接窗口点击“Excel”;
- 在文件对话框找到准备导入的数据集。
根据操作步骤,找到并打开需要导入的excel工作薄后,即可进入数据源管理页面。该页面分为四个功能区,分别是画布区、数据区、数据源区、工作表区,可以对导入的数据源进行各种管理操作,如连接多个数据源、确定数据源之间的连接方式、修改字段名、隐藏字段、调整字段属性等。
- 数据源区:导入的数据源连接,可以是一个数据源,也可以是多个数据源。
- 工作表区:对应每一个数据源的工作表,每个工作表都是一个数据表单。
- 画布区:对某个工作表或多个工作表彼此间关系进行联接等操作的区域,比如选择数据提取方式(实时、提取)、确定多个工作表的连接方式(如内连接、外连接)等。
- 数据网格区:对各个工作表的数据表单进行展现、操作的区域,可以查看及重命名字段名称、更换字段类型(如字符串、数字、日期)、创建计算等。
通过MySQL导入数据集
为测试tableau与MySQL的连接及数据导入,首先在本地MySQL数据库建立名为book的数据库demo,里面有一个“书籍2”数据表,该表包含书名、作者、作者ID、出版社4个字段。
操作步骤:
- 打开tableau,在左侧连接窗口点击“MySQL”;
- 在弹出的对话框填写MySQL服务器的地址、端口、用户名和密码,均正确无误后即可进入数据源页面。
完成对MySQL数据库数据的导入后,即进入数据源管理页面,该页面与Excel方式导入的数据源管理页面完全一致,只是在数据源区的连接位置显示了“MySQL”,表明该数据源的类型。
通过剪贴板导入数据集
在tableau中导入数据还有更简单的方式,即通过复制粘贴操作直接一步导入数据集。
导入步骤:
- 在数据源选择好目标数据,并进行复制操作(Ctrl+C );
- 打开tableau,在连接窗口进行粘贴操作(Ctrl+V );
- 数据导入成功,tableau跳转到数据源页面。
通过粘贴复制数据的数据源管理页面与其他方式导入的数据源管理页面完全一致,只是在数据源区的连接位置显示了“文本文件”,表明该数据源的类型。需要注意的是,通过复制粘贴数据进入到数据源页面后,在数据源区可能出现“使用数据解释器”的选择项,如此次操作就出现了该选择项,需要检查是否对其进行勾选。
数据解释器:tableau通过数据解释器自动对数据源的附加表、子表、分层页眉、无关的页眉和页脚,或者空白行和列进行检测,移除无关信息并优化准备用于分析的数据源。通常,在设置数据源之后,如果 tableau 检测到数据源存在如上问题,则会提示使用数据解释器。
个人理解,数据解释器就是tableau认为我们数据源中的数据存在这样或那样的问题,不适合开展数据分析,或者会影响分析的结果。为避免这些问题的出现,tableau就根据预设的一套规则,对导入的数据源进行优化。但优化的结果可能符合预期,也可能不符合预期,需要我们对其进行检测后,再确定是否要勾选启用数据解释器。
此次复制粘贴数据后出现数据解释器,表明tableau认为导入的数据可能存在问题,因此需要勾选“数据解释器” 看它自动优化的结果是否符合预期。 通过勾选,可以看到tableau将数据集中的三个字段标题复制到了数据表中,这样的处理结果不符合预期,因此针对该数据集,可以使用数据解释器,即取消勾选项。
Tableau 之一 连接数据源的更多相关文章
- java连接数据源-读取tomcat数据源配置
读取数据源配置,获取连接 1.配置数据源 D:\apache-tomcat-7.0.70\conf\context.xml <Resource name="jdbc/news" ...
- Access连接数据源配置(新手必知)
今天要连接Access时发现win7 64位旗舰版控制面板中管理工具下的数据源(ODBC)配置竟然只有SQLServer的驱动,其他的都没有了,这可不好玩!上网百度了一番,有人也遇过这样的问题,我在此 ...
- linux tableau server 连接 presto
记录一下这个弄个好久的难题 linux tableau server 版本 tableau-server-2018-2-0.x86_64.rpm 安装过程 我参照了这儿仁兄 http://ju. ...
- JDBC终章- 使用 DBUtils实现增删查改- C3P0Utils数据源/QueryRunner runner连接数据源并执行sql
JDBC终章- 使用 DBUtils实现增删查改 1.数据库结构 Create Table CREATE TABLE `user` ( `id` ) NOT NULL AUTO_INCREMENT, ...
- springboot连接数据源,配置数据库
Spring官方DriverManagerDataSource的配置 修改yml #配置数据源的属性 spring: datasource: driver-class-name: com.mysql. ...
- ApplicationContext 配置里dataSource mysql连接数据源,设置ssl和utf-8
?useUnicode&useSSL=false
- 从数据源支持、支持方式等角度深入了解Smartbi与Tableau
对数据分析来讲,数据源支持是基本功.让数据分析工具与数据保持一个通道,建立会话.用数据分析应用服务器与我们需要分析的业务数据进行连接,拿到需要的数据进行分析.Smartbi.Tableau系统给我们提 ...
- Tableau学习Step3——数据的连接与基本图形的制作
Tableau学习Step3--数据的连接与基本图形的制作 本文首发于博客冰山一树Sankey,去博客浏览效果更好. 一. 前言 本教程通过一个案例从浅到深来学习Tableau知识 案例概述 Nort ...
- wildfly jobss 同时连接多个数据源
由于需要从一个远程机器取数据.处理后保存到本地数据库处理.用 wildfly datasource 会报: [com.arjuna.ats.arjuna] (default task-6) ARJUN ...
随机推荐
- Oracle完全卸载详解
Oracle数据库的安装这里就不说了,网上应该有很多,但是oracle数据库的卸载却找不到一个比较详细的完整卸载的说明.很多卸载不完全,会有遗留数据,影响后续的安装.所以自己整理一份以前上学的时候学习 ...
- Python----多元线性回归
多元线性回归 1.多元线性回归方程和简单线性回归方程类似,不同的是由于因变量个数的增加,求取参数的个数也相应增加,推导和求取过程也不一样.. y=β0+β1x1+β2x2+ ... +βpxp+ε 对 ...
- HashMap源码分析(基于jdk8)
我们知道在jdk7中HashMap的实现方式是数组+链表.而在jdk8中,实现有所变化,使用的是数组+链表+红黑树实现的. 当链表长度达到8时转化为红黑树. static final int TREE ...
- Flask自定义转换器,实现路由匹配正则表达式参数
Flask框架动态路由实现参数传递和Django框架有类似之处,但是相比于Django框架,Flask实现复杂的参数就需要自己自定义转换器来实现了,而不能向Django那样直接使用正则表达式 # 路由 ...
- [转帖]御界预警:3700余台SQL服务器被入侵挖矿 或导致严重信息泄露事件
御界预警:3700余台SQL服务器被入侵挖矿 或导致严重信息泄露事件 https://zhuanlan.kanxue.com/article-8292.htm sqlserver的弱密码破解和提权攻击 ...
- dubbo框架的web端(war)和server端(tar.gz)结合jenkins打包方式
一.web端程序,打包成war包 jenkins配置 1.项目名称,旧文件处理配置 2.参数构建配置 3.源码库配置 4.打包文件pom.xml配置及多环境打包传参,此处传参qa(表示打测试环境包,名 ...
- DAY20、垃圾回收机制,正则模块
一.垃圾回收机制1.不能被程序访问到的数据,就称之为垃圾2.引用计数:每一次对值地址的引用都可以使该值得引用计数加1 每一次对值地址的释放都可以使该值得引用计数减一 当一个值的引用计数为0时,该值就会 ...
- 使用FastJson进行对象和JSON转换属性命名规则为下划线和驼峰的问题
public class AliPayParam { @JSONField(name="out_trade_no") private String outTradeNo; @JSO ...
- 内存溢出OOM
如何避免OOM 异常? 想要避免OOM 异常首先我们要知道什么情况下会导致OOM 异常. 1.图片过大导致OOM Android 中用bitmap 时很容易内存溢出,比如报如下错误:Java.lang ...
- C++ 中 double、 long double、long 和 long long
double 属于浮点类型,具体为双精度浮点类型,通常为 IEEE-754 64 位浮点类型. long double 也属于浮点类型,具体为扩展精度浮点类型,其精度不低于double,具体由编译器和 ...