大数据 - Teradata学习体会

引言
随着计算机系统在处理能力、存储能力等方面,特别是计算机软件技术的不断提高,使得信息处理技术得到飞速发展。
数据处理主要分为两大类:联机事物处理OLTP、联机分析处理OLAP。OLTP也就是传统的关系型数据库应用,主要功能是基本的、日常的事务处理操作,对响应时间要求非常高,是一种面向应用的生产系统。OLAP是基于数据仓库的面向主题的信息分析处理过程。
什么是数据仓库
与传统关系型数据库不同的是,数据仓库储存的是历史数据,针对数据仓库系统的查询大都非常复杂,特别消耗系统资源,对系统的可扩展能力和并行处理能力要求很高。数据仓库主要面向业务人员和管理人员,用来帮助企业管理人员作出更符合业务发展规律的决策,所以也称数据仓库为决策支持系统。数据仓库的数据来自多个数据库,并且按照预先定义好的模型对抽取的数据进行转换过滤,再将结果存放到数据仓库中。
Teradata 数据库
为了解决传统数据库在大量数据的查询分析等方面的局限性,Teradata公司推出了Teradata关系数据库管理系统。Teradata采用标准的SQL查询语言,适用于处理复杂查询数据仓库应用。
架构
Teradata的主要组件是解析引擎、BYNET和访问模块处理器(AMP)。

- 解析引擎负责从客户端接收查询命令并制定执行计划。
- BYNET相当于网络层,它从解析引擎接收执行计划并发送给相应的AMP,AMP的选择采用哈希算法实现。
- 数据表中的记录均匀分布在个AMP之间,每个AMP与存储数据的一组磁盘相关联。从BYNET接收数据和执行计划后,进行类型转换、聚合、过滤和排序等操作并将数据存储到与其关联的磁盘中。
操作
使用Teradata提供的免费Teradata数据库开发人员版本可以进行开发测试,通过Teradata SQL Assistant或BTEQ等数据库管理工具可以对数据仓库进行操作,默认用户为DBC,SQL语法和其它数据库区别不大,但其独特的内部结构适合需要处理复杂数据查询的应用。
SQL 语法
Teradata使用了标准的SQL语法并在此基础上进行了扩展,以增强数据库管理系统的功能。所有的系统对象如Table、View、Macro等存储在数据字典中,数据字典的所有者为DBC用户,在客户端可以调用数据字典中的对象访问数据库。刚开始使用Teradata时可以使用其帮助系统提供的命令HELP、SHOW、EXPLAIN查看数据库中各种对象的结构以及SQL请求的执行过程,对理解Teradata工作原理以及各种SQL语句的使用有很大帮助。
体会
在如今快速发展的大数据革命时代,数据积累量越来越多,其中蕴含着大量重要的信息,通过对这些数据进行分析和综合处理,可以发掘出对企业发展、政府管理部门至关重要的业务信息,帮助管理人员作出合理的决策。
当然,传统的关系型数据库也是可以完成基本的事务处理和数据分析操作的,但是当数据量非常庞大时,数据库就显得无能为力了。比如,一个早期的电商平台,只需一个网站、几台服务器、一个MySQL就可以运营了,当客户增多、数据量增大时,只需采用多台服务器、多个数据库的方式就可以勉强应付,但是随着数据量的不断增长,数据之间的关系也越来越复杂,管理人员此时关心的不是“昨天营业额是多少”这类问题,而是“哪些用户是高价值用户”、“某商品的销售量与哪些因素有关”等,这时就需要建立数据仓库了,Teradata数据仓库是专门针对决策支持系统的特点而开发的关系数据库管理系统,相对于其它商业数据库,Teradata更适合需要处理大数据量及数据分析的应用,可以极大提高应用的性能。
数据库可以存储和处理数据,而数据仓库的职责则是发掘数据的价值,最大程度地利用数据。
本文为作者kMacro原创,转载请注明来源:http://www.jianshu.com/p/e800fd4c5c08。
大数据 - Teradata学习体会的更多相关文章
- 大数据Hadoop学习之搭建hadoop平台(2.2)
关于大数据,一看就懂,一懂就懵. 一.概述 本文介绍如何搭建hadoop分布式集群环境,前面文章已经介绍了如何搭建hadoop单机环境和伪分布式环境,如需要,请参看:大数据Hadoop学习之搭建had ...
- 大数据学习---大数据的学习【all】
大数据介绍 什么是大数据以及有什么特点 大数据:是指无法在一定时间内用常规软件工具对其内容进行抓取.管理和处理的数据集合. 大数据是一种方法论:“一切都被记录,一切都被数字化,从数据中寻找需求,寻找知 ...
- Spark大数据的学习历程
Spark主要的编程语言是Scala,选择Scala是因为它的简洁性(Scala可以很方便在交互式下使用)和性能(JVM上的静态强类型语言).Spark支持Java编程,但对于使用Java就没有了Sp ...
- 大数据Python学习大纲
最近公司在写一个课程<大数据运维实训课>,分为4个部分,linux实训课.Python开发.hadoop基础知识和项目实战.这门课程主要针对刚从学校毕业的学生去应聘时不会像一个小白菜一样被 ...
- 大数据Hadoop学习之搭建Hadoop平台(2.1)
关于大数据,一看就懂,一懂就懵. 一.简介 Hadoop的平台搭建,设置为三种搭建方式,第一种是"单节点安装",这种安装方式最为简单,但是并没有展示出Hadoop的技术优势,适合 ...
- 大数据Hadoop学习之了解Hadoop(1)
关于大数据,一看就懂,一懂就懵. 大数据的发展也有些年头了,如今正走在风口浪尖上,作为小白,我也来凑一份热闹. 大数据经过多年的发展,有着不同的实现方案和分支,不过,要说大数据实现方案中的翘楚,那就是 ...
- Java开发者想尝试转行大数据,学习方向建议?
前言 相信很多Java开发者都对大数据有一定的了解,随着大数据时代的到来,也有很多Java程序员想要转行大数据.大数据技术中大多数平台使用的都是Java语言,因此,对于大数据技术的学习来说,Ja ...
- 布客·ApacheCN 编程/后端/大数据/人工智能学习资源 2021.7
公告 ApacheCN 翻译预计将于半年内恢复. 我们的开源项目必须有中文的 README,如果是文档类项目,必须全部中文,否则将会被清理.请大家贡献项目时一定要留意. 我们目标是[财务自由+情感自由 ...
- 布客·ApacheCN 编程/后端/大数据/人工智能学习资源 2020.11
公告 我们始终与所有创作者站在一起,为创作自由而战.我们还会提供一切必要的技术支持. 我们全力支持科研开源(DOCX)计划.希望大家了解这个倡议,把这个倡议与自己的兴趣点结合,做点力所能及的事情. 我 ...
随机推荐
- 关于样式选择器:hover出现忽闪现象
有时候在做项目的时候会想给一个元素添加一个遮罩效果,然后鼠标划过去的时候,遮罩消失,一般最简单的方法就是使用样式选择器:hover,但是经历过才知道恶心,有种灯泡快要坏的感觉,闪瞎自己的眼睛,于是诞生 ...
- jmeter系列------变量的提取
为了保证脚本的移植性,需要把一些变量提取出来,变量主要分为2类 1.一类是公用变量(全局变量),包括:IP.port.附件路径.CSV路径等,通常是使用用户定义的变量 组件 2.另一类是测试变量一般作 ...
- ThinkPHP自定义分页模板
TpPageHelper.php <?php namespace tool; use think\Paginator; class TpPageHelper extends Paginator ...
- 带你走进SAP项目实施过程——立项(1)
到底谁会首先有上ERP的想法,可能是企业老板,也可能是总经理级别等高管.但不管是谁,在确定之前,按道理企业风控部.总经办或者信息部等相关部门都需要对ERP项目做立项申请.毕竟ERP项目涉及企业方方面面 ...
- [iOS开发]Xcode8兼容iOS7以及低版本Xcode调试高版本iOS系统
现在的项目一般都要兼容iOS7系统,同时也要兼容iOS10,在Xcode8上面,默认情况下无法调试iOS7,因为缺乏调试iOS7需要的配置文件.同时在低版本的Xcode上面(8以下),也无法调试iOS ...
- WCF(三)分布式事务
最近在学WCF,所以有两个设想疑问(菜鸟多疑问): 如果有WCF服务A,WCF服务B,客户端调用WCF服务A插入一条数据,然后再调用服务B也插入一条数据,然而服务B出错了进行了回滚,服务A能不能也进行 ...
- 201521123061 《Java程序设计》第十周学习总结
201521123061 <Java程序设计>第十周学习总结 1. 本周学习总结 1.这周异常方面的知识主要是关于自定义异常,自定义的异常可以继承自Throwable或Exception类 ...
- 201521123040《Java程序设计》第8周学习总结
1. 本周学习总结 1.1 以你喜欢的方式(思维导图或其他)归纳总结集合与泛型相关内容. 2. 书面作业 本次作业题集集合 1.List中指定元素的删除(题目4-1) 1.1 实验总结 我们每次删除元 ...
- 201521123009 《Java程序设计》第6周学习总结
1. 本周学习总结 2. 书面作业 Q1:clone方法 1.1 Object对象中的clone方法是被protected修饰,在自定义的类中覆盖clone方法时需要注意什么? 用protected修 ...
- 201521123071 《JAVA程序设计》第四周学习总结
1. 本周学习总结 1.1 1.2 在本周的学习中,主要学习了以下几点: 注释的应用,并能在Eclipse中查看 继承的基本定义,关键字super的用法,覆盖与重载 多态与is-a,instanceo ...