SQLServer BI 学习笔记
MSBI 学习库: https://ask.hellobi.com/blog/biwork
SSAS库部署的几种方式 http://www.cnblogs.com/aspnetx/archive/2010/09/02/1815982.html
如果说商业智能分为三个层次:告诉你发生了什么,为什么会发生,将来会发生什么。那么,数据挖掘绝对算是商业智能中最高的一个层次,告诉你将来会发生什么,也就是预测。而预测的基础就是根据海量的历史数据,结合一定的算法,以概率为基础,告诉你一条新数据某条属性的趋势。
BI的过程可以看成是数据的昨天,今天和明天,数据的昨天,通过报表告诉你的业务之前发生了什么,数据的今天,通过多维分析等工具告诉你这些为什么会发生,那么数据的明天,就是通过数据挖掘算法,对已有的海量历史数据进行挖掘,从而让你知道你的业务未来会是什么样。
SQL:来为多维数据集建立分区,或者在数据挖掘中指定训练数据或者预测数据
MDX:查多维数据集用的
DMX:查挖掘模型用的,它主要面向分析服务中的数据挖掘部分,通过它可以建立挖掘结构和挖掘模型,以及训练数据和做预测查询
ADOMD.NET:就是专门用来访问分析服务用的
事例表:左面的表是在数据仓库经过整合的一批数据,用来训练和验证模型。右面的表是待预测的表,将在模型生成完毕后对这个表里的数据进行预测。
元数据:是描述数据仓库内数据的结构和建立方法的数据。可将其按用途的不同分为两类,技术元数据和商业元数据。
Business Intelligence(BI) = Data Warehouse(DW) + OLAP + Data Mining(DM)
商业智能=数据仓库+联机分析+数据挖掘
OLAP和数据挖掘:OLAP使用技术比数据挖掘简单,前者也就是涉及到维度、度量、层次、cube等一些概念,技术上真的有些傻瓜。而后者好像真的高深很多,一堆算法,什么关联算法、决策树、神经元等等,怪能吓唬人的。OLAP和数据挖掘都是为决策提供支持,只是侧重点不同,前者提供描述型的模型,告诉你什么样的产品在什么地区的销售额和去年的对比。后者提供探索型的模型,告诉你啤酒和尿布的规律。最后的决策都是人来做。几年的大型BI项目几乎都是这种思路,先建数据仓库,上OLAP和报表应用,数据挖掘在二期考虑。
多维分析:多维分析报表结合商业智能的核心技术——OLAP,可以帮助用户进行多角度、灵活动态的分析。多维分析报表由“维”(影响因素)和 “指标”(衡量因素)组成,能够真正为用户所理解、并真实的反映企业特性信息。多维分析是分析企业数据最有效的方法,是OLAP的灵魂
OLAP的多维分析视图就是冲破了物理的三维概念,采用了旋转、嵌套、切片、钻取和高维可视化技术,在屏幕上展示多维视图的结构,使用户直观地理解、分析数据,进行决策支持。
ROLAP、MOLAP、HOLAP: OLAP系统按照其存储器的数据存储格式可以分为关系OLAP(RelationalOLAP,简称ROLAP)、多维OLAP(MultidimensionalOLAP,简称MOLAP)和混合型OLAP(HybridOLAP,简称HOLAP)三种类型。
ODS(Operational Data Store)是数据仓库体系结构中的一个可选部分,ODS具备数据仓库的部分特征和OLTP系统的部分特征,它是“面向主题的、集成的、当前或接近当前的、不断变化的”数据。
物化视图是包括一个查询结果的数据库对象,它是远程数据的的本地副本,或者用来生成基于数据表求和的汇总表。
大数据、云计算、商业智能:三者之间的关系,个人理解:离用云计算来处理大数据,解决性能问题,然后在大数据的基础上进行数据分析、数据挖掘。
4V:大数据的4V特性,即类型复杂,海量,快速和价值
Hadoop:一个分布式系统基础架构,用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。只在你的数据量可能会扩充到TB或甚至PB这样的水平时,才探索像Hadoop这样的大数据方法。
微软官方表示,微软已经放弃了微软与Hortonworks开发实施Windows Server(也就是HDInsight Server for Windows)的计划。相反,微软将会建议那些希望在Windows Server上部署Hadoop的客户选择Hortonworks Data Platform (HDP) for Windows。
去年发布的SQL Server 2012针对大数据做了很多改进,其中最重要的就是全面支持Hadoop。
SQL Server并行数据仓库:并行数据仓库(Parallel Data Warehouse Appliance,简称PDW)是在SQL Server 2008 R2中推出的新产品,目前已经成为微软主要的数据仓库产品,并将于今年发布基于SQL Server 2012的新款并行数据仓库一体机。SQL Server并行数据仓库采取的是大规模并行处理(MPP)架构,与传统的单机版SQL Server存在着根本上的不同,它将多种先进的数据存储与处理技术结合为一体,是微软大数据战略的重要组成部分。
云计算包含如下:
IaaS:基础设施即服务
PaaS:平台即服务
SaaS:软件即服务
Informatica:最富盛名的是数据集成平台,“所谓数据集成平台,其前身是ETL(Extraction Transformation Loading,数据提取、转换和加载),是伴随着BI、数据仓库的需求出现的,其主要功能对各种业务平台数据进行抽取和相关转化,以此来满足BI、数据仓库对数据格式和内容挖掘的要求。”但彬说。“不仅BI、数据仓库对数据格式/内容有需求,企业不同应用系统之间也不断交换数据,为此,企业数据集成概念脱颖而出。”
BI经典实例全过程,多读几遍:使用SQL Server Analysis Services数据挖掘的关联规则实现商品推荐功能 http://www.cnblogs.com/aspnetx/archive/2013/02/25/2931603.html
使用SQL Server分析服务定位目标用户 http://www.cnblogs.com/aspnetx/archive/2013/04/05/3000448.html
数据挖掘扩展插件语言:DMX http://winsystem.ctocio.com.cn/443/9390443.shtml http://www.doc88.com/p-094200441111.html
数据挖掘算法全解释:http://technet.microsoft.com/zh-cn/library/ms175595(v=sql.100).aspx
博客园SSAS学习资源库:http://zzk.cnblogs.com/s?w=SSAS&%3Bt=&%3Bsort=Votes
微软SQLServer官方示例项目部署-数据引擎和分析服务部分 http://www.cnblogs.com/aspnetx/archive/2013/01/30/2883831.html
一起玩转SQL Server 2012 下的分析服务(带图) :http://www.cnblogs.com/aspnetx/archive/2013/03/24/2978347.html
多维分析之概念准备篇: http://www.cnblogs.com/jinspire/archive/2011/11/23/2259718.html
OLAP的多维数据分析:http://www.51cto.com/art/200511/11337.htm
多维联机分析处理:http://wiki.mbalib.com/wiki/%E5%A4%9A%E7%BB%B4%E8%81%94%E6%9C%BA%E5%88%86%E6%9E%90%E5%A4%84%E7%90%86
SSIS包的部署、配置、定期执行:http://wenku.baidu.com/view/668d6ceeaeaad1f346933f5b.html
一步一步学习sqlserver BI:http://www.kuqin.com/datawarehouse/20080421/7163.html
专注BI博客:http://www.cnblogs.com/aspnetx/category/67838.html
SQLServer BI 学习笔记的更多相关文章
- Microsoft Power BI 学习笔记
Power Bi 学习笔记 一 Power BI 是微软发布的一系列的软件服务.应用和连接器,这些软件服务.应用和连接器协同工作,将不相关的数据源转化为合乎逻辑.视觉上逼真的交互式见解. ...
- 【BI学习笔记】适合集成到项目里的BI:Wyn Enterprise
近日,我收到葡萄城的邮件,讲葡萄城开始进军BI领域,发布了一套BI和报表工具,叫Wyn Enterprise. 之前了解过PowerBI等面向终端用户的BI工具,我发现BI工具与Wyn Enterpr ...
- GJM :SqlServer语言学习笔记
----------------------------SqlServer RDBMS 关系型数据库管理系统 Row/Record 行 Colimn/Attribute 列 Field/Cell 字段 ...
- SqlServer存储过程学习笔记(增删改查)
* IDENT_CURRENT 返回为任何会话和任何作用域中的特定表最后生成的标识值. CREATE PROCEDURE [dbo].[PR_NewsAffiche_AddNewsEntity] ( ...
- sqlserver存储过程学习笔记(一)基础知识篇(全)
说出来有点丢人,做sqlserver应用系统近一年,竟然没有使用过存储过程,现在就好好的梳理一下对应知识,慢慢让其加入到我的项目中去吧. 存储过程的优点:1.运行效率高,提供了在服务器端快速执行sql ...
- SQL-Server数据库学习笔记-表
1. 表及其属性 表(Table):也称实体,是存储同类型数据的集合. 列(Field):也称字段.域或属性,它构成表的架构,具体表示为一条信息中的一个属性. 行(Row):也称元组(Tuple),存 ...
- sqlserver 存储过程学习笔记(二) 在项目中的应用<多表分页>
(1)存储过程建立 USE [NewPlat] GO /****** Object: StoredProcedure [dbo].[usp_PagingLarge] Script Date: ...
- 【BI学习笔记】在Linux上安装Wyn Enterprise商业智能报表服务器
在百度文库上找来的,放到这里,避免以后丢了. 葡萄城出品的Wyn Enterprise商业智能软件的设计器和查看视图是通过浏览器使用的,不需要安装专门的程序.Wyn Enterprise的服务器端可以 ...
- SQLServer学习笔记系列1
一.前言 一直自己没有学习做笔记的习惯,所以为了加强自己对知识的深入理解,决定将学习笔记写下来,希望向各位大牛们学习交流! 不当之处请斧正!在此感谢!这边就先从学习Sqlserver写起,自己本身对数 ...
随机推荐
- hive理论
join操作: 这个 group by count()操作: 数据倾斜: 操作• Join on a.id=b.id• Group by• Count Distinct count(groupby)• ...
- 虚拟机扩容mac
VMware虚拟机Mac增大容量: 1.设置硬盘容量大小 2.打开虚拟机的终端,找到需要扩展的硬盘.输入命令 :diskutil list 注意 :我的硬盘名字叫yz,这一行可以看见当前分配容量,最后 ...
- Netty - 3 内存分配
https://www.cnblogs.com/gaoxing/p/4253833.html netty的buffer引入了缓冲池.该缓冲池实现使用了jemalloc的思想 内存分配是面向虚拟内存的而 ...
- Extjs实现Grid表格显示【一】
Ext.onReady(function(){ // Ext.Msg.alert("提示","hello world!! "); var stu =new Ex ...
- MDI窗体容器
Mdi是一个窗体容器控件,直接在新建好的窗体里面,将此窗体设置为Mdi容器,开启了Mdi容器的窗体里面,如果有点击事件打开新窗体,则这些新窗体会在此窗体内部的Mdi容器中打开 操作步骤: 1.首先先新 ...
- work单进程群发通知 后面会增加Channel组件的分组推送以及集群推送篇章
<?phpuse Workerman\Worker;use Workerman\Lib\Timer; require_once '../../web/Workerman/Autoloader.p ...
- js循环对象,(多层数组)
javaScript遍历对象.数组总结 在日常工作过程中,我们对于javaScript遍历对象.数组的操作是十分的频繁的,今天抽空把经常用到的方法小结一下,方便今后参考使用! javaSc ...
- wamp添加本地虚拟域名
修改一下文件位置,引入文件 下面是配置文件添加配置指向目录 <VirtualHost *:80> ServerAdmin 979996962@qq.com DocumentRoot &qu ...
- get请求中url传参中文乱码问题--集锦
一:get请求url中带有中文参数,有三种方式进行处理防止中文乱码 1.如果使用tomcat作为服务器,那么修改tomcat配置文件conf/server.xml中,在 <Connector ...
- python网络编程之C/S架构介绍
标签(空格分隔): c/s架构介绍 什么是C/S架构 C指的是client(客户端软件),S指的是Server(服务端软件),后续我们可以试着写个c/s软件实现服务器软件与客户端软件基于网络通信: 计 ...