杂记- 3W互联网的圈子,大数据敏捷BI与微软BI的前端痛点
开篇介绍
上周末参加了一次永洪科技在中关村 3W 咖啡举行的一次线下沙龙活动 - 关于它们的产品大数据敏捷 BI 工具的介绍。由此活动,我想到了三个话题 - 3W 互联网的圈子,永洪科技的大数据敏捷 BI 工具,微软 BI 工具的路应该如何去走。
3W 互联网的圈子






" 3W咖啡子公司拉勾网8月20日宣布获启明创投领投、贝塔斯曼亚洲投资基金跟投的2500万美元B轮投资,资金已全部到账。今年4月1日,拉勾网宣布获贝塔斯曼投资资金投资的500万美金A轮投资。即便今年下半年资本很热,只要是稍微靠谱的项目都能获得大额的投资,但拉勾网此轮融资的完成,估值已达到1.5亿美元。当年濒临倒闭的3W咖啡和创始人团队凭此彻底咸鱼翻身。”
" 3W有100多个股东,(i黑马注:3W咖啡馆被誉为具有中国特色的众筹创业模式案例之一),刚开始都想得很好,可以让大家都来这谈事。但大家第一次来是凑热闹,第二次来图新鲜……但最终生意都归生意。"
" 我们原来有误区,认为互联网的人很高大上,好像我们掌握了一种更先进的生产力,你觉得你很容易自上而下,就像什么《三体》里的降维攻击一样,我多牛X,传统咖啡店多苦,我做一个咖啡店还不小case?你真去做的时候,发现每个生意有每个生意的门道。"
其实,互联网就在身边,谁,又能没有一点自己的互联网梦想?
永洪科技的大数据敏捷 BI 工具


- 传统数据分析做法 - 建模,汇总数据,业务查看分析结果。数据相对静态,维度和度量公式需要预先设定好。
- 存在的问题就是分析需求变更,业务人员不能直接调整报表,周期长,响应速度比较久。
- 敏捷 BI:针对海量数据的计算能力不足,通过建模提前汇总,计算。
- 敏捷商业智能可以实现轻量建模:N个视图,快速发布。而传统的 BI 都是重量建模:统一视图,每次修改会引起比较大的结构变化,维护成本很高。
- 海量数据的分析成本- 只需传统大数据,BI 的 1/4 的成本,几天到几周,只需原 1/4 的上线周期。
- 基于细节数据的轻量建模,用新技术实现高性能的计算,点击计算让用户随心所欲。
- 有数据呈现,也有数据交互,线下挖掘,TB-PB 级的数据秒级响应。
- 非IT部分的同时直接在分析平台上做出来,Self BI, 业务用户有灵感就可以去尝试,去验证。
- 分析报告需求需要数据层的改动,需要IT部门去修改数据层和业务层。传统BI 需要一个月两个月去梳理模型,设计M额他 DWD DWA 做 ETL Cube,敏捷 BI 这些都不需要。
- 无需事先建模,可在分析过程中灵活调整分析维度和报表展现,可以在一天只能做好,细节数据,轻量建模。

TB-PB 级的数据秒级响应能力
数据量的问题,TB-PB 级的数据秒级响应能力由于没有实际的测试数据量,我不能确定是否真的可以做到,但是就示例当中的五千万级测试数据,我觉得从现场表现来看还是完全可以 Hold 住的。当然,具体后面如何去实现的细节,大数据的处理过程我还是没有过于去问。因为对我们来说,更多的时候是围绕着客户来选择适当的解决方案,如何实现不重要,但能不能实现非常重要。这个过程是在报表中不断的点击,钻取与用户的交互情况下发生的,我们就不说五千万级的秒级响应,可能几百万级的秒级交互响应传统的 BI 可能就很难做到。
WEB 平台的数据交互
工具与平台的问题,这还是一个 WEB 界面的操作,线上制作线上发布,这个绝对是一个非常大的优点。
无固定的数据模型,任何字段即维度 Drag and Drop and Done
维度和事实自动划分,任何字段可以作为维度搭配浏览数据。即看数据的角度不是类似于传统 BI 需要建模,建立层次结构那样,而是任意组合,无须预先设计。这一点对于 Business User 来说是最重要的,原因就在于传统的 BI 的流程当中如果需要在报表中改变维度通常都可能涉及到数据仓库级别的维度的改动。但是在敏捷 BI 中,这点修改是非常容易实现的,对于一个无须太多 IT 经验的用户来说,他们自己就可以解决这类问题。并且,所有的图形控件浏览和切换数据查看的方式都是非常容易操作的,Drag and Drop and Done !
灵活的集成不同的数据源
基于已有的数据附加新的数据源的问题也解决的很好。通常碰到的情况就是,我们出的数据分析的报表,用户拿到之后需要临时通过一个 Excel 表的数据做一个筛选。这个 Excel 表的数据原本是在数据仓库中不存在的,要是专门给这个 Excel 数据做一个 ETL 导入然后弄一张表,觉得总有一点那么不太标准化,并且还是属于用一次可能下次就不用了的。遇到这种情况,如何是好? 在敏捷 BI 中这个问题可以很好的解决,可以在分析数据的过程中直接附加一个新的数据源,做一些关联就可以集成进来了。不需要的时候,很容易的修改一下数据源关联就可以去掉。
- 我个人感觉永洪的在沙龙中演示的这套敏捷 BI 产品,更多的是偏向于解决基于大数据分析的一款前端报表展现工具。数据量足够大也可以支持,大数据的支持力度是没有问题的。前端展现,数据分析,各种图表,秒级交互响应对于一般的数据分析人员,报表展现是足够了的。所以这套产品的定位的关键字应该是:TB-PB 级大数据量,数据分析,报表工具。但对于数据挖掘的实现可能在这套工具中还没有看到,不知道在永洪的其它解决方案和工具中是否存在。
- ETL 的支持力度可能还不够强,或者说对于所分析的数据在数据的干净程度上是需要预先处理的,我觉得这也是大部分前端展现工具都存在的一个问题,或者说它们产品本身的定位就是面向大数据,面向前端展现的,所以这一点也其实很正常。
可变通的解决方案
心痛的微软 BI 前端



杂记- 3W互联网的圈子,大数据敏捷BI与微软BI的前端痛点的更多相关文章
- 大数据时代:基于微软案例数据库数据挖掘知识点总结(Microsoft 聚类分析算法)
原文:(原创)大数据时代:基于微软案例数据库数据挖掘知识点总结(Microsoft 聚类分析算法) 本篇文章主要是继续上一篇Microsoft决策树分析算法后,采用另外一种分析算法对目标顾客群体的挖掘 ...
- YARN之上的大数据框架REEF:微软出品,是否值得期待?
YARN之上的大数据框架REEF:微软出品,是否值得期待? 摘要:微软即将开源大数据框架REEF,REEF运行于Hadoop新一代资源管理器YARN的上层.对于机器学习等在数据传输.任务监控和结果 ...
- 瞬间读懂什么是互联网思维、大数据、O2O、众筹、红海
1.什么叫大数据? 某必胜客店的电话铃响了,客服人员拿起电话. 客服:必胜客.您好,请问有什么需要我为您服务? 顾客:你好,我想要一份…… 客服:先生,烦请先把您的会员卡号告诉我. 顾客:16846 ...
- 【Energy Big Data】能源互联网和电力大数据
背景 今年的政府工作报告突出了互联网在经济结构转型中的重要地位,报告明白指出:要制定"互联网+"行动计划,推动移动互联网.云计算.大数据.物联网等与现代制造业结合,促进电子商务.工 ...
- 分析 BAT 互联网巨头在大数据方向布局及大数据未来发展趋势
> 风起云涌的大数据战场上,早已迎百花齐放繁荣盛景,各大企业加速跑向"大数据时代".而我们作为大数据的践行者,在这个"多智时代"如何才能跟上大数据的潮流, ...
- (原创)大数据时代:基于微软案例数据库数据挖掘知识点总结(Microsoft 决策树分析算法)
随着大数据时代的到来,数据挖掘的重要性就变得显而易见,几种作为最低层的简单的数据挖掘算法,现在利用微软数据案例库做一个简要总结. 应用场景介绍 其实数据挖掘应用的场景无处不在,很多的环境都会应用到数据 ...
- WOT干货大放送:大数据架构发展趋势及探索实践分享
WOT大数据处理技术分会场,PingCAP CTO黄东旭.易观智库CTO郭炜.Mob开发者服务平台技术副总监林荣波.宜信技术研发中心高级架构师王东及商助科技(99Click)顾问总监郑泉五位讲师, ...
- Top100Summit全球案例研究峰会第一天总结——云计算和大数据
很荣幸受邀参加Top100Summit全球软件案例研究峰会,这次的大会主题是<技术推动商业变革>,组委会从全国投稿的460多件案例中甄选出100件具有代表价值的案例,进行为期4天的分享,第 ...
- DW(一):大数据DW架构参考
DW一直以来是企业信息与决策支持系统的核心组件,随着各类日志.社交.传感等非结构化数据的加入,企业内部数据按指数级增长,传统DW已经达到一个关键临界点——需要大量的资源投入到硬件.优化.支持和维护中, ...
随机推荐
- 命令行启动win7系统操作部分功能
control.exe /name microsoft.folderoptions 启动资源管理器的 文件夹属性 选项卡 control.exe /name Microsoft.AddHardware ...
- VC++ chap13 文档与串行化
Lesson 13 文档与串行化 13.1使用CArchive类对文件进行读写操作 //让对象数据持久性的过程称之为串行化,或者序列化 void CGraphicView::OnFileWrite() ...
- afx , afxMessageBox , MessageBox
afx开头的是全局函数,可以在任何地方使用 MessageBox是CWnd的子函数,只能在CWnd窗口类对象里面用, AfxMessageBox的函数原型 int AfxMessageBox( LPC ...
- python计算机视觉——黑板客老师课程学习
机器学习的一个应用方向,是如何让机器去理解图像.包括对图像里物体的识别,跟踪和测量. 能做什么——无人驾驶汽车.人脸识别.车牌识别手势识别(游戏方向) PIL静态的库 OpenCV 动态的库 impo ...
- Find the equipment indices
Here is a simple program test task, it doesn't have very diffcult logic: A zero-indexed array A cons ...
- RedHat下安装OPENCV
1.解压 unzip opencv-2.4.9.zip 2.进入目录,cmake CMakeLists.txt 生成build文件 3.使用命令 make 编译 4.使用命令 make instal ...
- java异常与处理
1:Java中的所有不正常类都继承于Throwable类.Throwable主要包括两个大类,一个是Error类,另一个是Exception类: 2:其中Error类中包括虚拟机错误和线程死锁,一旦E ...
- Selenium2+python自动化13-多窗口、句柄(handle)
前言 有些页面的链接打开后,会重新打开一个窗口,对于这种情况,想在新页面上操作,就得先切换窗口了.获取窗口的唯一标识用句柄表示,所以只需要切换句柄,我们就能在多个页面上灵活自如的操作了. 本篇以打开百 ...
- 技术英文单词贴--S
S separator 分离,隔离器 shortcut 快捷方式,捷径 sort 排序 special 特殊的,专用的 specified 规定的,详细说明,指定 specify 指定,明确提出,详细 ...
- Daily Scrum 12.9
今日完成任务: 修复了提交回答,自动消除换行符,导致文本显示混乱的BUG.解决个人信息修改界面中,问题显示顺序不对的BUG.基本完成数据库接口webservice工作.但引入的异常还未修复. 遇到困难 ...