参加2013中国大数据技术大会(BDTC2013)
2013年12月5日-6日参加了为期两天的2013中国大数据技术大会(Big Data Technology Conference, BDTC2013),本期会议主题是:“应用驱动的架构与技术 ”。大数据概念最近真是火得不行,从大会多达7个的“大数据架构与系统”、“大数据技术”、“大数据应用”、“大数据研究与发展”、“大数据基准测试”“智能交通与大数据”以及“传统行业如何驾驭大数据”主题论坛,再到现场爆棚的人群,可见大家拥抱大数据的高涨热情。
在9月份读完了一本《大数据时代》,后面又听大学老师介绍了一次Hadoop的HDFS以及MapReduce,就敢修改了一篇勘探大数据立项报告。当看了Hadoop生态系统的框架图后,直接被一堆代号搞得晕头转向,慢慢地只明白了其中几个简单意思,随便一个系统就能庞大得把你淹死,大数据,胆小者慎入!
大数据白皮书与发展趋势
5号会议以主席致辞和院士讲话开始。
马上就是程学旗发布《大数据白皮书》,据说这本书马上就会在CSDN免费发布,内容包括:大数据的发展背景、典型的业务大数据、大数据技术体系、大数据产业链与生态环境、大数据人才培养以及大数据发展趋势等。
程学旗报告的后半部分重点介绍了大数据的10大发展趋势,网上有一篇报道发得挺快的讲了这个内容。
1. 大数据从概念化走向价值化
2. 大数据处理架构的多样化模式并存
3. 大数据安全与隐私越来越重要
4. 大数据分析与可视化成为热点
5. 大数据产业成为战略性产业
6. 数据的商品化和数据共享的联盟化
7. 基于大数据推荐和预测正逐步流行
8. 大数据性能成为支撑性的技术
9. 数据科学的兴起
10. 大数据生态环境逐步完善
BDAS
在大数据创新大赛颁奖之后,是一篇主题演讲Taming Big Data with Berkeley Data Analytics Stack(BDAS),这里介绍一个Hadoop之外的一个大数据分析框架,试验室的名称叫AMPLab(来自于Algorithms, Machines, Person)。
BDAS的目标:
腾讯的报告:大数据处理的规模化与实时化演进
云计算是挖掘大数据价值的核心基础这张片子介绍传统处理方式与大数据处理的对比。
后面讲到了RCFile和ORCFile(Optimized Row Columnar)数据的存储格式,还不了解。
The Stae of Apache HBase
下午吃完饭后直接犯困,有2个演讲人的声音几乎没有什么起伏,一会就要睡过去。其中有一篇讲互联网金融的,我也不感兴趣。
只是大概听了一个老外介绍The Stae of Apache HBase,下图中被人头挡住的部分是HDFS。
6号的会议我一直在大数据技术主题论坛里呆着。
百度:基于大数据的硬盘故障预测
从HDFS里学了一个三副本概念,这里才知道还有各种纠删码的方案,有一个重要评价指标叫MTTDL(Mean Time To Data Loss平均无数据丢失时长?)。
浙大:机器学习与大数据
何晓飞教授从人脸识别讲到机器学习,先介绍了机器学习的发展历程。
大数据时代的机器学习现在都在朝着深度学习和在线学习攻关。
后面介绍了最近邻搜索中的哈希索引等技术问题。
大数据时代可视化和可视分析的机遇与挑战
报告从The Top 10 Challenges in Extreme-Scale Visual Analytics这篇论文引出了北大在可视化方面的工作。
下图给出了通过出租车GPS数据来分析北京交通情况。
还讲到一个多维数据拼图系统。http://vis.pku.edu.cn/mddv/val/sketch#CarData
这篇大数据可视化的报告有PDF在CSDN上可以下载。
Extending MPI to Big Data Computing: Challenges and Benefits of DataMPI
这篇报告中探讨了如何让MPI改造为大数据时代的并行计算,以前有大量MPI并行代码可以看看这篇文章。
参加2013中国大数据技术大会(BDTC2013)的更多相关文章
- 2013中国大数据技术大会——BDTC2013
阿里飞天平台总架构师唐洪分享了飞天开放平台. 飞天平台特点:同时支持在线和离线应用:安全控制:分布式部署,监控和诊断:无单点故障,可用性99.9%:数据3副本,数据可靠性“10个9”. 阿里飞天平台总 ...
- 2016中国大数据技术大会( BDTC ) 共商大数据时代发展之计
中国大数据技术大会(BDTC)的前身是Hadoop中国云计算大会(HadoopinChina,HiC).从2008年仅60余人参加的技术沙龙发展到当下数千人的技术盛宴,目前已成为国内最具影响力.规模最 ...
- 大数据技术人年度盛事! BDTC 2016将于12月8-10日在京举行
2016年12月8日-10日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中国科学院计算技术研究所和CSDN共同协办的2016中国大数据技术大会(Big Data Technology ...
- 中国大数据六大技术变迁记(CSDN)
大会召开前期,特别梳理了历届大会亮点以记录中国大数据技术领域发展历程,并立足当下生态圈现状对即将召开的BDTC 2014进行展望: 追本溯源,悉大数据六大技术变迁 伴随着大数据技术大会的发展,我们亲历 ...
- 自然语言处理工具HanLP被收录中国大数据产业发展的创新技术新书《数据之翼》
在12月20日由中国电子信息产业发展研究院主办的2018中国软件大会上,大快搜索获评“2018中国大数据基础软件领域领军企业”,并成功入选中国数字化转型TOP100服务商. 图:大快搜索获评“2018 ...
- 奥威软件Speed-BI荣获2016年度中国大数据最佳云平台奖
(原文转自:http://www.powerbi.com.cn/page110?article_id=210) 2016年12月16日,“科技原力觉醒,引领创新巅峰”—2016创新影响力年会暨国家产业 ...
- 开源大数据技术专场(上午):Spark、HBase、JStorm应用与实践
16日上午9点,2016云栖大会“开源大数据技术专场” (全天)在阿里云技术专家封神的主持下开启.通过封神了解到,在上午的专场中,阿里云高级技术专家无谓.阿里云技术专家封神.阿里巴巴中间件技术部高级技 ...
- 【学习笔记】大数据技术原理与应用(MOOC视频、厦门大学林子雨)
1 大数据概述 大数据特性:4v volume velocity variety value 即大量化.快速化.多样化.价值密度低 数据量大:大数据摩尔定律 快速化:从数据的生成到消耗,时间窗口小,可 ...
- WOT2016大数据技术峰会——千人技术盛宴
WOT2016大数据技术峰会是一场聚焦大数据领域最前沿的的技术及经验分享.2016年11月25-26日北京粤财JW万豪酒店如约而至,会议规模达到1000人! 由51CTO主办的千人技术盛宴--WOT2 ...
随机推荐
- Silver Cow Party(最短路,好题)
Silver Cow Party Time Limit:2000MS Memory Limit:65536KB 64bit IO Format:%I64d & %I64u Su ...
- 内存调试的东西D/dalvikvm( 809 ): GC_CONCURRENT freed
一般Java虚拟机要求支持verbosegc选项,输出详细的垃圾收集调试信息.dalvik虚拟机很安静的接受verbosegc选项,然后什么都不做.dalvik虚拟机使用自己的一套LOG机制来输出调试 ...
- Flex Array 与 ArrayCollection.转自网络
1.array作为控件使用 FLEX3写法: <mx:Array id="barname"> <mx:String>Flash</mx:String& ...
- Linux高级编程--05.文件读写
缓冲I/O和非缓冲I/O 文件读写主要牵涉到了如下五个操作:打开.关闭.读.写.定位.在Linux系统中,提供了两套API, 一套是C标准API:fopen.fclose.fread.fwrite.f ...
- transactional replication 的immediate_sync属性
在默认情况下,immediate_sync是关闭的,这个属性可以在创建publication时指定,也可以在创建完毕后修改. 如果immediate_sync为true, snapshot 文件和re ...
- redis实现有序的消息队列
redis是什么东西就不多说了,网上文章一搜一大堆. 首先来说一下我要实现的功能: 类似一个消息中转站吧,如果有人要发送消息,先将消息发到我这里来,然后我这边进行转发,为的就是有一个统一的管理和修改时 ...
- 你不一定知道的几个很有用的 Git 命令
这里给大家分享一些很有用的 Git 命令,其中很多用法你可能都不知道,无论你是工作在团队环境中或在您的个人项目中,这些命令将对你帮助很大,让你可以更加高效的进行项目开发,更轻松愉快的工作和生活. 您可 ...
- LeetCode——Find Median from Data Stream
Median is the middle value in an ordered integer list. If the size of the list is even, there is no ...
- 初涉SQL Server性能问题(4/4):列出最耗资源的会话
在上3篇文章里,我们讨论了列出反映服务器当前状态的不同查询. 初涉SQL Server性能问题(1/4):服务器概况 初涉SQL Server性能问题(2/4):列出等待资源的会话 初涉SQL Ser ...
- HT图形组件设计之道(三)
上篇我们通过定制了CPU和内存展示界面,体验了HT for Web通过定义矢量实现图形绘制与业务数据的代码解耦及绑定联动,这类案例后续文章还会继续以便大家掌握更多的矢量应用场景,本篇我们先切换个话题, ...