git 学习笔记6--remote & log 创建SSH Keys ssh-keygen -t rsa -C "1050244110@qq.com" 本地关联远程 git remote add origin git@server-name:path/repo-name.git git push -u origin master git push origin master 常用命令 git remote -v #显示remote的信息,见View1 git remote ad…
<Machine Learning>系列学习笔记 第一周 第一部分 Introduction The definition of machine learning (1)older, informal definition--Arthur Samuel--"the field of study that gives computers the ability to learn without being explicitly programmed." (2)modern d…
Storm学习笔记 - 消息容错机制 文章来自「随笔」 http://jsynk.cn/blog/articles/153.html 1. Storm消息容错机制概念 一个提供了可靠的处理机制的spout需要记录自己emit(发射)的tuple(消息元祖),当下游bolt处理tuple或者子tuple失败时spout能够重新发射. Storm通过调用Spout的nextTuple()发送一个tuple.为实现可靠的消息处理,首先要给每个发出的tuple带上唯一的ID,并且将ID作为参数传递给So…
Storm学习笔记 - Storm初识 1. Strom是什么? Storm是一个开源免费的分布式计算框架,可以实时处理大量的数据流. 2. Storm的特点 高性能,低延迟. 分布式:可解决数据量大,单机搞不定的场景. 可扩展:随着业务的发展,数据量越来越大,系统可以水平扩展. 容错:单个节点挂了,不影响整个应用. 3. Storm与其他框架的比较 3.1 Storm和Hadoop的比较 Storm用于实时计算,Hadoop用于离线计算. Storm处理的数据保存在内存中,源源不断.Hadoo…
<Machine Learning - 李宏毅> 学习笔记 b站视频地址:李宏毅2019国语 第一章 机器学习介绍 Hand crafted rules Machine learning ≈ looking for a function from data Speech recognition Image recognition Playing go Dialogue system Framework define a set of function goodness of function…
官方英文文档:http://storm.apache.org/documentation/Documentation.html 本文是学习笔记,转载整合加翻译,主要是为了便于学习. 一.基本概念 参考:http://storm.apache.org/documentation/Concepts.html 此段转自:http://xumingming.sinaapp.com/117/twitter-storm%E7%9A%84%E4%B8%80%E4%BA%9B%E5%85%B3%E9%94%AE…
Storm -- Distributed and fault-tolerant realtime computation 这是一个分布式的.容错的实时计算系统 把Storm依赖组件的版本贴出来供各位参考: java(1.7.0_45) python(2.6.6) zookeeper (zookeeper-3.4.5) zeromq(zeromq-2.1.7) jzmq(github trunk) storm(0.8.1) java和Python的安装过程不赘述了,说下其他组件的安装过程 安装zo…
Spark和Storm Spark基于MapReduce算法实现的分布式计算,不同于MapReduce的是,作业中间结果可以保存在内存中,而不要再读写HDFS, Spark适用于数据挖掘和机器学习等需要迭代的MapReduce算法 Spark Streaming是建立在Spark上的实时计算框架,可以结合流式.批处理和交互式进行查询和实时计算, 基本原理是将Stream数据分成小的时间片段,以类似batch批量处理的方式来处理这些小部分数据 Spark Streaming相比于基于Record的…
1. 简介 流式计算的历史 早在7.8年前诸如UC伯克利.斯坦福等大学就开始了对流式数据处理的研究,但是由于更多的关注于金融行业的业务场景或者互联网流量监控的业务场景,以及当时互联网数据场景的限制,造成了研究多是基于对传统数据库处理的流式化,对流式框架本身的研究偏少.目前这样的研究逐渐没有了声音,工业界更多的精力转向了实时数据库. 2010年Yahoo!对S4的开源,2011年twitter对Storm的开源,改变了这个情况.以前互联网的开发人员在做一个实时应用的时候,除了要关注应用逻辑计算处理…
目录 Storm 开箱 1. 什么是 Storm 2. Hello World(WordCountTopology) 3. 常用API 4. 基本概念 5. 流分组策略 6. 并行度 7. Acker机制 8. 参考资料 Storm 开箱 标签(空格分隔): 开箱即用 入门 Storm 1. 什么是 Storm Storm 是一个分布式的,可靠的,容错的数据流处理系统. Storm 应用是由 Spout (上图水龙头) 和 Bolt (上图水滴) 构建成的Topology在Storm环境中运行,…