最近在学习spark的相关知识, 重点在看spark streaming 和spark mllib相关的内容. 关于spark的配置: http://www.powerxing.com/spark-quick-start-guide/ 这篇博客写的很全面:http://www.liuhaihua.cn/archives/134765.html spark streaming: 是spark系统中处理流数据的分布式流处理框架,能够以最低500ms的时间间隔对流数据进行处理,延迟大概1s左右, 是一…