ApacheCN 大数据译文集 20211206 更新
- PySpark 大数据分析实用指南
- Spark 大规模机器学习
- Spark SQL 学习手册
- 精通 Spark 2.x 机器学习
- 精通 Spark 数据科学
- PySpark 秘籍
- Scala 和 Spark 大数据分析
- 零、前言
- 一、Scala 简介
- 二、面向对象的 Scala
- 三、函数式编程概念
- 四、集合 API
- 五、应对大数据——Spark 来了
- 六、开始使用 Spark-REPL 和 RDD
- 七、RDD 特殊动作
- 八、小型结构简介——Spark SQL
- 九、传送我吧,史考提——Spark 流
- 十、一切都是连通的——GraphX
- 十一、学习机器学习——Spark MLlib 和 Spark ML
- 十二、高级机器学习最佳实践
- 十三、我叫贝叶斯,朴素的贝叶斯
- 十四、是时候整理一下了——使用 Spark MLlib 对你的数据聚类
- 十五、使用 SparkML 的文本分析
- 十六、Spark 调优
- 十七、该走向集群了——在集群上部署 Spark
- 十八、Spark 的测试和调试
- 十九、PySpark 和 SparkR
- 二十、使用 Alluxio 加速 Spark
- 二十一、ApacheZepplin 交互式数据分析
- Spark2 初学者手册
- Spark2 数据处理和实时分析
- 零、前言
- 一、ApacheSpark V2 的首次尝试和新进展
- 二、ApacheSpark 流
- 三、结构化流
- 四、Apache Spark MLlib
- 五、ApacheSparkML
- 六、Apache 系统
- 七、Apache Spark GraphX
- 八、Spark 调优
- 九、Spark 的测试和调试
- 十、基于 Scala 的 Spark 实用机器学习
- 十一、Spark 的机器学习三大数据火枪手——完美结合
- 十二、实现健壮机器学习系统的通用方法
- 十三、可以随 Spark 扩展的推荐引擎
- 十四、基于 Apache Spark 2.0 的无监督聚类
- 十五、使用 Spark 2.0 ML 库实现文本分析
- 十六、Spark 流和机器学习库
- Spark 2.x 机器学习秘籍
- Spark 深度学习秘籍
- 使用 Storm 构建 Python 实时应用
- Python 数据科学与机器学习实用手册
- 精通 Spark
- 精通 Storm
- Spark 机器学习
- 大数据分析实战
- Spark 秘籍
- 面向 Python 开发者的 Spark
- Storm 蓝图
- Flink 学习手册
- Kafka 学习手册中文第二版
- Storm 和 Cassandra 实时分析
- Spark 数据科学
下载
Docker
docker pull apachecn0/apachecn-bigdata-zh
docker run -tid -p <port>:80 apachecn0/apachecn-bigdata-zh
# 访问 http://localhost:{port}
PYPI
pip install apachecn-bigdata-zh
apachecn-bigdata-zh <port>
# 访问 http://localhost:{port}
NPM
npm install -g apachecn-bigdata-zh
apachecn-bigdata-zh <port>
# 访问 http://localhost:{port}
贡献指南
本项目需要校对,欢迎大家提交 Pull Request。
请您勇敢地去翻译和改进翻译。虽然我们追求卓越,但我们并不要求您做到十全十美,因此请不要担心因为翻译上犯错——在大部分情况下,我们的服务器已经记录所有的翻译,因此您不必担心会因为您的失误遭到无法挽回的破坏。(改编自维基百科)
组织介绍
赞助我们
通过平台自带的打赏功能,或点击这里。
ApacheCN 大数据译文集 20211206 更新的更多相关文章
- ApacheCN 深度学习译文集 20210112 更新
新增了六个教程: TensorFlow 2 和 Keras 高级深度学习 零.前言 一.使用 Keras 入门高级深度学习 二.深度神经网络 三.自编码器 四.生成对抗网络(GAN) 五.改进的 GA ...
- ApacheCN 深度学习译文集 20201218 更新
新增了四个教程: Python 人工智能中文版 0 前言 1 人工智能简介 2 人工智能的基本用例 3 机器学习管道 4 特征选择和特征工程 5 使用监督学习的分类和回归 6 集成学习的预测分析 7 ...
- ApacheCN Asp.NET 译文集 20211126 更新
ASP.NET Core2 基础知识 零.前言 一.搭建舞台 二.控制器 三.视图 四.模型 五.验证 六.路由 七.RestBuy 八.添加功能.测试和部署 ASP.NET Core3 和 Angu ...
- ApacheCN C/C++ 译文集 20211201 更新
笨办法学C 中文版 前言 导言:C的笛卡尔之梦 练习0:准备 练习1:启用编译器 练习2:用Make来代替Python 练习3:格式化输出 练习4:Valgrind 介绍 练习5:一个C程序的结构 练 ...
- ApacheCN Kali Linux 译文集 20211020 更新
Kali Linux 秘籍 中文版 第一章 安装和启动Kali 第二章 定制 Kali Linux 第三章 高级测试环境 第四章 信息收集 第五章 漏洞评估 第六章 漏洞利用 第七章 权限提升 第八章 ...
- ApacheCN 深度学习译文集 20210125 更新
新增了七个教程: PyTorch 中文官方教程 1.7 学习 PyTorch PyTorch 深度学习:60 分钟的突击 张量 torch.autograd的简要介绍 神经网络 训练分类器 通过示例学 ...
- ApacheCN 深度学习译文集 20201229 更新
新增了七个教程: TensorFlow 和 Keras 应用开发入门 零.前言 一.神经网络和深度学习简介 二.模型架构 三.模型评估和优化 四.产品化 TensorFlow 图像深度学习实用指南 零 ...
- ApacheCN 数据科学译文集 20211109 更新ApacheCN 数据科学译文集 20211109 更新
计算与推断思维 一.数据科学 二.因果和实验 三.Python 编程 四.数据类型 五.表格 六.可视化 七.函数和表格 八.随机性 九.经验分布 十.假设检验 十一.估计 十二.为什么均值重要 十三 ...
- ApacheCN 大数据译文集(二) 20211206 更新
Hadoop3 大数据分析 零.前言 一.Hadoop 简介 二.大数据分析概述 三.MapReduce 大数据处理 四.基于 Python 和 Hadoop 的科学计算和大数据分析 五.基于 R 和 ...
随机推荐
- 1033 - Generating Palindromes
1033 - Generating Palindromes PDF (English) Statistics Forum Time Limit: 2 second(s) Memory Limit ...
- Java用sort实现对数组的降序排序
在调用Arrays.sort()对数组进行排序时,默认是升序排序的,如果想让数组降序排序,有下面两种方法: 利用Collections的reverseOrder import java.util.*; ...
- Azure Data Lake(一) 在NET Core 控制台中操作 Data Lake Storage
一,引言 Azure Data Lake Storage Gen2 是一组专用于大数据分析的功能,基于 Azure Blob Storage 构建的.Data Lake Storage Gen2 包含 ...
- node.js安装及环境配置超详细教程【Windows系统安装包方式】
文章目录 Step1:下载安装包 Step2:安装程序 Step3:查看 Step4:环境配置 最后补充: Step1:下载安装包 https://nodejs.org/zh-cn/download/ ...
- Kafka基础教程(四):.net core集成使用Kafka消息队列
.net core使用Kafka可以像上一篇介绍的封装那样使用(Kafka基础教程(三):C#使用Kafka消息队列),但是我还是觉得再做一层封装比较好,同时还能使用它做一个日志收集的功能. 因为代码 ...
- mysql编译报错
1.make报错现象 Warning: Bison executable not found in PATH 解决办法 yum -y install bison 2.make报错现象 ake Erro ...
- Typescript 字符串字面量类型
字符串字面类型定义的类型是固定的,在其使用时必须是其定义的其中一个字符串,否则会报错 当传入一个定义之外的字符串时,会报错字符串字面量类型.ts(13,20): error TS2345: Argum ...
- Python_上下文管理器
上下文管理器(context manager)是 Python 编程中的重要概念,用于规定某个对象的使用范围.一旦进入或者离开该使用范围,会有特殊操作被调用 (比如为对象分配或者释放内存).它的语法形 ...
- PowerShell 【按任意键继续】
1 function Pause(){ 2 [System.Console]::Write('按任意键继续...') 3 [void][System.Console]::ReadKey(1) 4 } ...
- Redis之持久化方式详解
背景:Redis之所以能够在技术革新发展迅速的时代超越Memcache等其他Nosql数据库,最主要的一点是Redis提供数据持久化,能够根据持久化策略将缓存数据灵活的写到磁盘上,更好地满足了当下海量 ...