ApacheCN 大数据译文集 20211206 更新
- PySpark 大数据分析实用指南
- Spark 大规模机器学习
- Spark SQL 学习手册
- 精通 Spark 2.x 机器学习
- 精通 Spark 数据科学
- PySpark 秘籍
- Scala 和 Spark 大数据分析
- 零、前言
- 一、Scala 简介
- 二、面向对象的 Scala
- 三、函数式编程概念
- 四、集合 API
- 五、应对大数据——Spark 来了
- 六、开始使用 Spark-REPL 和 RDD
- 七、RDD 特殊动作
- 八、小型结构简介——Spark SQL
- 九、传送我吧,史考提——Spark 流
- 十、一切都是连通的——GraphX
- 十一、学习机器学习——Spark MLlib 和 Spark ML
- 十二、高级机器学习最佳实践
- 十三、我叫贝叶斯,朴素的贝叶斯
- 十四、是时候整理一下了——使用 Spark MLlib 对你的数据聚类
- 十五、使用 SparkML 的文本分析
- 十六、Spark 调优
- 十七、该走向集群了——在集群上部署 Spark
- 十八、Spark 的测试和调试
- 十九、PySpark 和 SparkR
- 二十、使用 Alluxio 加速 Spark
- 二十一、ApacheZepplin 交互式数据分析
- Spark2 初学者手册
- Spark2 数据处理和实时分析
- 零、前言
- 一、ApacheSpark V2 的首次尝试和新进展
- 二、ApacheSpark 流
- 三、结构化流
- 四、Apache Spark MLlib
- 五、ApacheSparkML
- 六、Apache 系统
- 七、Apache Spark GraphX
- 八、Spark 调优
- 九、Spark 的测试和调试
- 十、基于 Scala 的 Spark 实用机器学习
- 十一、Spark 的机器学习三大数据火枪手——完美结合
- 十二、实现健壮机器学习系统的通用方法
- 十三、可以随 Spark 扩展的推荐引擎
- 十四、基于 Apache Spark 2.0 的无监督聚类
- 十五、使用 Spark 2.0 ML 库实现文本分析
- 十六、Spark 流和机器学习库
- Spark 2.x 机器学习秘籍
- Spark 深度学习秘籍
- 使用 Storm 构建 Python 实时应用
- Python 数据科学与机器学习实用手册
- 精通 Spark
- 精通 Storm
- Spark 机器学习
- 大数据分析实战
- Spark 秘籍
- 面向 Python 开发者的 Spark
- Storm 蓝图
- Flink 学习手册
- Kafka 学习手册中文第二版
- Storm 和 Cassandra 实时分析
- Spark 数据科学
下载
Docker
docker pull apachecn0/apachecn-bigdata-zh
docker run -tid -p <port>:80 apachecn0/apachecn-bigdata-zh
# 访问 http://localhost:{port}
PYPI
pip install apachecn-bigdata-zh
apachecn-bigdata-zh <port>
# 访问 http://localhost:{port}
NPM
npm install -g apachecn-bigdata-zh
apachecn-bigdata-zh <port>
# 访问 http://localhost:{port}
贡献指南
本项目需要校对,欢迎大家提交 Pull Request。
请您勇敢地去翻译和改进翻译。虽然我们追求卓越,但我们并不要求您做到十全十美,因此请不要担心因为翻译上犯错——在大部分情况下,我们的服务器已经记录所有的翻译,因此您不必担心会因为您的失误遭到无法挽回的破坏。(改编自维基百科)
组织介绍
赞助我们
通过平台自带的打赏功能,或点击这里。
ApacheCN 大数据译文集 20211206 更新的更多相关文章
- ApacheCN 深度学习译文集 20210112 更新
新增了六个教程: TensorFlow 2 和 Keras 高级深度学习 零.前言 一.使用 Keras 入门高级深度学习 二.深度神经网络 三.自编码器 四.生成对抗网络(GAN) 五.改进的 GA ...
- ApacheCN 深度学习译文集 20201218 更新
新增了四个教程: Python 人工智能中文版 0 前言 1 人工智能简介 2 人工智能的基本用例 3 机器学习管道 4 特征选择和特征工程 5 使用监督学习的分类和回归 6 集成学习的预测分析 7 ...
- ApacheCN Asp.NET 译文集 20211126 更新
ASP.NET Core2 基础知识 零.前言 一.搭建舞台 二.控制器 三.视图 四.模型 五.验证 六.路由 七.RestBuy 八.添加功能.测试和部署 ASP.NET Core3 和 Angu ...
- ApacheCN C/C++ 译文集 20211201 更新
笨办法学C 中文版 前言 导言:C的笛卡尔之梦 练习0:准备 练习1:启用编译器 练习2:用Make来代替Python 练习3:格式化输出 练习4:Valgrind 介绍 练习5:一个C程序的结构 练 ...
- ApacheCN Kali Linux 译文集 20211020 更新
Kali Linux 秘籍 中文版 第一章 安装和启动Kali 第二章 定制 Kali Linux 第三章 高级测试环境 第四章 信息收集 第五章 漏洞评估 第六章 漏洞利用 第七章 权限提升 第八章 ...
- ApacheCN 深度学习译文集 20210125 更新
新增了七个教程: PyTorch 中文官方教程 1.7 学习 PyTorch PyTorch 深度学习:60 分钟的突击 张量 torch.autograd的简要介绍 神经网络 训练分类器 通过示例学 ...
- ApacheCN 深度学习译文集 20201229 更新
新增了七个教程: TensorFlow 和 Keras 应用开发入门 零.前言 一.神经网络和深度学习简介 二.模型架构 三.模型评估和优化 四.产品化 TensorFlow 图像深度学习实用指南 零 ...
- ApacheCN 数据科学译文集 20211109 更新ApacheCN 数据科学译文集 20211109 更新
计算与推断思维 一.数据科学 二.因果和实验 三.Python 编程 四.数据类型 五.表格 六.可视化 七.函数和表格 八.随机性 九.经验分布 十.假设检验 十一.估计 十二.为什么均值重要 十三 ...
- ApacheCN 大数据译文集(二) 20211206 更新
Hadoop3 大数据分析 零.前言 一.Hadoop 简介 二.大数据分析概述 三.MapReduce 大数据处理 四.基于 Python 和 Hadoop 的科学计算和大数据分析 五.基于 R 和 ...
随机推荐
- Soldier and Traveling
B. Soldier and Traveling Time Limit: 1000ms Memory Limit: 262144KB 64-bit integer IO format: %I64d ...
- 1018 - Brush (IV)
1018 - Brush (IV) PDF (English) Statistics Forum Time Limit: 2 second(s) Memory Limit: 32 MB Muba ...
- 中文字体css编码转换
各大网站的字体选择 网站 字体 腾讯 font: 12px "宋体","Arial Narrow",HELVETICA; 淘宝 font: 12px/1.5 t ...
- .net core集成使用consul
快速启动一个consul集群可以参考:使用docker快速部署一个consul集群 .net core集成使用consul是通过consul提供出来api接口来实现的,可以分成两个部分来说明:配置集成 ...
- java运算符1
一:算术运算符(+, -, *, /, ++, --, ) 1.+号 :可以做加法运算(加号两边为字符和数字).正数表示 字符串连接符:只要+号两边其中有一边有字符串,输出时加号就充当连接 ...
- sqlserver - 判断字段是否是纯数字
PATINDEX('%[^0-9|.|-|+]%',w.waterMeterNo)=0 如 SELECT w.* FROM [dbo].[waterMeterInfo] w where isnull( ...
- react中异步组件以及withRouter的使用
什么是异步组件?简单来说就是异步加载一个组件,正常情况浏览器加载的是我们打包好的bundle.js文件,那么这个文件是集合了所有js是代码,然而我们首屏加载并不需要一次性加载所有的组件,这会造成性能的 ...
- 第10组 Alpha冲刺 (1/6)
1.1基本情况 ·队名:今晚不睡觉 ·组长博客:https://www.cnblogs.com/cpandbb/ ·作业博客:https://edu.cnblogs.com/campus/fzu/FZ ...
- 微软开源Kubernetes服务网格项目Open Service Mesh
尽管微服务环境提供可移植性,允许更快更频繁的部署周期,甚至还能让组织创建关注于特定领域的团队,但这也伴随着对于流量管理.安全以及可观测性等需求的增长.在整个生态系统中,针对这些需求的服务网格模式的实现 ...
- 基本的sql语法
1. SELECT: 用于从数据库中选取数据 SELECT name,value FROM table_name 2.SELECT DISTINCT 语句用于返回唯一不同的值(去重) 3.WHERE ...