互联网巨头们的 SRE 运维实践「GitHub 热点速览 v.21.27」

作者:HelloGitHub-小鱼干
本周大热点无疑是前几天 GitHub 发布的 Copilot,帮你补全代码,给你的注释提出建议,预测你即将使用的代码组件…如此神奇的 AI 技术,恰巧本周微软也开源了他们的机器学习入门课程,你在 12 周之内完成 24 堂课程即可入门机器学习。除此之外,本周的特点主题之一 DevOps 和 SRE,包括 Google、百度在内的多家科技公司在本周特推给出了他们的最佳实践。
以下内容摘录自微博@HelloGitHub 的 GitHub Trending 及 Hacker News 热帖(简称 HN 热帖),选项标准:新发布 | 实用 | 有趣,根据项目 release 时间分类,发布时间不超过 14 day 的项目会标注 New,无该标志则说明项目 release 超过半月。由于本文篇幅有限,还有部分项目未能在本文展示,望周知
- 本文目录
- 本周特推
- 1.1 监控工具:signoz
- 1.2 SRE 指南:howtheysre
- GitHub Trending 周榜
- 2.1 devops 练习:devops-exercises
- 2.2 高效并行策略:mesh-transformer-jax
- 2.3 安全私有网络:wiretrustee
- 2.4 微软机器学习课:ML-For-Beginners
- 2.5 树莓派路由器:internet-pi
- 往期回顾
1. 本周特推
1.1 监控工具:signoz
本周 star 增长数:1,350+
SigNoz 可帮助开发人员监控应用以及排除故障问题,是 DataDog、NewRelic 等产品的开源替代品。特性:
- 支持应用 metric 指标,例如:P50、P90、P99 延迟和错误率;
- 应用中最慢的端点;
- 精准的请求跟踪;
- 根据服务名称、延迟、错误、注释进行筛选;
- 统一指标和跟踪,你无需在 Prometheus 和 Jaeger 间切换来定位问题。
GitHub 地址→https://github.com/SigNoz/signoz

1.2 SRE 指南:howtheysre
本周 star 增长数:1,600+
howtheysre 记录了国内外各地的技术团队、组织是如何实践站点可靠性工程(SRE,全称 Site Reliability Engineering),这些团队包括 Atlassian、百度、Google、Netflix 在内的 50+ 公司。
GitHub 地址→https://github.com/upgundecha/howtheysre

2. GitHub Trending 周榜
2.1 devops 练习:devops-exercises
本周 star 增长数:1,800+
Devops-exercises 收录了大量运维、SRE 人员需要掌握的知识,包括 Linux、Jenkins、AWS、Prometheus、Docker、Python、K8s 在内的 20 多个技术领域的练习。

2.2 高效并行策略:mesh-transformer-jax
本周 star 增长数:800+
Mesh Transformer JAX 一个利用 Jax 的 xmap 运算符实现并行机制的 haiku 库。这个库的设计目的是在 TPUv3s 上最多可伸缩到大约 20B 参数,超越了其他的并行策略,如 GPT-NeoX 或 DeepSpeed。
GitHub 地址→https://github.com/kingoflolz/mesh-transformer-jax

2.3 安全私有网络:wiretrustee
本周 star 增长数:700+
Wiretrustee 可将设备连接到一个单独的私人网络,可在 ARM 设备,例如 树莓派上运行。

2.4 微软机器学习课:ML-For-Beginners
本周 star 增长数:2,100+
ML-For-Beginners 是微软开源的机器学习课程,你可在 12 周上完他们安排的 24 节机器学习相关课程。

2.5 树莓派路由器:internet-pi
本周 star 增长数:300+
New internet-pi 是一个用树莓派配置网络环境的工具,它将 DNS、广告屏蔽、监控等配置到了一个 Ansible 项目中。

3. 往期回顾
以上为 2021 年第 26 个工作周的 GitHub Trending 如果你 Pick 其他好玩、实用的 GitHub 项目,记得来 HelloGitHub issue 区和我们分享下哟
HelloGitHub 交流群现已全面开放,添加微信号:HelloGitHub001 为好友入群,可同前端、Java、Go 等各界大佬谈笑风生、切磋技术~
关注 HelloGitHub 公众号 第一时间收到更新。
还有更多开源项目的介绍和宝藏项目等待你的发现。
互联网巨头们的 SRE 运维实践「GitHub 热点速览 v.21.27」的更多相关文章
- GitHub 热点速览 Vol.23:前后端最佳实践
作者:HelloGitHub-小鱼干 摘要:最佳实践,又名 best-practices,是 GitHub 常见的项目名,也是本周 Trending 关键词.25 年 Python 开发经验的 Dav ...
- vivo大规模 Kubernetes 集群自动化运维实践
作者:vivo 互联网服务器团队-Zhang Rong 一.背景 随着vivo业务迁移到K8s的增长,我们需要将K8s部署到多个数据中心.如何高效.可靠的在数据中心管理多个大规模的K8s集群是我们面临 ...
- HBase运维实践-聊聊RIT的那点事
相信长时间运维HBase集群的童鞋肯定都会对RIT(Region-In-Transition,很多参考资料误解为Region-In-Transaction,需要注意)有一种咬牙切齿的痛恨感,一旦Reg ...
- 关于Prometheus运维实践项目
关于Promethues运维实践项目 1. 什么是Prometheus运维实践项目 是什么 Prometheus,普罗米修斯,是古希腊神话中为人间带来火种的神. Prometheus运维实 ...
- elasticsearch基本概念理解+elasticsearch 的shards unassigned处理方法 -- 最佳运维实践 - 集群规划
1.es与MySQL的概念对比 2.概念理解 2.1 Index : 一个索引即是文档的集合 2.2 Document : 一个文档即是一个可被索引的基础单元信息,一条记录: 2.3 Replicas ...
- 华为刘腾:华为终端云Cassandra运维实践分享
点击此处观看完整活动视频 各位线上的嘉宾朋友大家好,我是来自华为消费者BG云服务部的刘腾,我今天给大家分享的主题是华为终端云Cassandra运维实践.和前面王峰老师提到的Cassandra在360中 ...
- 谷歌SRE运维模式解读
谷歌SRE运维模式解读 前面我和你分享了一些关于运维组织架构和协作模式转型的内容,为了便于我们更加全面地了解先进的运维模式,今天我们再来谈一下谷歌的SRE(Site Reliability Engin ...
- 阿里智能运维实践|阿里巴巴DevOps实践指南
编者按:本文源自阿里云云效团队出品的<阿里巴巴DevOps实践指南>,扫描上方二维码或前往:https://developer.aliyun.com/topic/devops,下载完整版电 ...
- 基于.net的微服务架构的开发测试环境运维实践
眼下,做互联网应用,最火的架构是微服务,最热的研发管理就是DevOps, 没有之一.微服务.DevOps已经被大量应用,它们已经像传说中的那样,可以无所不能.特来电云平台,通过近两年多的实践,发现完全 ...
随机推荐
- ES6中的展开运算符和解构对象
let obj = { a:1 b:2 } let obj2 = { ...obj c:3 d:4 } console.log(obj2)//1,2,3,4,对象展开 //常考题目 let a = 1 ...
- [c++] 文件包含
当一个类用到另一个类时,有两种包含方式,在.h中包含和在.cpp中包含 用到公共类库时,在.h文件中包含(公共类库可视为不变的) 用到项目开发过程中自己或同事写的类时,在.cpp文件中包含(可能根据需 ...
- [Linux] Linux C编程一站式学习 Part.1
C语言入门 程序基本概念 程序和编程语言 C语言--(编译器)--汇编语言--(汇编器)--机器语言(目标代码 / 可执行代码) 可移植 / 平台无关:平台指计算机体系结构或操作系统,或二者的组合.不 ...
- Gtkperf介绍
Gtkperf使用说明一.Gtkperf介绍GtkPerf是一种应用程序设计,测试基于GTK +的性能.问题的关键是建立共同的测试平台,运行预先基于GTK +工具(开放comboboxes ,切换按钮 ...
- Linux_日志管理理论概述
一.日志系统 1.kernel -->物理终端(/dev/console) --> /var/log/dmesg(系统启动时信息(包括错误信息)记录到该文件) 或者:# dmesg 或 # ...
- Mysql不知道默认密码情况下登录/重置/忘记密码
场景一: 基础系统:linux 镜像:LAMP环境(Ubuntu 18.04 Apache PHP7.0) 问题:ERROR 1405 (28000): Access denied for user ...
- Linux进阶之排错
Permission denied 检查selinux长时间没有响应 防火墙 nginx和httpd可以自检nginx和httpd有日志 /var/log/nginx/ /var/log/httpd/ ...
- STM32串口编程易错点
注意 串口发送函数 使用STM官方的LIB 中的库函数发送之后 加一点延时 否则会错误 接收数据不正常 正确做法是 加上等待发送完成
- linux 解压总结
tar解压 gz解压 bz2等各种解压文件使用方法 .tar 解包:tar xvf FileName.tar 打包:tar cvf FileName.tar DirName (注:tar是打包,不是压 ...
- python的数组