admin 发表于 2021-1-4 23:45:59

SRE实战手册 完结



从0到1带你搞定系统稳定性

课程介绍:
SRE(Site Reliability Engineering),网站稳定性工程,最早是由Google设置的一类工程师岗位,专职负责其超大规模分布式产品(如搜索、Gmail、Docs等)的稳定性。而后,SRE慢慢发展成了一系列面向稳定性的,包括技术、管理、流程、组织架构,以及文化建设的最佳实践,并最终被提炼成一套方法论,广泛流传。

在国内,SRE的这套方法论,也被很多企业的IT团队作为技术能力提升和组织转型,特别是运维转型的参考标准。但是,在实际落地这套方法论时,大家有很多疑惑,比如:

SRE如果不是运维的升级版,那它到底是什么?
SRE涉及范围如此之大,到底应该从哪里入手建设呢?
在稳定性方面,有些公司已经做了很多工作,特别是在技术体系搭建上,为什么还是故障频发?难道单纯的技术保障还不够吗?
引入了SRE,团队的能力应该怎么提升?组织架构应该怎么匹配呢?
因此,我们邀请赵成老师开设了《SRE实战手册》这个课程。他将结合自己的实践经验,从基础理论和实践操作两方面入手,一次性解决你心中的困惑,帮助你正确认识SRE,掌握可落地的实践方法。

这个课程分为基础篇和实践篇两大模块。

课程目录:
开篇词 (1讲)
开篇词|SRE是解决系统稳定性问题的灵丹妙药吗?

基础篇 (5讲)
01|SRE迷思:无所不能的角色?还是运维的升级?
02|系统可用性:没有故障,系统就一定是稳定的吗?
03|SRE切入点:选择SLI,设定SLO
04|错误预算:达成稳定性目标的共识机制
05|案例:落地SLO时还需要考虑哪些因素?

实践篇 (5讲)
06|故障发现:如何建设On-Call机制?
07|故障处理:一切以恢复业务为最高优先级
08|故障复盘:黄金三问与判定三原则
09|案例:互联网典型的SRE组织架构是怎样的?
10|经验:都有哪些高效的SRE组织协作机制?

结束语 (2讲)
结束语|聊聊我的SRE落地心路历程
答疑|没什么能阻挡你拓展边界的渴望
**** Hidden Message *****


insidejvm 发表于 2021-1-20 12:35:01

正需要,支持楼主大人了!

Neko1029Cat 发表于 2021-1-28 17:16:25

学习一下sre

Max2020 发表于 2021-3-8 10:37:18

学习一下sre

vorka 发表于 2021-5-13 11:16:02

学习一下sre

taipingyang2021 发表于 2021-5-22 08:27:09

SRE实战手册 完结

busixianyu 发表于 2021-6-7 09:06:35

正需要,支持楼主大人了!

haoge8696970 发表于 2021-6-11 23:20:55

111111111111111111111

付逸风 发表于 2021-11-15 18:23:49

看一下怎么样.

infiraul 发表于 2021-12-19 20:20:30


正需要,支持楼主大人了!
页: [1] 2 3
查看完整版本: SRE实战手册 完结