SRE 經典好文
文章推薦指數: 80 %
SRE 定義, 觀念¶ · [好文翻譯] 你在找的是SRE 還是DevOps? · 2018/08/03: 推薦:Site Reliability Engineering (SRE, 網站可靠性工程) · 2018/08/16: Google:你的SRE实践 ...
跳轉到
讀書會
R1:SiteReliabilityEngineering
R2:ContinuousDelivery
R3:深入剖析K8s
R4:Linux效能優化實戰
SRE/DevOpsTaiwan讀書會
GitHub
讀書會
讀書會
緣由
導讀摘要
ChangeLog
記事
R1:SiteReliabilityEngineering
R1:SiteReliabilityEngineering
緒論、第一章
第二、三、四章
第五、六、七章
第八~十一章
第十二~十五章
第十六~十八章
第十九~廿一章
第廿二章
第廿三、廿四章
第廿五章
第廿六、廿八章
第廿七章
第卅、卅一章
第卅二~卅四章
SRE經典好文
SRE經典好文
目錄
SRE定義,觀念
SRE實踐
事件管理
持續交付
監控、量測
ChaosEngineering
Misc
事件處理案例
相關活動分享
R2:ContinuousDelivery
R2:ContinuousDelivery
活動摘要
第一章軟體交付的問題
第二章設置管理
第三章持續整合
第四章測試策略的實現
第五章部署流水線
第六章建置與佈署腳本化
第七章提交階段
第八章驗收測試階段
第九章非功能需求測試
第十章應用程式的部署與發佈
第十一章管理基礎設施與環境
第十二章資料管理
第十三章元件相依性管理
第十四章版本控制進階
第十五章持續交付管理
R3:深入剖析K8s
R3:深入剖析K8s
春酒與選書
讀書會行程
讀書會QA
第十八章
第十九章
R4:Linux效能優化實戰
R4:Linux效能優化實戰
活動摘要
選書
#01CH01-04
#02CH05-06
#03CH07-10
#04CH11-13
#05CH14-16
#06CH17-20
#07CH21-23
#08CH24-26
#09CH27-29
#10CH30-32
#11CH33-35
#12CH36-38
#13CH39,40,45
#14CH41-44
#15CH46-48
#16CH49-51
#17CH52-56
#18CH57-58
目錄
SRE定義,觀念
SRE實踐
事件管理
持續交付
監控、量測
ChaosEngineering
Misc
SRE經典好文
SRE定義,觀念¶
[好文翻譯]你在找的是SRE還是DevOps?byNeilWei
2018/08/03:推薦:SiteReliabilityEngineering(SRE,網站可靠性工程)
2018/08/16:Google:你的SRE实践可能是错的[簡中]
2018/08/13:从腾讯云故障聊聊SLA[簡中]
2018/07/29:DevOpsEngineer、SRE徵才求職雜談
2018/07/19:SREfundamentals:SLIs,SLAsandSLOs[Google]
SREvs.DevOps:competingstandardsorclosefriends?by[Google],摘要byRick
WhatItMeanstoBeaSiteReliabilityEngineerAccordingtoaSurveyfromCatchpoint-簡譯byRick
What'stheDifferenceBetweenDevOpsandSRE?(classSREimplementsDevOps)by[Google]
2018/03/25:谷歌系統維運技巧大公開
2017/07/26:美团点评的SRE发展与实践[簡中],社群討論
2016/03/28:INFRASTRUCTURE&OPERATIONS-HowGoogleDoesPlanet-ScaleEngineeringforPlanet-ScaleInfrabyGoogle,社群討論
SRE實踐¶
ProductionReadinessChecklist
2018/04/19:孙宇聪:来自Google的DevOps理念及实践
SRE中文版譯者的經驗分享,譯者本身也曾是GoogleSRE成員。
社群連結
2018/08/01:RepairingnetworkhardwareatscalewithSREprinciples
2018/02/17:17直播SRE團隊的關鍵武器,靠容器標準化IT架構搶速度
Howreleasecanariescansaveyourbacon-CRElifelessons
2017/11/08:京東雙11百億海量交易的維運關鍵大公開
2017/11/03:大规模Elasticsearch集群管理心得
事件管理¶
2018/07/07:為什麼受困洞穴的泰國少年救不出來?這篇文章告訴你實際救災有多麼困難
OnCallRotations:HowBesttoWakeDevsUpintheMiddleoftheNight
持續交付¶
2015/03/25:持续交付:当前普遍存在的三个问题与解决方案[簡中]
原始討論
監控、量測¶
AnIntroductiontoMetrics,Monitoring,andAlerting
2017/11/10:HowtoMonitortheSREGoldenSignals
ChaosEngineering¶
AWSre:Invent2018:BuildingSREfromScratchatCoinbaseduringHypergrowth(DEV315-S)
2018/11/27:AWSre:Invent2018 — ChaosEngineeringforModernApplicationsonAWSby小城
混沌工程实践经验:如何让系统在生产环境中稳定可靠
不是由你来选择那一刻,而是那一刻来选择你!你只能选择为之做好准备。
ChaosEngineering(混沌工程)
AnEvolutionofChaosExperimentation:KoltonAndrusatChaosConf2018
2018/09/14:ChaosConfQ&A:TheBenefits,ChallengesandPracticesofChaosEngineering
2018/08/22:混沌工程实践经验:如何让系统在生产环境中稳定可靠[簡中]
不是你選擇那一刻,是那一刻選擇你,而你唯一能選擇的就是作好準備。
混屯工程不是製造問題,是揭露問題
2018/06/26:LinkedIn公開混亂工程經驗,並開源部分異常注入框架LinkedOut
2018/06/16:增长教科书Netflix:进取到让自己毛骨悚然[簡中]
2018/02/06:IntrotoChaosEngineering
ChaosEngineering:WhyBreakingThingsShouldBePractised.
Misc¶
漫畫:我長大想做SRE
延伸文章資訊
- 1臺灣大型企業如何上手SRE,Google建議先做這4件事 - iThome
去年開始,不只金控、零售通路,連製造業都有企業要招募SRE,這個國外盛行 ... 企業可從定義SLO開始,串聯SRE、營運、開發和IT維運單位一起討論,全體 ...
- 2SRE_百度百科
SRE是指Site Reliability Engineer (網站可靠性工程師)。他是軟件工程師和系統管理員的結合,一個SRE工程師基本上需要掌握很多知識:算法,數據結構,編程能力, ...
- 3SRE 經典好文
SRE 定義, 觀念¶ · [好文翻譯] 你在找的是SRE 還是DevOps? · 2018/08/03: 推薦:Site Reliability Engineering (SRE, 網站可靠性...
- 4現場可靠性工程- 維基百科 - Wikipedia
站點可靠性工程(英語:Site reliability engineering,SRE)是一門將軟體工程應用於基礎設施以及運營的學科,該概念由Google於2003年提出。站點可靠性工程主要目標...
- 5什么是SRE(站点可靠性工程)? - Red Hat