会员
SRE原理与实践:构建高可靠性互联网应用
张观石计算机网络/软件工程及软件方法学· 20.4万字
更新时间:2023-02-23 16:25:44
最新章节:封底开会员,本书免费读 >
这是一本从架构、开发、测试、运维全流程讲解如何进行软件可靠性工程建设的著作,它将帮助读者构建针对软件可靠性工程的完整的知识体系、工程体系和理论体系。本书作者是虎牙科技的SRE架构师,他基于20余年的架构、研发和运维经验,用4年时间反复打磨,代表中国的工程师总结了中国互联网企业的SRE方法和经验。本书得到了中国SRE奠基人、虎牙科技CEO以及华为、腾讯、阿里、B站、亚马逊等企业的10余位技术专家高度评价并一致推荐。本书参考传统可靠性工程及软件可靠性工程体系,把传统可靠性工程中的“六性”(可靠性、维修性、测试性、保障性、安全性、环境适应性)转化为互联网软件可靠性工程的6种能力(可靠性设计能力、观测能力、修复能力、保障能力、反脆弱能力、管理能力)。每一项能力都包括:互联网SRE体系中的概念、能力的设计、能力建设的原则与方法、能力的度量与改进,以及相应的实践案例。通过这6种能力把可靠性相关的工作组织起来,6种能力对应6个工作方向,不仅清晰地描绘出互联网软件可靠性工程体系的全貌,而且详细阐述了每一种能力的获得方法。本书基于传统可靠性和软件可靠性的研究成果,借鉴和应用它们的成熟理论和工程方法,结合互联网软件的实际情况并加以融合和改进,提出了一套符合互联网时代的软件可靠性工程方法。此外,本书还介绍了可靠性管理能力,对互联网软件开发团队、运维团队的技术领导者以及希望转型为可靠性工程师的传统运维人员、开发人员应该都有一定参考价值。
品牌:机械工业出版社
上架时间:2022-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
SRE原理与实践:构建高可靠性互联网应用最新章节
查看全部张观石
主页
同类热门书
最新上架
- 会员
DevOps:企业级CI/CD实战
本书主要围绕DevOps的核心CI/CD,详细讲解了企业级CI/CD的相关技术内容。全书共11章,首先讲解了持续集成系统Jenkins入门知识、Jenkins运维管理、Jenkins流水线的语法与进阶。接着讲解了持续集成阶段的工具平台实践、GitLab版本控制系统实践、Maven等构建工具实践、SonarQube代码质量平台实践、NexusRepository3制品库平台实践。持续部署分别基于云主计算机4.4万字 - 会员
TensorFlow+Android经典模型从理论到实战(微课视频版)
这是一本以项目为引领、以经典模型为主线的面向产业链的实战化教科书。全书分为九章,包含九个实战项目。以基于Android手机的智能化应用场景为项目目标,采用迭代模式,从基于TensorFlow的智能建模开始,到基于Android的应用开发结束。模型从训练到部署,设计周期长,技术要点多,复杂度高,工作量大,考验设计者的恒心与毅力。场景无限好,模型来相撑。场景包括一百余种花朵识别、三百余种鸟类识别、美食计算机10.7万字 - 会员
云数据湖:构建健壮的云数据架构
本书详细介绍了可用于数据处理的表格格式、云产品、框架、存储层,以及如何将这些内容组合在一起,以获得适合自己需求的高性能解决方案。作者在书中提供的决策框架将帮助你明智地决定选择哪种数据湖。本书是大数据领域每个人的必读书。阅读本书后,你将了解构建云数据湖所需的所有基础知识,并能够以多种方式应用这些知识。本书主要面向数据架构师、数据开发人员和数据运维专业人员,他们希望广泛地了解设置和运营云数据湖的各个方计算机10.7万字 - 会员
OpenAI API接口应用实战
OpenAIAPI是一个为开发者、企业和研究者打造的平台。通过这个API,用户可以轻松地融合和应用最前沿的AI技术,而无须独立训练模型或构建复杂的支持系统。这种便利性不仅加速了各类自然语言处理任务的实现(如文本创作和问答系统),还大大降低了开发和运营的成本。随着对OpenAI不断地进行研究和优化,API用户始终能够享受到最新的技术成果。此外,API还为各个行业的创新者开辟了新的可能性,并助力各种计算机12万字 - 会员
深入理解Prometheus监控系统
本书按照监控数据的采集和加工流程的顺序,深入剖析Prometheus监控系统的主要模块,旨在帮助读者理解Prometheus监控系统的底层工作机制。本书主要内容包括监控数据来源模块、监控目标发现模块、监控数据采集模块、监控数据存储与读写模块、监控数据查询语言、监控数据计算与告警模块、Web模块,以及警报管理系统等。通过对主要模块的学习,读者可以了解Prometheus监控系统是如何充分利用并发能力计算机13.4万字 - 会员
实时分析实战:构建实时流处理应用和分析系统
本书为想要设计、构建和维护实时分析应用程序的人员(包括数据工程师、架构师和技术领导者)提供了结构合理的基础知识。第1章和第2章简要介绍实时分析,并概述可以构建的实时分析应用程序的类型。第3章介绍一家虚构的比萨公司,该公司已经建立了流处理基础设施,但尚未实现任何实时分析功能。第4~10章展示如何为这家比萨公司实现不同类型的实时分析应用程序。第11~13章介绍将应用程序投入生产时的注意事项、实时分析的计算机6万字 - 会员
containerd原理剖析与实战
Kubernetes作为云原生领域容器编排的事实标准毋庸置疑,Kubernetes作为编排调度的指挥官,而真正的执行者实际上是容器运行时。在云原生生态中,容器运行时作为云原生技术栈的基石,是至关重要的一环。本书旨在帮助读者全面了解containerd的基本原理和概念。本书从云原生与容器运行时讲起,内容涵盖云原生和容器的发展史,容器技术的Linux原理,containerd的架构、原理、功能、部署、计算机9.2万字 - 会员
Vue.js+Node.js全栈开发实战(第2版)
《Vue.js+Node.js全栈开发实战》以掌握Web全栈开发技术为目标,以Node.js和Vue.js原生开发和项目实战为主线,详细介绍Node.js+Vue.js全栈开发技术。《Vue.js+Node.js全栈开发实战》共分14章,内容包括Node.js基础与环境搭建,Vue.js基础介绍与环境搭建,Node.js语法基础,Node.js中的包管理,Node.js文件操作,Node.js网络计算机11.1万字 - 会员
软件性能测试、分析与调优实践之路(第2版)
《软件性能测试、分析与调优实践之路》主要分享作者在多年软件测试从业中积累的关于性能测试、分析诊断与调优技巧等方面的实战经验,帮助读者提升软件性能测试、分析诊断与调优的能力。《软件性能测试、分析与调优实践之路》分为9章,内容包括软件性能测试、分析与调优基础,服务器的性能监控与分析,Web中间件的性能分析与调优,应用中间件的性能分析与调优,Java应用程序的性能分析与调优,MySQL数据库的性能分析,计算机7.7万字