一、定义
DevOps(Development和Operations的组合词)是一组过程、方法与系统的统称,用于促进开发(应用程序/软件工程)、技术运营和质量保障(QA)部门之间的沟通、协作与整合。
它是一种重视“软件开发人员(Dev)”和“IT运维技术人员(Ops)”之间沟通合作的文化、运动或惯例。透过自动化“软件交付”和“架构变更”的流程,来使得构建、测试、发布软件能够更加地快捷、频繁和可靠。
它的出现是由于软件行业日益清晰地认识到:为了按时交付软件产品和服务,开发和运营工作必须紧密合作。
从定义来看,其实devops就是为了让开发、运维和QA可以高效协作的流程。(可以把DevOps看作开发、技术运营和质量保障(QA)三者的交集。)
DevOps
二、DevOps对应用程序发布的影响
在很多企业中,应用程序发布是一项涉及多个团队、压力很大、风险很高的活动。然而在具备DevOps能力的组织中,应用程序发布的风险很低,原因如下 [2] :
(1)减少变更范围
与传统的瀑布模式模型相比,采用敏捷或迭代式开发意味着更频繁的发布、每次发布包含的变化更少。由于部署经常进行,因此每次部署不会对生产系统造成巨大影响,应用程序会以平滑的速率逐渐生长。
(2)加强发布协调
靠强有力的发布协调人来弥合开发与运营之间的技能鸿沟和沟通鸿沟;采用电子数据表、电话会议和企业门户(wiki、sharepoint)等协作工具来确保所有相关人员理解变更的内容并全力合作。
(3)自动化
强大的部署自动化手段确保部署任务的可重复性、减少部署出错的可能性。
与传统开发方法那种大规模的、不频繁的发布(通常以“季度”或“年”为单位)相比,敏捷方法大大提升了发布频率(通常以“天”或“周”为单位)。
三、实现DevOps需要什么?
硬性要求:工具上的准备
上文提到了工具链的打通,那么工具自然就需要做好准备。现将工具类型及对应的不完全列举整理如下:
代码管理(SCM):GitHub、GitLab、BitBucket、SubVersion
构建工具:Ant、Gradle、maven
自动部署:Capistrano、CodeDeploy
持续集成(CI):Bamboo、Hudson、Jenkins
配置管理:Ansible、Chef、Puppet、SaltStack、ScriptRock GuardRail
容器:Docker、LXC、第三方厂商如AWS
编排:Kubernetes、Core、Apache Mesos、DC/OS
服务注册与发现:Zookeeper、etcd、Consul
脚本语言:python、ruby、shell
日志管理:ELK、Logentries
系统监控:Datadog、Graphite、Icinga、Nagios
性能监控:AppDynamics、New Relic、Splunk
压力测试:JMeter、Blaze Meter、loader.io
预警:PagerDuty、pingdom、厂商自带如AWS SNS
HTTP加速器:Varnish
消息总线:ActiveMQ、SQS
应用服务器:Tomcat、JBoss
Web服务器:Apache、Nginx、IIS
数据库:MySQL、Oracle、PostgreSQL等关系型数据库;cassandra、mongoDB、redis等NoSQL数据库
项目管理(PM):Jira、Asana、Taiga、Trello、Basecamp、Pivotal Tracker
在工具的选择上,需要结合公司业务需求和技术团队情况而定。(注:更多关于工具的详细介绍可以参见此文:51 Best DevOps Tools for #DevOps Engineers)
软性需求:文化和人
DevOps成功与否,公司组织是否利于协作是关键。开发人员和运维人员可以良好沟通互相学习,从而拥有高生产力。并且协作也存在于业务人员与开发人员之间。
出席了2016年伦敦企业级DevOps峰会的ITV公司在2012年就开始落地DevOps,其通用平台主管Clark在接受了InfoQ的采访,在谈及成功时表示,业务人员非常清楚他们希望在最小化可行产品中实现什么,工程师们就按需交付,不做多余工作。
这样,工程师们使用通用的平台(即打通的工具链)得到更好的一致性和更高的质量。此外,DevOps对工程师个人的要求也提高了,很多专家也认为招募到优秀的人才也是一个挑战。
四、面试题
1、您能告诉我们DevOps和Agile(敏捷)之间的根本区别吗?
答:尽管DevOps与敏捷方法(这是最流行的SDLC[Software Development Life Cycle]方法之一)有一些相似之处,但两者在软件开发方面都是根本不同的方法。以下是两者之间的各种基本差异:
敏捷方法
敏捷方法适用于敏捷中的开发同时敏捷方法适用于DevOps中的开发和操作。实践和流程
敏捷涉及敏捷Scrum和敏捷看板等实践,而DevOps涉及CD(持续交付),CI(持续集成)和CT(持续测试)等流程。优先级
敏捷优先考虑及时性,而DevOps优先考虑及时性和质量。发布周期
DevOps提供较小的发布周期并提供即时反馈,而敏捷仅提供较小的发布周期而没有立即反馈。反馈源
敏捷依赖于客户的反馈,而DevOps涉及到自身(监控工具)的反馈。工作范围
对于敏捷,工作范围仅是敏捷,而对于DevOps,这是敏捷和对自动化的需求。
2、为什么我们需要DevOps?
答:如今,很多组织或企业正试图通过一系列的发布小的特性传递给客户,而不是发布大的特性集。这样做有几个好处,包括更好的软件质量和快速的客户反馈,所有这些好处导致更高的客户满意度,这是任何产品开发项目的最重要目标。为此,公司需要:
- 增加部署频率
- 缩短修复时间
- 降低新版本的失败率
- 万一新版本崩溃,请有更快的平均恢复时间
DevOps有助于满足所有这些要求,从而实现无缝的软件交付。像Amazon,Etsy和Google这样的成熟组织已采用DevOps方法,从而实现了以前未知的性能水平。通过采用DevOps方法,组织可以在一天之内完成数以万计的部署。此外,这样做还可以提供一流的可靠性
、安全性
和稳定性
。
3、使用DevOps有哪些重要的业务和技术优势?
答:DevOps为该表带来了很多业务和技术优势。下面列出了一些最重要的参数:
- 商业利益:
- 增强的操作环境稳定性
- 更快地交付功能
- 更多时间为产品增值
- 技术优势:
- 持续交付软件
- 更快地解决问题
- 较小的复杂问题
4、您能列举一些最常用的DevOps工具吗?
答:以下是一些使用最广泛的DevOps工具的列表:
- Ansible/Puppet/chef/saltstack –配置管理和应用程序部署工具
- Docker –容器化工具
- Git/Gitlab –版本控制系统(VCS)工具
- Jenkins –持续集成(CI)工具
- Nexus - 制品库管理工具
- Jira –敏捷的团队协作工具
- wiki -文档管理工具
- Promtheus –连续监控工具
- Selenium/jmeter –连续测试(CT)工具
5、Selenium的用途是什么?
答:selenium用于DevOps中的连续测试。该工具专门从事功能和回归形式的测试。
6、您对DevOps中的Puppet有什么了解?
答:这是一个配置管理工具,用于自动执行管理任务。Puppet利用主从结构,其中两个实体通过加密通道进行通信。系统管理员需要执行许多重复性任务,尤其是安装和配置服务器。编写脚本来自动执行此类任务是一种选择,但是当基础结构很大时,执行的操作就会变得繁琐重复。为此,配置管理是一个不错的解决方法。
Puppet帮助配置、部署和管理服务器。这不仅使此类冗余任务变得更加容易,而且节省了总工作时间的很大一部分。成熟的配置管理工具:
- 持续检查主机所需的配置是否到位。如果更改了,配置将自动还原
- 为每个主机定义不同的配置
- 对机器进行动态缩放(上下缩放)
- 提供对所有已配置计算机的控制,以便可以将集中更改自动传播到所有这些计算机
7、您对DevOps的反模式有什么了解?
答:如果其他组织通常采用的DevOps模式在特定环境下不起作用,而组织仍在继续使用它,则会导致采用反模式。换句话说,反模式是关于DevOps的神话。一些著名的反模式是:
- 一个组织需要有一个单独的DevOps组
- 敏捷等于DevOps
- DevOps是一个过程
- DevOps是开发驱动的发布管理
- 由于组织独特唯一的,因此无法进行DevOps
- 我们不能做DevOps因为我们已经很牛了
- DevOps意味着开发人员管理生产
- DevOps将解决所有问题
- 无法在正在进行的DevOps过渡中包含组织的所有方面
- 在DevOps过渡开始时未定义KPI
- 通过一个新的DevOps团队来减少与其他组织之间的隔离
8、DevOps有一个叫做CI的东西。它是什么,目的是什么?
答:DevOps中的CI代表持续集成。CI是一种开发实践,开发人员可以在一天内多次将代码集成到共享存储库中。
- 开发和测试的持续集成提高了软件的质量,并减少了交付所需的总时间。
- 如果检查代码的团队成员遇到编译失败,则开发人员将终止构建。如果开发人员不将编译错误引入自己的工作空间中,那么其他的开发成员就无法与共享源代码存储库进行同步。
- 这破坏了协作和共享的开发过程。因此,一旦配置项构建中断,立即识别并纠正问题就很重要。
- 通常,持续集成(CI)流程包括一组单元、集成和回归测试,这些测试在每次编译成功时运行。如果上述任何一个测试失败,CI构建就会被认为是不稳定的(这在敏捷sprint中很常见,因为开发正在进行中),并且没有被破坏。
9、我们经常听到DevOps向左移动。它是什么?
答:画在纸上的传统软件开发生命周期有左右两边。图的左侧包括设计和开发,而右侧包括生产阶段,压力测试和用户接受度。在DevOps中向左移动仅意味着需要在右侧执行尽可能多的任务,即通常在应用程序开发过程的结尾发生,并将其纳入DevOps方法的早期阶段。有几种方法可以完成DevOps中的操作,最值得注意的是:
- 在每个敏捷sprint结束时创建可用于生产的文件(制品文件)
- 在每个版本中都包含静态代码分析程序
- 正确执行DevOps的级别直接取决于尽可能左移的程度。
10、DevOps中的CAMS代表什么?
答:首字母缩写CAMS通常用于描述DevOps方法论的核心信条。它代表:
- 文化 Culture
- 自动化 Automation
- 度量 Measurement
- 分享 Sharing
11 、用来评估DevOps成功的几个KPI是什么?
答:kpi是关键绩效指标的简写形式。为了度量DevOps过程的成功,可以使用几个kpi。其中最流行的有:
- 应用性能
- 应用程序的使用和流量
- 自动测试通过率
- 可用性
- 体量的变化
- 客户的工单
- 缺陷逃逸率
- 部署频率
- 部署时间
- 错误率
- 部署失败数
- 负载时间
- 平均故障检测时间(MTTD)
- 平均故障恢复时间(MTTR)
12、您认为实施DevOps自动化的主要好处是什么?
答:以下是实现DevOps自动化的主要好处:
- 从CD方程式中消除人为错误的可能性(核心收益)
- 随着任务变得更加可预测和可重复,一旦出现问题,就很容易识别和纠正。因此,它产生了更可靠和健壮的系统
- 从CI管道中移除瓶颈。这会导致部署频率增加和失败的部署数量减少。它们都是重要的DevOps KPI
13、您对容器了解什么?
答:容器是一种轻量级虚拟化形式,有助于在进程之间提供隔离。容器比chroot重,但比管理程序轻。
14、您对版本控制系统(VCS)有什么了解?定义其用途。
答:版本控制系统或VCS是一种能够记录一段时间内对一个文件或一组文件所做的更改的系统。Git和Mercurial是两个最受欢迎的版本控制系统。VCS的重要用途是:
- 检查导致问题的最后修改是什么
- 比较随着时间的变化情况
- 识别谁在什么时间提出新的问题
- 将一个或多个文件还原到某个较早的状态
- 将整个项目还原到以前的状态
15、Git是流行的DevOps工2具。告诉我们您将如何还原已经推送并公开的提交。
答:有两种方法可以这样做:
- 通过创建新的提交来撤消已被推送并公开的提交所做的所有更改。执行以下命令:
1 | git revert |
- 通过修复或删除新提交中的错误文件,然后将其推送到远程存储库。对文件进行必要的更改后,使用以下命令将其提交到远程存储库:
1 | git commit -m "commit message" |
16、什么是post mortem meetings?
参考回答:在这个会议上,我们讨论出了什么问题,应该采取什么步骤,这样失败就不会再次发生。事后分析会议并不是要找出问题的症结所在,而是要防止再次发生类似的工作,和ITIL中的问题管理是相类似的管理方法。并应重新计划新的设计基础设施,以便尽可能减少停机时间。如果错误我们无法避免,那么我们应从错误中学习,以提交IT整体的质量管理。
17、资产管理和配置管理之间的比较。
答:监视和维护对实体或组有价值的东西的过程称为资产管理。配置管理是指控制,识别,计划和验证服务中的配置项以支持变更管理的过程。
18、您能否陈述和解释连续测试的各个关键要素?
答:持续测试的各种关键要素包括:
- 高级分析–用于预测和预测未知的未来事件
- 策略分析–旨在改善测试过程的手段
- 需求可追溯性–指描述需求以及从需求的起源到部署的整个过程的能力
- 风险评估–识别可能造成潜在损害的危害和风险因素的方法或过程
- 服务虚拟化–允许使用虚拟服务代替生产服务。仿真软件组件以进行简单测试
- 测试优化–改善整体测试流程
19、请从开发和基础架构方面说明DevOps的核心运营。
答:DevOps在开发和基础架构方面的核心运营是:
- 应用程序开发–开发能够满足所有客户要求并提供卓越质量水平的产品
- 代码覆盖率–测量在运行自动测试时执行的代码的块,线或弧的总数
- 代码开发–准备产品开发所需的代码库
- 配置–以最佳方式使用产品
- 部署–安装要由最终用户使用的软件
- 编排–安排一些自动化任务
- 打包–发布准备好部署时所涉及的活动
- 供应–确保基础设施的更改及时地与需要它的代码一起到达
- 单元测试–测试单个单元或组件的方法
20、您对DevOps有什么了解?
您的答案必须简单明了。首先介绍一下DevOps在IT行业中的重要性。讨论这种方法如何旨在使开发和运营团队共同努力,以最小的故障率加速软件产品的交付。包括DevOps如何成为增值实践,开发和运维工程师在整个产品或服务生命周期中(从设计阶段到部署点)携手合作。
21、为什么最近几年DevOps变得突出?
在谈论DevOps的日益普及之前,请讨论当前的行业情况。首先,举例说明Netflix和Facebook等大型公司如何投资DevOps来自动化和加速应用程序部署,以及这如何帮助他们发展业务。以Facebook为例,您将指出Facebook的持续部署和代码所有权模型,以及这些模型如何帮助其扩大规模,同时确保体验质量。在不影响质量,稳定性和安全性的情况下实现了数百行代码。
下一个用例应该是Netflix。这家流媒体和点播视频公司采用完全自动化的流程和系统遵循类似的做法。提及这两个组织的用户群:Facebook有20亿用户,而Netflix将在线内容流传输给全球超过1亿用户。
这些都是很好的例子,说明DevOps如何帮助组织确保更高的发布成功率,减少错误修复之间的准备时间,通过自动化简化并持续交付,以及总体上降低人力成本。
22、哪些是最受欢迎的DevOps工具?您是否有使用这些工具的经验?
较流行的DevOps工具包括:
- selenium
- ansible
- git/gitlab
- jenkins
- docker
23、您是否想要掌握所有这些Devops工具?
彻底描述您有信心的任何工具,其功能以及为什么要使用它。例如,如果您具有Git方面的专业知识,则可以告诉采访者Git是一种分布式版本控制系统(VCS)工具,该工具可让用户跟踪文件更改并在需要时还原为特定更改。讨论Git的分布式体系结构如何为开发人员带来更多优势,使开发人员可以在本地进行更改,并可以在其本地Git存储库中拥有整个项目历史记录,以后可以与其他团队成员共享。
24、什么是版本控制?为什么要使用VCS?
定义版本控制,并讨论该系统如何记录对一个或多个文件所做的任何更改并将其保存在集中式存储库中。VCS工具将帮助您重新调用以前的版本并执行以下操作:
- 仔细查看一段时间内所做的更改,然后检查哪些有效,哪些无效。
- 将特定文件或特定项目还原回旧版本。
- 检查由于特定更改而发生的问题或错误
- 使用VCS为开发人员提供了同时处理特定文件的灵活性,并且所有修改内容以后都可以进行逻辑组合。
25、敏捷和DevOps之间有区别吗?如果是,请解释。
作为一名DevOps工程师,对这样的面试问题充满期待。首先描述DevOps与敏捷之间明显的重叠。尽管DevOps的实现始终与敏捷方法保持同步,但是两者之间存在明显的差异。敏捷原则与软件的无缝生产或开发相关。另一方面,DevOps处理开发工作,然后部署软件,以确保更快的周转时间,最小的错误和可靠性。
26、为什么配置管理过程和工具很重要?
讨论正在开发的每个软件或测试软件的多个软件构建,发行,修订和版本。继续说明存储和维护数据的需求,跟踪开发构建和简化的故障排除。不要忘了提到可用于实现这些目标的关键CM工具。讨论诸如Puppet,Ansible和Chef之类的工具如何在多个服务器上自动化软件部署和配置的过程中提供帮助。
27、Chef如何用作CM工具?
chef被认为是行业首选的CM工具之一。例如,Facebook将其基础架构和后端IT迁移到了Chef平台。解释Chef如何通过自动化流程来帮助您避免延迟。这些脚本是用Ruby编写的。它可以与基于云的平台集成并配置新系统。它提供了许多用于基础结构开发的库,这些库以后可以部署在软件中。借助其集中式管理系统,一台Chef服务器足以用作部署各种策略的中心。
28、您如何解释“基础架构即代码”(IaC)的概念?
谈论IaC是一个好主意,有时将其称为可编程基础结构,在该基础结构中,与其他任何代码的感知方式相同。描述传统的基础架构管理方法如何退居二线,以及手动配置,过时的工具和自定义脚本的可靠性如何降低。接下来,重点介绍IaC的好处,以及如何使用IaC更快,更安全,更轻松地对IT基础架构进行更改。包括IaC的其他好处,例如将常规的单元测试和集成测试应用于基础结构配置,以及维护最新的基础结构文档。
如果您已经完成了Amazon Web Services(AWS)的认证,并且正在接受诸如AWS认证的DevOps工程师之类的利基角色的面试,那么您必须准备以下一些AWS DevOps面试问题:
29、AWS在DevOps中的作用是什么?
在面试中被问到此问题时,请直接说明,AWS是亚马逊提供的基于云的服务,可通过无限的计算能力和存储来确保可扩展性。AWS使IT企业能够开发和交付复杂的产品,并在云上部署应用程序。其一些关键服务包括Amazon CloudFront,Amazon SimpleDB,Amazon Relational Database Service和Amazon Elastic Computer Cloud。讨论各种云平台,并强调您过去使用云基础架构处理过的任何大数据项目。
30、持续集成的成功因素是什么?
- 维护代码库
- 自动化构建
- 让构建自我测试
- 每个人每天将代码都提交到基线
- 每次提交(到基线)都应该被构建
- 保持快速构建
- 在预发布环境中进行测试
- 轻松获取最新交付物
- 每个人都可以看到最新版本的结果
- 自动化部署
31、你如何在我公司实践DevOps?
参考回答:作为一名DevOps工程师,我会对DevOps项目管理的管理目标、敏捷交付、持续集成进行管理,并从敏捷项目管理新三角《敏捷项目管理》出发,与团队一起设定目标,实现简化的ITIL工作流,维护敏捷的DevOps管理范围,研究和引入新的技术或框架,通过DevOps 流水线,实现从需求转化为工作流从整体工具链进行全局优化。
32、配置管理工具在devops中的作用是什么?
参考回答: 配置管理工具是指支持完成配置项标识、版本控制、变化控制、审计和状态统计等任务的工具。 自动化的配置管理工具可以帮助DevOps实现持续流水线的技术支持基础。使用CM工具,可以帮着管理与存储关于系统、软件、测试相关的版本和构建及配置信息,并提供软件和测试软件之间的可跟踪性。成功的DevOps从配置管理开始。
33、DevOps工程师的职责是什么?
参考回答:DevOps工程师与敏捷开发团队紧密合作,站在业务价值视角,拉动IT从业务需求到运营交付,确保通过高质量(JKK)的自动化测试,实现持续集成和持续交付等IT技术功能所需的环境。DevOps工程师必须经常与开发保持联系(SRE模式、丰田模式、持续交付模式、协作模式),使环境中所有需要的部分都能无缝地工作,实现高质量的增量迭代。可以扩展说说相关工具。