隨著互聯(lián)網(wǎng)的快速發(fā)展,運(yùn)維工作也越來越火,想要學(xué)習(xí)運(yùn)維開發(fā)工程師的小伙伴數(shù)量也不斷在增加,對(duì)于想要加入運(yùn)維行業(yè)但是對(duì)運(yùn)維不太了解的小伙伴,小編準(zhǔn)備了這篇文章,讓我們一起來看一看運(yùn)維工程師是做什么的?
運(yùn)維開發(fā)工程師是做什么的
運(yùn)維開發(fā)工程師需要負(fù)責(zé)研究新的方式,將重復(fù)的事情做成自動(dòng)化、自助化的工具平臺(tái)提升運(yùn)維質(zhì)量及效率、安全性。下面是小編為您精心整理的運(yùn)維開發(fā)工程師日常工作內(nèi)容。
在軟件產(chǎn)品的整個(gè)生命周期中運(yùn)維工程師都需要適時(shí)地參與并發(fā)揮不同的作用,因此運(yùn)維工程師的工作內(nèi)容和方向非常多:
事件管理:目標(biāo)是在服務(wù)出現(xiàn)異常時(shí)盡可能快速的恢復(fù)服務(wù),從而保障服務(wù)的可用性;同時(shí)深入分析故障產(chǎn)生的原因,推動(dòng)并修復(fù)服務(wù)存在的問題,同時(shí)設(shè)計(jì)并開發(fā)相關(guān)的預(yù)案以確保服務(wù)出現(xiàn)故障時(shí)可以高效的止損。在這方面主要工作內(nèi)容有:
1、問題發(fā)現(xiàn):設(shè)計(jì)并開發(fā)高效的監(jiān)控平臺(tái)和告警平臺(tái),使用機(jī)器學(xué)習(xí)、大數(shù)據(jù)分析等方法對(duì)系統(tǒng)中的大量監(jiān)控?cái)?shù)據(jù)進(jìn)行2、匯總分析,以及在系統(tǒng)出現(xiàn)異常的時(shí)候可以快速的發(fā)現(xiàn)問題和判斷故障的影響。
3、問題處理:設(shè)計(jì)并開發(fā)高效的問題處理平臺(tái)和工具,在系統(tǒng)出現(xiàn)異常的時(shí)候可以快速/自動(dòng)決策并觸發(fā)相關(guān)止損預(yù)案,快速恢復(fù)服務(wù)。
4、問題跟蹤:通過分析問題發(fā)生時(shí)系統(tǒng)的各種表現(xiàn)(日志、變更、監(jiān)控)確定問題發(fā)生的根本原因,制定并開發(fā)預(yù)案工具。
5、變更管理:以可控的方式,盡可能高效的完成產(chǎn)品功能的迭代的變更工作。在這方面主要工作內(nèi)容有:
6、配置管理:通過配置管理平臺(tái)(自研、開源)管理服務(wù)涉及到的多個(gè)模塊、多個(gè)版本的關(guān)系以及配置的準(zhǔn)確性。
7、發(fā)布管理:通過構(gòu)建自動(dòng)化的平臺(tái)確保每一次版本變更可以安全可控地發(fā)布到生產(chǎn)環(huán)境。
8、容量管理:在服務(wù)運(yùn)行維護(hù)階段,為了確保服務(wù)架構(gòu)部署的合理性同時(shí)掌握服務(wù)整體的冗余,需要不斷評(píng)估系統(tǒng)的承、載能力,并不斷優(yōu)化之。在這方面主要工作內(nèi)容有:
a、容量評(píng)估:通過技術(shù)手段模擬實(shí)際的用戶請(qǐng)求,測(cè)試整個(gè)系統(tǒng)所能承擔(dān)的最大吞吐;通過建立容量評(píng)估模型分析壓力測(cè)試過程中的數(shù)據(jù)以評(píng)估整個(gè)服務(wù)的容量。
b、容量優(yōu)化:基于容量評(píng)估數(shù)據(jù),判斷系統(tǒng)的瓶頸并提供容量優(yōu)化的解決方案。比如通過調(diào)整系統(tǒng)參數(shù)、優(yōu)化服務(wù)部署架構(gòu)等方法來高效的提升系統(tǒng)容量。
c、架構(gòu)優(yōu)化:為了支持產(chǎn)品的不斷迭代,需要不斷的進(jìn)行架構(gòu)優(yōu)化調(diào)整。以確保整個(gè)產(chǎn)品能夠在功能不斷豐富和復(fù)雜的條件下,同時(shí)保持高可用性。
運(yùn)維開發(fā)工程師工作職責(zé)是什么?
工作職責(zé)一:
1、負(fù)責(zé)自動(dòng)化運(yùn)維平臺(tái)的設(shè)計(jì)和開發(fā)工作;
2、協(xié)調(diào)運(yùn)維團(tuán)隊(duì)、測(cè)試團(tuán)隊(duì)及研發(fā)團(tuán)隊(duì)進(jìn)行DevOps需求討論及落地;
3、參與高質(zhì)量的設(shè)計(jì)和編碼;
4、參與企業(yè)內(nèi)部系統(tǒng)的開發(fā)、部署、維護(hù)工作;
5、負(fù)責(zé)基于云原生運(yùn)維和優(yōu)化生產(chǎn)系統(tǒng),監(jiān)控系統(tǒng)治理、日常生產(chǎn)問題處理、數(shù)據(jù)化分類等,提升平臺(tái)效率和質(zhì)量;
6、負(fù)責(zé)生產(chǎn)系統(tǒng)問題的分析、拉通、跟進(jìn)、處理、解決等工作,快速解決生產(chǎn)問題,降低業(yè)務(wù)影響;
7、整理運(yùn)維的數(shù)據(jù)化報(bào)表,推動(dòng)系統(tǒng)的穩(wěn)定性。
工作職責(zé)二:
1. 開展基礎(chǔ)設(shè)施的綜合運(yùn)維,保障公司業(yè)務(wù)系統(tǒng)的高可用,高安全性,高性能;
2. 負(fù)責(zé)郵件系統(tǒng)、域控系統(tǒng)的維護(hù)優(yōu)化與桌面外包人員管理;
3. 負(fù)責(zé)網(wǎng)絡(luò)和服務(wù)器的架構(gòu)設(shè)計(jì)、維護(hù)優(yōu)化、安全監(jiān)控以及性能管理;
4. 負(fù)責(zé)持續(xù)改進(jìn)優(yōu)化基礎(chǔ)架構(gòu)以適應(yīng)公司業(yè)務(wù)發(fā)展;
5. 組織開展基礎(chǔ)設(shè)施運(yùn)行維護(hù)相關(guān)培訓(xùn)、訓(xùn)練與演練;
6. 自動(dòng)化運(yùn)維相關(guān)工作的研究,開發(fā),部署。