崗位職責
1、負責云資源池項目運維工具(監(jiān)控、自動化、CMDB等模塊)的端到端敏捷交付,制定迭代計劃(Sprint Backlog),把控需求拆解、任務分派、進度跟蹤(甘特圖/燃盡圖)及風險管理,確保按期高質量交付。
2、建立持續(xù)交付流水線(CI/CD),優(yōu)化開發(fā)-測試-部署流程,提升工程效能(如代碼交付效率、缺陷密度控制)。
3、管理8-10人跨職能團隊(需求/前后端/運維開發(fā)/測試),動態(tài)分配任務,解決資源沖突,組織技術評審會(架構設計、代碼規(guī)范)、每日站會及迭代復盤,推動技術債務清理與流程改進。
4、理解云資源池業(yè)務場景,將客戶需求轉化為技術方案(如將“自動化擴容”拆解為可執(zhí)行Story點),管理需求變更并調整優(yōu)先級。
5、基于SRE框架定義SLI/SLO/SLA(如監(jiān)控覆蓋率≥99%、自動化腳本執(zhí)行成功率≥99.9%),設計錯誤預算(Error Budget)管理機制,超閾值時暫停新功能開發(fā)并優(yōu)先修復。推動穩(wěn)定性專項治理(容災設計、應急預案、故障演練),實現“1-5-10”故障響應目標(1分鐘發(fā)現、5分鐘響應、10分鐘恢復)。
崗位要求
1、大專及以上學歷,計算機、軟件工程或相關專業(yè),5年以上研發(fā)項目管理經驗。
2、精通敏捷開發(fā)(Scrum/Kanban)及DevOps工具鏈(如GitLab CI/Jenkins/Prometheus),持有PMP或CSM認證者優(yōu)先。
3、熟悉云原生技術棧(Kubernetes/Docker)、微服務架構及自動化運維體系,能評審技術方案合理性(如高并發(fā)場景下的緩存設計)。
4、具備SRE實踐能力,包括不限SLI指標設計、監(jiān)控告警配置、容災方案設計經驗,熟悉AIOps應用者優(yōu)先。
5、優(yōu)秀的客戶溝通與抗壓能力,適應快節(jié)奏交付環(huán)境,具備技術風險預判及決策能力(如制定功能降級策略)。
6、出色的跨團隊協(xié)調能力,能驅動開發(fā)、測試、運維高效協(xié)作,解決接口延遲、數據不一致等協(xié)作瓶頸。