運(yùn)維主管/經(jīng)理(雙休五險(xiǎn)一金)
1.5-2萬(wàn)元/月崗位職責(zé):
1、負(fù)責(zé)騰訊云相關(guān)產(chǎn)品(需了解主流云服務(wù))的運(yùn)維管理,制定標(biāo)準(zhǔn)化操作流程及故障處理規(guī)范,保障業(yè)務(wù)連續(xù)性與數(shù)據(jù)安全;
2、負(fù)責(zé)Kubernetes集群(ACK/TKE/EKS)的架構(gòu)設(shè)計(jì)、部署實(shí)施與性能調(diào)優(yōu),涵蓋節(jié)點(diǎn)彈性伸縮、Pod調(diào)度優(yōu)化、HPA自動(dòng)擴(kuò)展及自愈機(jī)制建設(shè);
3、負(fù)責(zé)公司服務(wù)器、網(wǎng)絡(luò)設(shè)備及配套軟硬件的日常運(yùn)維與狀態(tài)監(jiān)控,通過(guò)規(guī)劃、部署、維護(hù)與持續(xù)優(yōu)化,確保系統(tǒng)全天候穩(wěn)定運(yùn)行;
4、制定并落實(shí)安全基線標(biāo)準(zhǔn)(CISBenchmark),定期開(kāi)展漏洞掃描(Nessus/OpenVAS),配置安全策略并推動(dòng)漏洞閉環(huán)修復(fù);
5、搭建基于Prometheus+AlertManager+Grafana的端到端監(jiān)控平臺(tái),集成ELK/EFK日志分析系統(tǒng),實(shí)現(xiàn)快速告警與故障根因追溯;
6、執(zhí)行數(shù)據(jù)備份任務(wù),制定合理的備份策略,按時(shí)完成各服務(wù)器數(shù)據(jù)備份,保障數(shù)據(jù)完整性與可恢復(fù)性;
7、完成上級(jí)交辦的其他相關(guān)工作任務(wù)。
崗位要求:
1、熟悉主流公有云平臺(tái)(阿里云/騰訊云/AWS)的運(yùn)維與部署,熟練掌握Linux系統(tǒng)管理及常用存儲(chǔ)備份技術(shù)(如rsync/NFS/smb等);
2、深入理解Kubernetes網(wǎng)絡(luò)(Calico/Flannel)、存儲(chǔ)(CSI)和安全控制(RBAC/NetworkPolicy),具備Jenkins+GitLabCI自動(dòng)化流水線實(shí)踐經(jīng)驗(yàn);
3、掌握LVS+Keepalived高可用架構(gòu)與Nginx反向代理配置,包括SSL證書(shū)管理、URL重寫(xiě)、緩存策略、限流機(jī)制與負(fù)載均衡設(shè)置;
4、理解HTTP、TCP/IP等網(wǎng)絡(luò)協(xié)議原理,熟悉HTTP通信過(guò)程與OSI模型,掌握IPv4/IPv6、DNS、DHCP、NTP等基礎(chǔ)網(wǎng)絡(luò)服務(wù)的配置與應(yīng)用;
5、熟悉Zabbix、Nagios、Prometheus、skywalking、open-falcon等開(kāi)源監(jiān)控工具的安裝、配置與日常維護(hù);
6、具備Redis、mongodb、rabbitmq、rocketmq、nacos、apollo等常見(jiàn)中間件的集群部署與性能優(yōu)化能力;
7、熟練使用VMwarevSphere、Hyper-V等虛擬化平臺(tái),能夠完成虛擬機(jī)創(chuàng)建、遷移、備份恢復(fù)及資源池優(yōu)化管理;
8、了解主流網(wǎng)絡(luò)設(shè)備(交換機(jī)、路由器、防火墻、服務(wù)器)的配置與運(yùn)維,具備網(wǎng)絡(luò)故障診斷與排查能力;
9、掌握CI/CD工具鏈(如Jenkins/GitLabCI),熟悉容器技術(shù)(Docker)及編排系統(tǒng)(Kubernetes)的應(yīng)用與管理;
10、具備本地部署deepseek大模型或參與過(guò)大模型訓(xùn)練者優(yōu)先考慮。