技術支持工程師
5000-7000元/月【公司介紹】
天璣算·科研服務是國內領先的科研技術服務機構,專注于為高校、科研院所及企業提供全方位科研技術支持整體解決方案。核心業務涵蓋模擬計算、科研算力、實驗檢測、學術培訓等領域,目前已服務2000余家高校院所及企業,業務覆蓋全國30余省市,累計服務用戶超10萬人。
“天璣智研”旗下“天璣算”平行公司"天璣智算",在成都、雅安、廣西部署三大算力中心,構建了大規模HPC集群,總算力達20Pflops,硬件規模近億元。中心采用Intel至強鉑金五代處理器等業界領先架構,并具備服務器設計、研發、生產能力,月均出貨量超500臺,可滿足各類科研深度定制需求。
公司匯聚90余名專業技術工程師,其中碩博計算工程師50+,自主研發國內首個“算力+學習”綜合應用平臺——天璣智算云,為科研用戶提供從底層計算資源到上層應用的全流程技術支持,有效助力科技創新與成果轉化。
【崗位職責】
1、負責HPC平臺(集群/超算)的日常值班和用戶技術支持,及時響應客戶問題。
2、處理作業調度(Slurm、PBS/Torque等)、資源使用、用戶環境配置相關問題。
3、協助排查并解決硬件/軟件故障,包括計算節點、存儲、網絡(Infiniband/Ethernet)等。
4、監控HPC系統運行狀態,處理異常告警,確保平臺高可用性。
6、整理并編寫運維手冊、FAQ和工單記錄,提升響應效率。
7、與研發、工程實施團隊協作,推動系統優化和問題閉環。
【任職要求】
1、學歷背景:計算機、軟件工程、電子信息、物理、數學等相關專業,本科及以上學歷。
2、操作系統:熟悉Linux(RHEL、CentOS、Rocky、Ubuntu等),掌握常用系統管理與故障排查命令。
3、集群與調度:了解HPC調度系統(如Slurm、PBS/Torque、LSF),能處理作業提交、隊列異常等問題。
4、編程與腳本:熟悉至少一種腳本語言(Shell、Python、Perl),能編寫日常運維腳本。
5、并行計算:了解MPI、OpenMP等基本并行編程概念,有HPC應用支持經驗更佳。
6、溝通能力:能與客戶有效溝通,耐心解答,具有較強的服務意識和抗壓能力。
7、值班適應:能接受值班輪換(沒有通宵夜班),遇到突發事件及時響應。
【加分項】
1、有HPC系統或超算中心運維、客戶支持經驗。
2、有大型企業級存儲/網絡/虛擬化環境經驗(如Ceph、Docker、Kubernetes)。
3、熟悉科學計算軟件(VASP、GROMACS、CP2K、COMSOL、ANSYS等)的安裝與運行支持。
4、有ITIL/運維相關認證,或Linux/網絡相關證書(RHCE、CCNA等)。
【工作方式】
1、值班采用輪班制(白班+晚班or遠程On-call),保證客戶問題在SLA時效內響應。(白班朝九晚六,晚班15點-23點)
2、出現重大系統故障時,需快速召集團隊進行聯合排障。
3、提供培訓與學習機會,逐步承擔更復雜的HPC支持與優化任務。