自然語言處理算法工程師
1-1.5萬元/月一、核心能力要求
1.編程語言
Python(必備):精通NumPy/Pandas數據處理、PyTorch/TensorFlow/Keras框架,熟悉SciKitLearn等傳統ML工具庫。
C++/Java/Scala(加分項):高性能計算、系統底層優化、工業級部署場景(如實時推理引擎開發)。
2.算法與模型
傳統ML:監督學習(線性回歸/SVM/決策樹)、無監督學習(聚類/PCA)、強化學習。
深度學習:
CV方向:CNN(ResNet/YOLO)、DiffusionModels(StableDiffusion)。
NLP方向:RNN/LSTM、Transformer(BERT/GPT)、多模態與LLM微調。
3.開發框架與工具
深度學習框架:PyTorch(研究首選)、TensorFlow(生產部署)、HuggingFace(NLP生態)。
大數據處理:ApacheSpark/Flink、Kafka(流數據處理)、Hadoop生態。
云與MLOps:AWSSageMaker/AzureML/GCPVertexAI、MLflow/Kubeflow、Airflow。
二、進階技術能力
1.數據處理與工程化
數據清洗、特征工程、數據增強(如GAN生成合成數據)。
分布式存儲與計算(HDFS/Spark)、向量數據庫(FAISS/Milvus)。
2.模型優化與部署
性能優化:模型量化/剪枝、GPU加速(CUDA)、多線程/分布式訓練。
部署方案:容器化(Docker/K8s)、Serverless、邊緣設備(ONNXRuntime)。
3.領域適配經驗
垂直領域(金融/醫療/心理學)的數據與術語適配能力(如醫療NER模型開發)。
隱私合規:數據脫敏(GDPR)、模型偏見檢測、倫理風險評估。
三、崗位職責
1.架構設計與技術規劃
設計端到端AI系統架構(數據管道→訓練→部署→監控),制定技術路線圖(如LLM/AutoML引入評估)。
確保高可用、高性能及合規性(如數據隱私、模型審計)。
2.工程化落地與優化
主導MLOps框架搭建(模型版本管理、自動化訓練/監控)、實時推理優化(低延遲<100ms)。
優化分布式計算架構(Spark/Flink)、成本控制(Spot實例/模型壓縮)。
3.技術領導與創新
主導跨團隊協作(數據/產品/業務),將需求轉化為技術方案(如對話系統設計)。
四、任職要求
1.基礎背景
計算機科學/數學/統計學本科及以上學歷,2年以上架構設計經驗。
2.全流程項目經驗
至少參與過2個以上完整AI項目(需求分析→數據準備→模型訓練→部署運維)
掌握Git版本控制、CI/CD自動化測試流程
3.跨領域協作能力
心理學/醫療/金融等垂直領域知識轉化能力(如情感咨詢機器人需心理學術語適配)
4.倫理與合規實踐
隱私數據脫敏處理、模型偏見檢測、AI倫理風險評估經驗