nlp自然語言算法工程師
1.2-1.6萬元/月一、核心能力要求
1.編程語言
Python(必備):精通NumPy/Pandas數(shù)據(jù)處理、PyTorch/TensorFlow/Keras框架,熟悉SciKitLearn等傳統(tǒng)ML工具庫。
C++/Java/Scala(加分項(xiàng)):高性能計(jì)算、系統(tǒng)底層優(yōu)化、工業(yè)級部署場景(如實(shí)時(shí)推理引擎開發(fā))。
2.算法與模型
傳統(tǒng)ML:監(jiān)督學(xué)習(xí)(線性回歸/SVM/決策樹)、無監(jiān)督學(xué)習(xí)(聚類/PCA)、強(qiáng)化學(xué)習(xí)。
深度學(xué)習(xí):
CV方向:CNN(ResNet/YOLO)、DiffusionModels(StableDiffusion)。
NLP方向:RNN/LSTM、Transformer(BERT/GPT)、多模態(tài)與LLM微調(diào)。
3.開發(fā)框架與工具
深度學(xué)習(xí)框架:PyTorch(研究首選)、TensorFlow(生產(chǎn)部署)、HuggingFace(NLP生態(tài))。
大數(shù)據(jù)處理:ApacheSpark/Flink、Kafka(流數(shù)據(jù)處理)、Hadoop生態(tài)。
云與MLOps:AWSSageMaker/AzureML/GCPVertexAI、MLflow/Kubeflow、Airflow。
二、進(jìn)階技術(shù)能力
1.數(shù)據(jù)處理與工程化
數(shù)據(jù)清洗、特征工程、數(shù)據(jù)增強(qiáng)(如GAN生成合成數(shù)據(jù))。
分布式存儲(chǔ)與計(jì)算(HDFS/Spark)、向量數(shù)據(jù)庫(FAISS/Milvus)。
2.模型優(yōu)化與部署
性能優(yōu)化:模型量化/剪枝、GPU加速(CUDA)、多線程/分布式訓(xùn)練。
部署方案:容器化(Docker/K8s)、Serverless、邊緣設(shè)備(ONNXRuntime)。
3.領(lǐng)域適配經(jīng)驗(yàn)
垂直領(lǐng)域(金融/醫(yī)療/心理學(xué))的數(shù)據(jù)與術(shù)語適配能力(如醫(yī)療NER模型開發(fā))。
隱私合規(guī):數(shù)據(jù)脫敏(GDPR)、模型偏見檢測、倫理風(fēng)險(xiǎn)評估。
三、崗位職責(zé)
1.架構(gòu)設(shè)計(jì)與技術(shù)規(guī)劃
設(shè)計(jì)端到端AI系統(tǒng)架構(gòu)(數(shù)據(jù)管道→訓(xùn)練→部署→監(jiān)控),制定技術(shù)路線圖(如LLM/AutoML引入評估)。
確保高可用、高性能及合規(guī)性(如數(shù)據(jù)隱私、模型審計(jì))。
2.工程化落地與優(yōu)化
主導(dǎo)MLOps框架搭建(模型版本管理、自動(dòng)化訓(xùn)練/監(jiān)控)、實(shí)時(shí)推理優(yōu)化(低延遲<100ms)。
優(yōu)化分布式計(jì)算架構(gòu)(Spark/Flink)、成本控制(Spot實(shí)例/模型壓縮)。
3.技術(shù)領(lǐng)導(dǎo)與創(chuàng)新
主導(dǎo)跨團(tuán)隊(duì)協(xié)作(數(shù)據(jù)/產(chǎn)品/業(yè)務(wù)),將需求轉(zhuǎn)化為技術(shù)方案(如對話系統(tǒng)設(shè)計(jì))。
四、任職要求
1.基礎(chǔ)背景
計(jì)算機(jī)科學(xué)/數(shù)學(xué)/統(tǒng)計(jì)學(xué)本科及以上學(xué)歷,2年以上架構(gòu)設(shè)計(jì)經(jīng)驗(yàn)。
2.全流程項(xiàng)目經(jīng)驗(yàn)
至少參與過2個(gè)以上完整AI項(xiàng)目(需求分析→數(shù)據(jù)準(zhǔn)備→模型訓(xùn)練→部署運(yùn)維)
掌握Git版本控制、CI/CD自動(dòng)化測試流程
3.跨領(lǐng)域協(xié)作能力
心理學(xué)/醫(yī)療/金融等垂直領(lǐng)域知識(shí)轉(zhuǎn)化能力(如情感咨詢機(jī)器人需心理學(xué)術(shù)語適配)
4.倫理與合規(guī)實(shí)踐
隱私數(shù)據(jù)脫敏處理、模型偏見檢測、AI倫理風(fēng)險(xiǎn)評估經(jīng)驗(yàn)