大模型調(diào)優(yōu)工程師(行業(yè)知識庫方向)
1.2-2.4萬元/月崗位職責
1.模型調(diào)優(yōu)與適配:依托企業(yè)行業(yè)知識體系,對主流大模型(如LLaMA、GPT、Qwen等)開展領(lǐng)域定向微調(diào),增強其在特定業(yè)務場景下的任務執(zhí)行能力(如問答系統(tǒng)、邏輯推理、文本生成等)。
2.數(shù)據(jù)治理與知識整合:設(shè)計并實施行業(yè)知識庫的數(shù)據(jù)清洗、標注及向量化流程,實現(xiàn)結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的深度融合與高效利用。
3.跨職能協(xié)同:與各業(yè)務線緊密配合,深入理解行業(yè)實際需求,推動模型能力在具體應用場景中的落地(如客戶支持、數(shù)據(jù)洞察、智能輔助決策等)。
4.資源效率提升:采用參數(shù)高效微調(diào)技術(shù)(PEFT)、模型量化方法(QLORA)等手段,降低顯存占用和算力消耗,適配企業(yè)現(xiàn)有硬件基礎(chǔ)設(shè)施。
5.前沿技術(shù)探索:持續(xù)關(guān)注大模型微調(diào)方向的技術(shù)進展(如MOE架構(gòu)、持續(xù)學習機制),研究多模態(tài)知識庫與模型融合的創(chuàng)新路徑。
任職要求
1.技術(shù)能力
-掌握主流大模型核心架構(gòu)(Transformer、LLaMA、GPT系列),熟悉常見微調(diào)方法(LORA、Adapter、Prefix-Tuning)及相關(guān)工具生態(tài)(HuggingFace、Deepspeed)
-熟練使用PyTorch或TensorFlow框架,具備多GPU/TPU分布式訓練經(jīng)驗,掌握混合精度訓練、梯度檢查點等顯存優(yōu)化技術(shù)
-精通行業(yè)知識庫建設(shè)關(guān)鍵技術(shù),包括知識圖譜構(gòu)建、文本嵌入表示(BERT/Embedding)、RAG(檢索增強生成)等
-了解模型量化部署方案(AWQ、GGUF)及高性能推理引擎(vLLM、TensorRT-LLM)
2.行業(yè)經(jīng)驗(滿足其一即可)
-具備航天、航空、工業(yè)、農(nóng)業(yè)等垂直領(lǐng)域知識庫建設(shè)項目經(jīng)歷,熟悉相關(guān)行業(yè)術(shù)語與數(shù)據(jù)特征
-擁有多模態(tài)數(shù)據(jù)處理經(jīng)驗(涵蓋文本、表格、圖像/視頻),參與過大模型在行業(yè)場景的實際落地項目
3.學歷與資歷
-碩士及以上學位,計算機科學、人工智能、數(shù)學等相關(guān)專業(yè)背景,具備3年以上NLP或大模型研發(fā)經(jīng)驗
-有開源社區(qū)貢獻記錄(如HuggingFace模型上傳、LangChain集成)或發(fā)表過頂會論文(ACL、NeurIPS)者優(yōu)先考慮
4.綜合素質(zhì)
-思維嚴謹,能快速捕捉業(yè)務需求并轉(zhuǎn)化為可行的技術(shù)實施方案
-具備良好的溝通協(xié)作能力,可與技術(shù)、產(chǎn)品及業(yè)務團隊順暢對接