人工智能算法工程師
1.5-2萬元/月一、崗位職責:
1.研究與開發:負責文本前端處理(包括文本正則化、分詞、詞性標注、韻律預測等)、端到端聲學模型(如VITS、FastSpeech系列)以及神經聲碼器(如HiFi-GAN)等TTS核心技術的算法研究、架構設計與工程實現。
2.模型優化與迭代:持續改進現有TTS系統,提升語音合成的自然流暢度、發音清晰度、情感表現力及實時響應能力,針對性解決實際應用中的典型問題。
3.前沿技術探索:關注國際前沿科研動態,例如大語言模型與TTS融合、Zero-shot/少樣本語音克隆、情感與風格可控合成等方向,開展可行性驗證并推動成果落地產品。
4.數據處理與構建:主導高質量、跨領域、多風格語音訓練數據集的設計與建設,建立高效的數據清洗、處理與標注流程。
5.工程落地:與工程團隊協同推進模型在生產環境中的部署上線,完成性能調優與系統穩定性維護。
6.技術文檔撰寫:編寫完整、規范的技術說明文檔,并參與專利申請相關材料的整理與撰寫。
二、任職資格(必備要求):
1.學歷與專業:計算機科學、人工智能、電子工程、應用數學等相關方向,本科及以上學歷。
2.技術基礎:具備扎實的機器學習與深度學習理論功底,熟練掌握PyTorch或TensorFlow等主流框架。精通Python語言編程,熟悉常用數據結構與算法設計。
3.NLP與TTS經驗:熟悉自然語言處理基礎任務,如語言建模、序列標注等;深入理解當前主流神經語音合成方法,至少精通一種典型TTS模型(如Tacotron2、FastSpeech1/2、VITS等)及其內部機制與實現細節。
4.實踐能力:具備出色的實驗設計、模型訓練、效果評估與調優能力,能夠獨立完成從問題分析到方案落地的全流程工作。
5.團隊合作:具備良好的溝通表達能力與團隊協作意識,能高效協同跨職能團隊完成項目目標。