大模型算法
150-200元/天
投遞簡歷
廣東-深圳
經驗不限
發表算法相關優秀論文 · 混元 · 機器學習 · 深度學習 · 大模型算法 · 自然語言處理算法 · 大數據處理框架(Spark/Hadoop/Hive) · 參加算法相關競賽/獲獎 · 日常實習生 · Python
2025-12-16 18:57:59 更新
被瀏覽:496 次
騰訊科技(深圳)有限公司
最近在線時間:2025-12-16 18:57:59
電話:185********
地址:深圳市南山區高新區科技中一路騰訊大廈35層
職位描述
崗位職責
1.數據特征算法:負責大規模代碼數據的挖掘工作(如標簽體系構建、結構化拼接、數據比例配置等),開展數據質量檢測(包括低質內容識別、優質代碼篩選等)以及數據合成相關算法研發;
2.數據pipeline建設:主導數據篩選、清洗、標注及質量評估流程的設計與實現。協同模型業務團隊,深度挖掘數據價值,搭建自動化數據處理系統,支撐模型的持續優化與迭代;
3.數據實驗分析:針對代碼大模型訓練所用數據進行系統性分析,建立規范化的實驗評估機制,發現樣本缺失、數據偏差、分布失衡等問題,推動數據質量、覆蓋范圍與多樣性的全面提升,助力模型生成能力不斷優化。
崗位要求
1.碩士及以上學歷,計算機科學、自然語言處理等相關專業背景優先考慮;
2.熟悉主流深度學習框架(如PyTorch、TensorFlow),具備模型訓練與數據處理實踐經驗,擁有出色的獨立開發、問題分析與研究能力;
3.具備良好的溝通協作意識,自我驅動性強,能獨立完成系統層面的分析與調優,推動大模型技術的實際落地應用;
4.可進行日常實習,每周至少全職投入4天,連續實習6個月以上者優先;27屆畢業生優先考慮。
加分項
1.掌握HiveSQL、Spark、Ray中至少兩項數據處理與分析工具;
2.對代碼大模型有較深認知,具備敏銳的數據感知力和扎實的數據洞察分析能力;
3.有大模型訓練或數據工程相關項目經驗者優先。
求職提醒:求職過程請勿繳納費用,謹防詐騙!若信息不實請舉報。
該公司的其他職位
您可能感興趣的職位
搜索更多相似職位 >
推薦企業
職位專題
微信求職找工作
手機掃一掃
隨時隨地找工作