OCR與AI算法工程師
2-2.5萬元/月崗位職責:
1、設計與優化多語言OCR算法,支持復雜場景下的文字檢測、識別及多語種混合排版處理能力。
2、提升版面分析能力,實現對文檔結構(如表格、圖像、標題)的智能識別與還原,增強復雜布局的解析精度。
3、集成主流開源OCR框架,優化圖像預處理、特征提取與結果后處理流程,適配高分辨率圖像及動態應用場景。
4、搭建基于大語言模型的AIAgent工作流,規劃任務拆解、工具調用(如RAG、函數調用)及多模態交互邏輯設計。
5、精進提示詞工程(PromptEngineering),提高模型在特定業務場景中的推理準確性與輸出一致性。
6、研究多Agent協作機制,推動復雜任務中多個智能體的協同運作與自動化流程落地。
7、關注前沿技術進展(如多模態Agent、AutoGPT),快速評估并引入優質開源項目(如LlamaIndex、LangGraph)。
任職要求:
研究生學歷,本科為985、211院校且能力突出者可酌情考慮
1、技術能力
圖像算法功底扎實:掌握CNN/Transformer等網絡架構,具有OCR、版面分析或文檔數字化相關項目經驗。
大模型應用經驗豐富:熟悉LLM微調方法,具備Agent框架開發實踐(如LangChain)。
編程能力良好:熟練運用Python/PyTorch/TensorFlow,具備系統化開發能力及Linux平臺開發背景。
2、特質要求
技術洞察力強:關注新興技術方向(如多模態Agent、AutoML),能高效完成技術驗證與方案選型。
開放共享意識:參與過主流開源項目,有代碼貢獻或自研工具優化案例者優先。
問題攻關能力強:善于從實際業務需求出發反推技術實現路徑,獨立解決算法優化與性能瓶頸問題。
3、加分項
了解多模態模型,擁有視覺-語言聯合建模實踐經驗。
熟悉工業級Agent全流程開發,涵蓋意圖識別、任務調度及異常恢復機制設計。