您當前的位置：首頁 > 職位列表 > 職位詳情

OCR與AI算法工程師

2-2.5萬元/月

投遞簡歷

四川-成都

3-5年 C/C++ · 深度學習 · 大模型算法 · 圖像處理庫（OpenCV等） · 可兼職 · 圖像生成 · 優秀開源項目經歷 · OCR · Python · 模型加速/性能優化

2025-12-16 01:49:05 更新被瀏覽：688 次

四川譯訊信息科技有限公司

最近在線時間：2025-12-16 01:49:05

電話：189********

地址：中國(四川)自由貿易試驗區成都高新區天府五街200號2棟A區10樓1011-2室

職位描述

崗位職責:
1、設計與優化多語言OCR算法，支持復雜場景下的文字檢測、識別及多語種混合排版處理能力。
2、提升版面分析能力，實現對文檔結構（如表格、圖像、標題）的智能識別與還原，增強復雜布局的解析精度。
3、集成主流開源OCR框架，優化圖像預處理、特征提取與結果后處理流程，適配高分辨率圖像及動態應用場景。
4、搭建基于大語言模型的AIAgent工作流，規劃任務拆解、工具調用（如RAG、函數調用）及多模態交互邏輯設計。
5、精進提示詞工程（PromptEngineering），提高模型在特定業務場景中的推理準確性與輸出一致性。
6、研究多Agent協作機制，推動復雜任務中多個智能體的協同運作與自動化流程落地。
7、關注前沿技術進展（如多模態Agent、AutoGPT），快速評估并引入優質開源項目（如LlamaIndex、LangGraph）。

任職要求：
研究生學歷，本科為985、211院校且能力突出者可酌情考慮

1、技術能力
圖像算法功底扎實：掌握CNN/Transformer等網絡架構，具有OCR、版面分析或文檔數字化相關項目經驗。
大模型應用經驗豐富：熟悉LLM微調方法，具備Agent框架開發實踐（如LangChain）。
編程能力良好：熟練運用Python/PyTorch/TensorFlow，具備系統化開發能力及Linux平臺開發背景。

2、特質要求
技術洞察力強：關注新興技術方向（如多模態Agent、AutoML），能高效完成技術驗證與方案選型。
開放共享意識：參與過主流開源項目，有代碼貢獻或自研工具優化案例者優先。
問題攻關能力強：善于從實際業務需求出發反推技術實現路徑，獨立解決算法優化與性能瓶頸問題。

3、加分項
了解多模態模型，擁有視覺-語言聯合建模實踐經驗。
熟悉工業級Agent全流程開發，涵蓋意圖識別、任務調度及異常恢復機制設計。