崗位職責(zé):
1、參與大模型本地化部署與性能優(yōu)化,支持大模型的本地化部署,參與模型量化(INT4/FP8)、顯存優(yōu)化及推理加速等工作;參與構(gòu)建商業(yè)應(yīng)用,確保響應(yīng)延遲滿足客戶要求,并支持高并發(fā);
2、AI Agent開發(fā)與優(yōu)化,開發(fā)面向智能客服、數(shù)據(jù)分析Agent等的AI應(yīng)用,使用LangChain/Dify等框架實現(xiàn)任務(wù)規(guī)劃、工具調(diào)用及多智能體協(xié)作;
3、通過用戶反饋分析持續(xù)優(yōu)化應(yīng)用的交互體驗、性能等,提升客戶滿意度優(yōu)化
任職要求(需滿足條件1,條件2-4至少滿足其中一條)
1、計算機(jī)/人工智能相關(guān)專業(yè),有課程設(shè)計、開源項目或競賽,接受應(yīng)屆畢業(yè)生,實習(xí)生(在校生可全職實習(xí)≥6個月);
2、AI Agent開發(fā),熟悉LangChain/Dify等框架,具備工作流、智能體、工具(如API集成)開發(fā)經(jīng)驗(課程/項目均可);
3、了解RAG、記憶管理(向量數(shù)據(jù)庫)或多智能體通信(MCP協(xié)議)者優(yōu)先;
4、大模型部署與優(yōu)化,掌握PyTorch基礎(chǔ),了解模型量化、蒸餾或推理加速技術(shù),了解常見的本地模型推理框架,有非cuda設(shè)備(ROCM/昇騰)部署經(jīng)驗者加分。