职责描述
工作职责
1、协助开展大模型Agent核心技术研究,优化任务规划、多步推理、工具调用、长程记忆、自我反思修正等能力,迭代Agent自主决策与复杂任务执行效果。
2、负责代码大模型能力迭代优化,覆盖代码生成、补全、解释、调试、重构、跨语言翻译等核心场景,搭建代码知识库,提升模型代码理解与生成质量。
3、参与大模型全流程优化,协助完成模型预训练、SFT微调、强化学习对齐(PPO、DPO、GRPO等)实验,搭建适配Agent与代码场景的训练、评测数据体系,挖掘模型短板,形成数据-训练-评测的迭代闭环。
4、跟进业界大模型、智能Agent、代码大模型前沿技术,复现主流算法与框架,验证新技术可行性,协助推动技术落地为实际产品能力。
5、协助推进技术工程落地,优化Agent多轮交互、任务分解链路,探索代码大模型与开发、调试工具的深度集成,实现编程复杂任务自动化。
任职要求
1、计算机、人工智能、软件工程等相关专业在校生,对LLM、Agent、代码智能技术有浓厚兴趣。
2、掌握深度学习、大模型基础原理,了解微调、强化学习、Agent规划与工具调用核心范式,有相关课程基础或小型项目经验即可。
3、熟练使用Python,了解PyTorch等深度学习框架,具备基础代码编写、实验调试和迭代能力。
4、学习能力强,善于独立思考、分析解决问题,具备良好的跨团队沟通协作能力,工作踏实负责,可保证稳定实习时间(5个月以上)。
加分项
1、有LLM、Agent、代码大模型相关科研、项目、课程设计经验;
2、熟练使用Cursor、Claude Code等AI编程工具,了解大模型能力边界;
3、有LLM/Agent开源项目贡献、GitHub开发实践经验;
4、有算法、代码类竞赛获奖经历或顶会论文阅读、实验落地经验。
5、应届毕业生优先,有转正HC