职责描述
岗位内容:
垂直领域大模型的深度攻关:负责大模型在金融、保险等复杂业务场景下的建模及优化。不局限于常规微调,而是通过深入的后训练(Post-training)与对齐技术,打造性能卓越的行业模型。
Agent研发: 攻克复杂业务场景下的智能体构建与优化难题。重点探索Agent进化、自动构建及多智能体协作等机制,致力于构建更具自主性的高性能智能体系统。
前沿技术架构的追踪与储备: 保持对 AI 领域 SOTA技术的敏锐度。跳出常规方法的舒适区,探索包括新一代模型技术及范式,确保团队始终掌握核心技术竞争力。
任职要求:
1、27届及以后在读大学生/研究生,计算机、人工智能、自然语言处理等相关专业背景;
2、熟练掌握Python及PyTorch、DeepSpeed、swift、verl等主流深度学习框架;
3、 熟悉大模型相关架构与训练方法,如Transformer、RLHF、PEFT、指令微调等;
4、具有大规模语言模型(如7B/13B/72B等级别)全流程开发经验者优先,包括数据清洗、模型训练、调优及评估等;
5、 在语言模型、强化学习、agent自进化等相关领域有高水平论文发表或开源项目贡献者优先;
6、 具备较强的学习与探索能力,良好的英文技术文献阅读能力,善于沟通与团队协作;
7、 能保证6个月及以上实习期者优先。