职责描述
岗位职责:
1、负责垂直领域大模型的核心技术落地,包括模型微调、量化、蒸馏与压缩,同步完成运行环境配置及参数优化,结合业务场景适配模型,提升其在垂直领域的应用效果;
2、主导大模型的性能优化,制定优化方案,确保模型的性能在对应数据集上性能达标;
3、参与大模型在垂直领域的落地验证,收集业务反馈并迭代优化模型组件,解决部署与运行过程中的技术问题。
4、编写模型配置文档等技术资料,配合团队完成大模型应用原型开发,保障跨角色协作效率。
任职要求:
1、深入熟悉主流大模型框架(如LLaMA、GPT系列等)及核心组件原理,具备大模型组件测试、环境配置的完整实战经验;
2、熟练掌握Python编程语言,精通PyTorch、TensorFlow等深度学习框架,能基于pytorch或llama factory独立且高效完成模型的训练、微调、量化等工作;
3、深入了解transformer架构、模型微调、量化、蒸馏等核心技术,拥有边缘设备场景下大模型开发的相关实际经历;
4、具备优秀的逻辑思维与问题排查能力,能快速定位并解决模型组件测试、配置及部署中的技术问题。