职责描述
岗位职责:1、参与领域大模型预训练、微调,特别针对垂直领域(包括科技情报领域、出版领域、医学领域)进行特定任务的训练,
包括文本纠错、PDF解析、多模态embedding、多模态Reranker、知识审核、科研诚信审核等
2、参与大模型的推理优化
3、参与Agentic RL,实现基于多智能体的强化学习和智能体的自我迭代。
4、参与国家大模型重大科研项目的技术攻坚。
任职要求:1、熟悉常见大模型Qwen3、Qwen3.5、Deepseek的预训练、指令微调、强化学习原理
2、熟悉huggingface transformer
3、熟悉VLLM/Sglang/MindIE等常见的推理框架
4、精通python语言
5、硕士或博士在读
6、属于自我驱动性格,可以没有实践经验,我们会教。
7、考研数学成绩在110分以上或大学高数、概率成绩平均分90分以上,211/985大学可降低到80分以上。