实习岗位详情

NLP大模型算法实习生
 招聘时间
即日起 至 2027-03-31
 招聘单位
同道猎聘集团
 所在地区
北京
 工作地点
北京市/北京市/朝阳区 诚盈中心9号楼
 学历要求
不限
 实习时长
每周5天,每天3小时
 职责描述
岗位介绍
探索大模型在垂域业务中的落地,参与真实业务场景下的大模型训练与优化工作,直接接触完整训练链路,包括:
数据构建与清洗
SFT / RL 后训练
模型离线评估与 badcase 分析
线上效果分析与迭代

岗位要求
熟练使用 Python
具备以下框架的实际使用经验:LLaMA-Factory / verl / vLLM
具备大模型后训练相关经验,包括不限于 SFT / RLVR / RLHF ……
熟悉至少一种强化学习后训练算法,并理解其核心训练流程,包括不限于 PPO / GRPO / DAPO ……

加分项
具备 Spark 相关经验,能够熟练使用 SQL
具备数据清洗、badcase 分析,reward 与业务目标对齐经验
相关实习岗位
查看更多实习岗位

分享

收藏

 

©版权所有 deizao.net(得早学就创) 粤ICP备2024216716号