职责描述
职位描述
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:
AI 数据与安全团队为 Seed 基座模型及 AI 原生应用提供跨模态数据服务,覆盖数据生产全流程,包含模型评估标准的制定、数据规模化生产、数据飞轮搭建,不断提升数据质量,支持模型快速迭代。
团队由产品经理、数据工程、数据运营等跨职能人才组成,并通过与 Seed 研究员、行业专家、全球顶尖数据供应商紧密合作,从真实场景中收集反馈并分析模型表现数据,解决 AI 前沿突破过程中的复杂数据问题,推动模型性能与用户体验的双重提升。我们既是帮助模型技术迭代的一线贡献者,也是模型和 AI 产品的一手用户。
1、深入理解AI大模型,通过数据挖掘、数据合成、人工构造等方式生产高质量数据集;
2、能通过PE/Workflow/Agent、代码完成数据预处理、分析和清洗以及数据评估等,探索更高效的数据生产方式;
3、能通过输出和带教,提升数据团队对技术和大语言模型的了解,推动团队达成业务目标。
职位要求
1、硕士及以上学历在读,计算机、人工智能等相关专业优先;
2、有大模型算法/工程相关实习经验者优先;
3、具备良好的代码能力、基础算法功底,熟练使用Python/Java等语言,熟悉大模型SFT、RM、RL等算法和技术,具备PE能力,能够独立设计Prompt策略形成工作流,提高数据生产的质量和效率;
4、对文本内容和数据质量有较好判断力,有自己擅长的内容领域/体裁(如小说、对话、研报等)优先;
5、对AI有高度热情,做事靠谱,有很强的自驱力、抗压能力和学习能力。