得早学就创

语音大模型数据实习生（语音识别/翻译方向）-AI数据与安全

招聘时间

即日起至 2026-05-30

招聘单位

字节跳动

所在地区

北京

工作地点

北京市/北京市/海淀区 e世界财富中心

学历要求

硕士

实习时长

每周5天，每天3小时

职责描述

职位描述
日常实习：面向全体在校生，为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍：
AI 数据与安全团队为 Seed 基座模型及 AI 原生应用提供跨模态数据服务，覆盖数据生产全流程，包含模型评估标准的制定、数据规模化生产、数据飞轮搭建，不断提升数据质量，支持模型快速迭代。

团队由产品经理、数据工程、数据运营等跨职能人才组成，并通过与 Seed 研究员、行业专家、全球顶尖数据供应商紧密合作，从真实场景中收集反馈并分析模型表现数据，解决 AI 前沿突破过程中的复杂数据问题，推动模型性能与用户体验的双重提升。我们既是帮助模型技术迭代的一线贡献者，也是模型和 AI 产品的一手用户。

1、搭建具有通用性和可拓展性的多语言ASR/NLP/翻译标注框架，与专家及产品研发团队对齐标准、撰写相关培训方案；
2、大语言模型训练过程中各阶段数据质量评估，确保大语言模型训练数据有效；
3、理解业务需求，完成复杂标注任务的设计/验收任务，协同技术和标注团队，推动需求顺利落地；
4、制定产品和项目流程机制，协调项目各个角色高效工作，确保项目团队各干系人协同工作。

职位要求
1、硕士及以上学位在读，小语种、同传、翻译相关专业优先；
2、英文方向具备CATTI口/笔译二级及以上证书，小语种方向（印尼语、泰语、马来语、越南语、葡语）C1及同等水平，同时具备二外能力者优先；
3、具备扎实的语法基础、丰富的词汇量以及良好的听说读写能力，同时具备同传驱动的思维和优秀的笔译能力，能对专业术语和行话理解并翻译准确者优先；
4、具备较强的逻辑思维，数据分析能力，富有创新精神，解决问题能力强，能制定数据质量提升方案；
5、有大语言模型任务设计和标注的实习经历者优先；
6、每周出勤至少4天，能够长期实习者优先。