职责描述
职位描述
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍:
AI 数据与安全团队为 Seed 基座模型及 AI 原生应用提供跨模态数据服务,覆盖数据生产全流程,包含模型评估标准的制定、数据规模化生产、数据飞轮搭建,不断提升数据质量,支持模型快速迭代。
团队由产品经理、数据工程、数据运营等跨职能人才组成,并通过与 Seed 研究员、行业专家、全球顶尖数据供应商紧密合作,从真实场景中收集反馈并分析模型表现数据,解决 AI 前沿突破过程中的复杂数据问题,推动模型性能与用户体验的双重提升。我们既是帮助模型技术迭代的一线贡献者,也是模型和 AI 产品的一手用户。
1、搭建具有通用性和可拓展性的多语言ASR/NLP/翻译标注框架,与专家及产品研发团队对齐标准、撰写相关培训方案;
2、大语言模型训练过程中各阶段数据质量评估,确保大语言模型训练数据有效;
3、理解业务需求,完成复杂标注任务的设计/验收任务,协同技术和标注团队,推动需求顺利落地;
4、制定产品和项目流程机制,协调项目各个角色高效工作,确保项目团队各干系人协同工作。
职位要求
1、硕士及以上学位在读,小语种、同传、翻译相关专业优先;
2、英文方向具备CATTI口/笔译二级及以上证书,小语种方向(印尼语、泰语、马来语、越南语、葡语)C1及同等水平,同时具备二外能力者优先;
3、具备扎实的语法基础、丰富的词汇量以及良好的听说读写能力,同时具备同传驱动的思维和优秀的笔译能力,能对专业术语和行话理解并翻译准确者优先;
4、具备较强的逻辑思维,数据分析能力,富有创新精神,解决问题能力强,能制定数据质量提升方案;
5、有大语言模型任务设计和标注的实习经历者优先;
6、每周出勤至少4天,能够长期实习者优先。