得早学就创

语音算法实习生-Seed

招聘时间

即日起至 2026-07-23

招聘单位

字节跳动

所在地区

北京

工作地点

中国大陆北京市海淀区中关村大街11号e世界财富中心C座，邮编：100089

学历要求

硕士

实习时长

每周5天，每天4小时

职责描述

职位描述:
ByteIntern：面向2027届毕业生（2026年9月-2027年8月期间毕业），为符合岗位要求的同学提供转正机会。
团队介绍：字节跳动 Seed 团队成立于 2023 年，致力于寻找通用智能的新方法，追求智能上限，为科技和社会发展作出贡献。
Seed 团队在 AI 领域拥有长期愿景与决心，团队研究方向涵盖 MLLM、GenMedia、AI for Science、机器人等，在中国、新加坡、美国等地设有实验室和岗位。目前，团队已推出业界领先的通用大模型以及前沿的多模态能力，支持豆包、即梦、TRAE 等超过 50 个应用场景，并通过火山引擎开放给企业客户。第三方数据显示，豆包 App 用户量在中国市场排名第一，豆包大模型日均 Token 调用量行业领先。

1、深度参与字节下一代通用多模态大模型核心研发工作，攻坚底层AI基座关键技术，亲身参与前沿人工智能技术从0到1的迭代创新；
2、推动语音、音频、音乐、自然语言生成与理解类算法落地，将前沿多模态技术落地到真实线上业务场景，覆盖全链路音频建模、文本音频跨模态融合等实际研发工作；
3、持续跟踪音频、NLP、多模态融合领域顶会前沿技术，开展前沿方案调研、算法复现与创新优化，输出完整技术调研报告与可行改进方案。

职位要求:
1、本科及以上学历在读，计算机、软件工程等相关专业优先；
2、有自然语言处理、语音合成与识别、音乐生成等研究或者技术背景优先；
3、有预训练技术，包括但不限于高效训练、强化学习，参与过研发音频、NLP相关的预训练模型及其下游应用者优先；
4、熟练掌握PyTorch等深度学习框架，Python编程语言；
5、发表过领域顶级会议文章（NeurIPS、ICML、ICLR、ACL、Interspeech、ICASSP等）、相关实习经验或者ACM竞赛获奖者优先。