职责描述
职位描述:
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,为科技和社会发展作出贡献。
Seed 团队在 AI 领域拥有长期愿景与决心,团队研究方向涵盖 MLLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。目前,团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、即梦、TRAE 等超过 50 个应用场景,并通过火山引擎开放给企业客户。第三方数据显示,豆包 App 用户量在中国市场排名第一,豆包大模型日均 Token 调用量行业领先。
1、深度参与字节下一代通用多模态大模型核心研发工作,攻坚底层AI基座关键技术,亲身参与前沿人工智能技术从0到1的迭代创新;
2、推动语音、音频、音乐、自然语言生成与理解类算法落地,将前沿多模态技术落地到真实线上业务场景,覆盖全链路音频建模、文本音频跨模态融合等实际研发工作;
3、持续跟踪音频、NLP、多模态融合领域顶会前沿技术,开展前沿方案调研、算法复现与创新优化,输出完整技术调研报告与可行改进方案。
职位要求:
1、本科及以上学历在读,计算机、软件工程等相关专业优先;
2、有自然语言处理、语音合成与识别、音乐生成等研究或者技术背景优先;
3、有预训练技术,包括但不限于高效训练、强化学习,参与过研发音频、NLP相关的预训练模型及其下游应用者优先;
4、熟练掌握PyTorch等深度学习框架,Python编程语言;
5、发表过领域顶级会议文章(NeurIPS、ICML、ICLR、ACL、Interspeech、ICASSP等)、相关实习经验或者ACM竞赛获奖者优先。