职责描述
职位描述:
ByteIntern:面向2027届毕业生(2026年9月-2027年8月期间毕业),为符合岗位要求的同学提供转正机会。
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,为科技和社会发展作出贡献。
Seed 团队在 AI 领域拥有长期愿景与决心,团队研究方向涵盖 MLLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。目前,团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、即梦、TRAE 等超过 50 个应用场景,并通过火山引擎开放给企业客户。第三方数据显示,豆包 App 用户量在中国市场排名第一,豆包大模型日均 Token 调用量行业领先。
1、支持端到端语音交互技术在业务场景落地,探索语音端到端的业务应用前沿问题;
2、支持语音识别技术在字节跳动公司内外丰富的业务场景落地,解决落地过程中的前沿问题,持续优化语音识别核心技术效果;
3、搭建音频理解核心技术体系,专注音频理解的前沿技术和算法效果,追求和探索业界最前沿算法。
职位要求:
1、本科及以上学历在读,计算机、软件工程等相关专业优先;
2、熟悉语音识别、音频理解、语音交互算法,并有使用大规模数据优化模型的动手经验;
3、对深度学习、LLM 技术有深度了解和实战经验,熟悉 PyTorch、Tensorflow 等平台;
4、有不错的编码能力,熟悉 Linux 开发环境,熟悉 C++ 和 Python 语言;
5、有独立工作能力并同时能与团队融洽相处。
加分项:
1、在相关国际会议或主流期刊上发表论文(ICASSP、Interspeech、ASRU、IEEE/ACM Transactions等);
2、语音相关比赛或机器学习相关比赛拿到国际领先名次、ACM/NOI/IOI/TopCoder 等编程比赛获奖;
3、参与过有影响力开源项目;
4、沟通能力好,主人翁意识强,有组织协调能力,乐观自省。