职责描述
职位描述:
团队介绍:字节跳动 Seed 团队成立于 2023 年,致力于寻找通用智能的新方法,追求智能上限,为科技和社会发展作出贡献。
Seed 团队在 AI 领域拥有长期愿景与决心,团队研究方向涵盖 MLLM、GenMedia、AI for Science、机器人等,在中国、新加坡、美国等地设有实验室和岗位。目前,团队已推出业界领先的通用大模型以及前沿的多模态能力,支持豆包、即梦、TRAE 等超过 50 个应用场景,并通过火山引擎开放给企业客户。第三方数据显示,豆包 App 用户量在中国市场排名第一,豆包大模型日均 Token 调用量行业领先。
1、结合前沿音频模型的研究方向,结合移动端场景,实现适合多端的模型训练及应用;
2、搭建提高音频模型有用性评价体系,专注音频理解的前沿技术和算法效果,追求和探索业界最前沿算法。
职位要求:
1、2028届及以后本科及以上学历在读,计算机、数学、自动化、人工智能等相关专业优先;
2、熟悉语音识别、音频理解、语音交互算法,并有使用大规模数据优化模型的动手经验;
3、对深度学习、LLM技术有深度了解和实战经验,熟悉PyTorch、TensorFlow等平台;
4、有不错的编码能力,熟悉Linux开发环境,熟悉C++和Python语言;
5、有独立工作能力并同时能与团队融洽相处。
加分项:
1、在相关国际会议或主流期刊上发表论文(ICASSP、Interspeech、ASRU、IEEE/ACM Transactions等);
2、语音相关比赛或机器学习相关比赛拿到国际领先名次、ACM/NOI/IOI/TopCoder等编程比赛获奖;
3、参与过有影响力开源项目;
4、沟通能力好,主人翁意识强,有组织协调能力,乐观自省。