实习岗位详情

大模型推理引擎研发工程师(练习生)
 招聘时间
即日起 至 2026-10-10
 招聘单位
小红书
 所在地区
北京
 工作地点
亚运村街道安定路五号院7号楼中海国际大厦A座+B座
 学历要求
本科
 实习时长
每周5天,每天3小时
 职责描述
工作职责:
工作职责:
1、参与/负责研发面向大语言模型(LLM)/多模态大模型(MLLM)等类型模型的推理服务框架;
2、通过并行计算优化、分布式架构优化、异构调度等多种框架技术,打造高效、易用、领先的AI推理框架;
2、深度参与周边深度学习系统多个子方向的工作,包括但不限于模型管理、推理部署、日志/监控、工作流编排等;
3、与全公司各业务算法部门深度合作,为重点项目进行算法与系统的联合优化,支撑业务目标达成。

任职资格:
任职资格:
1、优秀的代码能力、数据结构和基础算法功底,熟悉C++/Python开发,熟悉 Linux/Git 开发环境;
2、熟悉至少一种主流基础深度学习训练或推理框架(TensorFlow/PyTorch/PaddlePaddle/TensorRT等)的使用和实现;
3、熟悉主流LLM模型结构,熟悉至少一种主流LLM推理框架(vLLM/SGLang/TensorRT-LLM等)的使用和实现;
4、熟悉GPU硬件架构,了解GPU 软件栈(CUDA,cuDNN),具备 GPU 性能分析的能力;
5、有强烈的工作责任心,较好的学习能力、沟通协作能力和自驱力,能和团队一起探索新技术,推进技术进步。

加分项:
1、熟悉CUDA编程,有TensorRT或其它AI加速库、高性能算子开发经验者优先;
2、熟悉至少一种AI编译加速组件者优先,包含但不限与TorchInductor/TVM/Triton/XLA等;
3、了解并行计算、网络通信、系统优化和集群硬件架构等相关知识者优先;
4、熟悉NCCL/RDMA/IB/RoCE相关知识者优先;
5、有优秀开源项目经历者优先。
相关实习岗位
查看更多实习岗位

分享

收藏

 

©版权所有 deizao.net(得早学就创) 粤ICP备2024216716号