实习岗位详情

AI infra 实习生
 招聘时间
即日起 至 2026-05-22
 招聘单位
模思智能
 所在地区
上海
 工作地点
上海市/上海市/徐汇区 上海模思智能科技有限公司
 学历要求
本科
 实习时长
每周5天,每天3小时
 职责描述
岗位职责
 • 参与音频/视频大模型推理系统的开发与优化,基于 vLLM / SGLang 搭建与迭代推理服务
 • 设计并实现高性能推理 Pipeline(加载、调度、解码、服务化)
 • 参与 CUDA 算子开发与优化(Attention / Norm / Matmul 等),提升推理吞吐与延迟表现
 • 分析与优化显存/内存使用(KV Cache、Batching、量化等)
 • 使用 Profiling 工具进行性能分析(Nsight Systems / Nsight Compute)
 • 参与向量检索或多模态数据处理模块(如 embedding / 索引)优化

任职要求
 • 熟练掌握 C++(C++11/14/17),理解虚函数、模板、智能指针等核心特性
 • 熟悉 Linux 开发环境、CMake、Git
 • 具备 CUDA 编程基础,有 GPU 算子开发或优化经验优先
 • 理解 Transformer 架构及大模型推理流程(prefill / decode / KV cache)
 • 熟悉或了解以下任一方向:
    ◦ 推理框架:vLLM / SGLang
    ◦ 并行策略:TP / DP / Continuous Batching
    ◦ 推理优化:PagedAttention、CUDA Graph、量化(如 AWQ)
 • 扎实的数据结构与计算机系统基础

加分项
 • 有音频/视频模型(ASR / TTS / 多模态)推理或训练经验
 • 有向量数据库或 ANN 索引经验(如 HNSW / DiskANN)
 • 有完整推理引擎或 Serving 系统开发经验
 • 熟悉 AI 编程工具(如 Cline / Cursor)用于代码生成与验证
相关实习岗位
查看更多实习岗位

分享

收藏

 

©版权所有 deizao.net(得早学就创) 粤ICP备2024216716号