实习岗位详情

AI算子优化工程师
 招聘时间
即日起 至 2026-05-08
 招聘单位
英特尔
 所在地区
上海
 工作地点
上海市/上海/闵行区
 学历要求
本科
 实习时长
每周4天,每天4小时
 职责描述
团队简介

我们是 Intel AI Framework 团队,致力于在 Intel CPU / XPU(GPU)平台 上提升主流 AI 框架与推理系统的性能和可扩展性。

团队长期参与并推动 SGLang、PyTorch 等开源项目 的上游协作,重点关注 大模型推理、算子性能、编译与运行时优化,让 AI 框架在 Intel
硬件上“跑得快、跑得稳、易规模化”。

加入我们,你将直接参与 真实生产级 AI 框架与算子优化工作,而不是停留在 demo 或 toy project。







实习方向

算子 / Kernel 优化

* 参与高性能算子(如 GEMM、Attention、LayerNorm、MLP、多路算子融合等)的实现与优化
* 利用 SIMD / AMX / oneDNN / XPU backend 等技术提升算子性能
* 对接 PyTorch custom op、Inductor / Triton / SYCL 等技术栈
* 利用LLM自动化算子优化迭代与生成






岗位要求

我们希望你具备以下背景(满足一部分即可):

* 计算机、软件工程、电子工程、人工智能等相关专业在读本科 / 硕士 / 博士
* 熟悉 C/C++ 或 Python,有较好的代码能力
* 对 深度学习框架或系统性能优化 有强烈兴趣
* 具备良好的问题分析能力和工程耐心,愿意深入底层定位性能问题
加分项(非必需,但非常欢迎):

* 熟悉 PyTorch / SGLang / vLLM / Triton / oneDNN 中的一种或多种
* 有性能优化经验:profiling、cache / vectorization / 并行优化
* 了解 CPU / GPU 架构、SIMD、AMX、内存层级等系统知识
* 有开源项目贡献经验(GitHub PR / issue / benchmark 等)






你将获得

* 直接参与 主流 AI 框架和大模型推理系统 的核心优化工作
* 与资深框架 / 性能工程师深度合作,系统性提升工程能力
* 对真实工业级 workload 与 Intel 硬件平台的深入理解
* 表现优秀者可获得 转正 / 推荐 / 长期合作机会
相关实习岗位
查看更多实习岗位

分享

收藏

 

©版权所有 deizao.net(得早学就创) 粤ICP备2024216716号