得早学就创

AI算子优化工程师

招聘时间

即日起至 2026-05-08

招聘单位

英特尔

所在地区

上海

工作地点

上海市/上海/闵行区

学历要求

本科

实习时长

每周4天，每天4小时

职责描述

团队简介

我们是 Intel AI Framework 团队，致力于在 Intel CPU / XPU（GPU）平台上提升主流 AI 框架与推理系统的性能和可扩展性。

团队长期参与并推动 SGLang、PyTorch 等开源项目的上游协作，重点关注大模型推理、算子性能、编译与运行时优化，让 AI 框架在 Intel
硬件上“跑得快、跑得稳、易规模化”。

加入我们，你将直接参与真实生产级 AI 框架与算子优化工作，而不是停留在 demo 或 toy project。

实习方向

算子 / Kernel 优化

* 参与高性能算子（如 GEMM、Attention、LayerNorm、MLP、多路算子融合等）的实现与优化
* 利用 SIMD / AMX / oneDNN / XPU backend 等技术提升算子性能
* 对接 PyTorch custom op、Inductor / Triton / SYCL 等技术栈
* 利用LLM自动化算子优化迭代与生成

岗位要求

我们希望你具备以下背景（满足一部分即可）：

* 计算机、软件工程、电子工程、人工智能等相关专业在读本科 / 硕士 / 博士
* 熟悉 C/C++ 或 Python，有较好的代码能力
* 对深度学习框架或系统性能优化有强烈兴趣
* 具备良好的问题分析能力和工程耐心，愿意深入底层定位性能问题
加分项（非必需，但非常欢迎）：

* 熟悉 PyTorch / SGLang / vLLM / Triton / oneDNN 中的一种或多种
* 有性能优化经验：profiling、cache / vectorization / 并行优化
* 了解 CPU / GPU 架构、SIMD、AMX、内存层级等系统知识
* 有开源项目贡献经验（GitHub PR / issue / benchmark 等）

你将获得

* 直接参与主流 AI 框架和大模型推理系统的核心优化工作
* 与资深框架 / 性能工程师深度合作，系统性提升工程能力
* 对真实工业级 workload 与 Intel 硬件平台的深入理解
* 表现优秀者可获得转正 / 推荐 / 长期合作机会