职责描述
团队简介
我们是 Intel AI Framework 团队,致力于在 Intel CPU / XPU(GPU)平台 上提升主流 AI 框架与推理系统的性能和可扩展性。
团队长期参与并推动 SGLang、PyTorch 等开源项目 的上游协作,重点关注 大模型推理、算子性能、编译与运行时优化,让 AI 框架在 Intel
硬件上“跑得快、跑得稳、易规模化”。
加入我们,你将直接参与 真实生产级 AI 框架与算子优化工作,而不是停留在 demo 或 toy project。
实习方向
算子 / Kernel 优化
* 参与高性能算子(如 GEMM、Attention、LayerNorm、MLP、多路算子融合等)的实现与优化
* 利用 SIMD / AMX / oneDNN / XPU backend 等技术提升算子性能
* 对接 PyTorch custom op、Inductor / Triton / SYCL 等技术栈
* 利用LLM自动化算子优化迭代与生成
岗位要求
我们希望你具备以下背景(满足一部分即可):
* 计算机、软件工程、电子工程、人工智能等相关专业在读本科 / 硕士 / 博士
* 熟悉 C/C++ 或 Python,有较好的代码能力
* 对 深度学习框架或系统性能优化 有强烈兴趣
* 具备良好的问题分析能力和工程耐心,愿意深入底层定位性能问题
加分项(非必需,但非常欢迎):
* 熟悉 PyTorch / SGLang / vLLM / Triton / oneDNN 中的一种或多种
* 有性能优化经验:profiling、cache / vectorization / 并行优化
* 了解 CPU / GPU 架构、SIMD、AMX、内存层级等系统知识
* 有开源项目贡献经验(GitHub PR / issue / benchmark 等)
你将获得
* 直接参与 主流 AI 框架和大模型推理系统 的核心优化工作
* 与资深框架 / 性能工程师深度合作,系统性提升工程能力
* 对真实工业级 workload 与 Intel 硬件平台的深入理解
* 表现优秀者可获得 转正 / 推荐 / 长期合作机会