职责描述
岗位概述
英特尔 DCG 中国正在招聘一名研究实习生,参与面向 KV Cache 中心化系统 的 Scale‑up 协议与内存池化(Memory Pooling)
技术研究。该岗位将聚焦新一代 AI 超节点(Supernode)架构,在系统性能、成本效率及规模化部署方面开展前沿探索,支持大规模 AI 推理与训练场景。
工作职责
* 解耦式超节点架构的系统创新与成本优化
* 研究解耦式(Disaggregated)AI 超节点架构设计中的关键技术与系统级权衡
* 分析不同架构方案在性能、扩展性以及 BOM 成本方面的影响
* 支持架构方案从 NPI(新产品导入)到 HVM(规模化量产)的可扩展性评估
* GPU 互连协议与内存池化技术研究
* 研究并实现基于以太网的 GPU 互连协议原型
* 探索面向大规模 AI 推理与训练集群的分布式内存池化机制
* 支持 KV Cache 等关键数据路径的系统级优化
任职要求
* 电气工程、计算机工程、计算机科学或相关专业硕士在读
* 熟悉 RDMA 核心机制,包括单边读/写、Send/Receive verbs、QP 管理以及内存注册
* 具备 Mellanox ConnectX‑7 相关测试与调试经验,熟悉 perftest、ibstat、mlnx_tuning 及 OFED 工具集
* 了解大语言模型(LLM)推理性能评测方法及常用指标(如 TTFT、TBT、token/s),并具有使用
vLLM、lm‑evaluation‑harness 或同类框架的经验