职责描述
职位描述
1. 针对大模型的下一代图编译器、算子编译器和量化压缩算法开发。
2. 基于LLVM的GPGPU特定的指令编译方案设计与开发,包含指令选择、指令调度等。
4. 与相关领域专家一起深度程参与自研芯片项目架构设计、硅前硅后AI大模型测试验证、汽车与机器人等场景量产部署全流程。
职位要求
1. 硕士及以上学历,计算机、人工智能、数学、电子信息、自动化、机器人等专业背景。
2. 自我驱动能力强,对技术有追求,工作细致,良好的代码习惯。
3. C++/Python编程能力良好。
加分项
1. 熟悉Triton/IREE/Torch-MLIR/ONNX-MLIR/TPU-MLIR等。
2. 熟悉Tilelang/MLC-LLM/Relay/Relax/Ansor等。
3. 熟悉Cutlass/Cute/Cute DSL/CuTile/TensorRT/TensorRT-LLM等。
4. 熟悉Clang与LLVM编译框架,熟悉SIMT编译优化经验,熟悉CUDA C兼容。
5. 熟悉大模型编译部署优化,尤其是跨级优化如图算融合、算子-指令编译融合等优化。
6. 熟悉CUDA C/Cutlass/CuteDSL/Triton编程。
7. 熟悉Flash Attention系列或相关Attention优化算法。
8. 有编程竞赛获奖。