职责描述
工作职责:
1.模型 Scaling Up 与底层架构重构: 深入参与广告精排大模型的演进,告别传统冗余的交叉结构,探索如 Token Mixer 等 Hardware-aligned 的极简网络拓扑;在严格的在线 P99 延迟约束下,优化 GPU MFU,实现参数量级的有效跃迁。
2.端到端超长序列建模: 依托全域(推荐/搜索/广告)大一统的特征基建,参与 1K 乃至 10 万级超长泛行为序列的端到端入图;突破传统 Attention 复杂度墙,利用目标感知与分段压缩机制,挖掘长尾用户的巨大商业价值。
3.多模态表征与生成式召回: 结合 最新最潮的 Qwen 等MLLM基座,打通“内容语义”与“用户行为”的隐式关联,产出多模态表征;探索并落地基于以上表征的生成式召回,拓展广告商业流量边界。
4.跨场域 OneModel 融合探索: 参与构建连接搜索、推荐、广告的统一基座模型(OneModel),打通多场景实时流序列特征,优化全链路漏斗(CTR/CVR)的匹配精度与转化效率。
任职资格:
1.基础要求: 硕士及以上学历,计算机、机器学习、深度学习等相关专业,算法理论功底扎实,代码能力过硬(Python/C++,熟悉 TensorFlow/PyTorch 等框架)。
2.业务加分: 对广告推荐业务有浓厚兴趣,了解召回 / 粗排 / 精排链路,有实际的 CTR/CVR 预估模型优化或大厂实习经验者优先。
3.技术加分(满足其一即可):
a.深入了解并实战过 LLM / 多模态大模型 / 生成式推荐 / 超长序列建模。
b.具备一定的系统工程视角,了解底层算子原理、GPU 体系结构或有高性能计算/推理加速(如 TensorRT、通信压缩)经验。
c.极客与学术加分: 具备前沿技术敏感度,在 SIGIR、KDD、NIPS 等顶会发表过相关论文,或在主流开源社区有深度贡献者优先。