得早学就创

Artificial Intelligence-算法实习生（

招聘时间

即日起至 2026-12-30

招聘单位

滴滴

所在地区

北京

工作地点

北京/中关村壹号（B1&A2&A3）-北京市海淀区北清路81号中关村壹号B1座4层、11层；3号楼1

学历要求

硕士

实习时长

每周5天，每天3小时

职责描述

岗位名称
AIGC算法实习生（图像生成 / 视频生成）

1. 岗位职责
1) 参与图像生成、视频生成、多模态生成方向的算法研发与实验，包括但不限于：
- 文生图、图生图、视频生成、视频编辑、一致性角色生成、可控生成等任务
- Diffusion、Transformer、VAE、Flow Matching、Consistency Model、WAN 等生成模型的训练与优化

2) 参与生成式模型的数据建设与清洗工作，包括：
- 图像/视频/文本数据采集、清洗、标注与质量评估
- 构建训练集、验证集和评测集，迭代数据策略以提升生成质量

3) 参与模型训练、微调和效果优化，包括：
- 基于开源或自研模型进行 SFT / LoRA / DreamBooth / ControlNet / Adapter 等方向探索
- 优化生成质量、风格一致性、人物一致性、时序一致性、可控性和推理效率

4) 参与评测体系建设，包括：
- 建立图像/视频生成效果评估指标与 benchmark
- 从画质、语义对齐、时序稳定性、可控性、用户体验等维度分析模型效果

5) 参与模型落地与工程化，包括：
- 推理加速、显存优化、训练效率优化
- 支持模型服务化部署、接口联调、实验平台接入与线上效果验证

6) 跟踪前沿技术进展，包括：
- 阅读并复现图像生成、视频生成、多模态理解与生成相关论文
- 输出实验报告、复现文档和优化建议，推动方案快速迭代

任职资格：
学历与院校
1) 硕士优先；计算机、人工智能、自动化、电子信息、数学、统计等相关专业
2) 目标院校建议：
- 海内外重点高校优先，如清华、北大、上交、复旦、浙大、中科大、南大、哈工大、北航、同济、华科、电子科大、港前三，以及海外知名高校相关专业
3) 每周可实习最好 5 天，连续实习 3 个月以上，能长期实习者优先

语言要求
1) 具备良好的英文阅读能力，能够高效阅读并理解英文论文、技术博客与开源项目文档
2) 具备清晰的中文表达和书面总结能力，能够独立撰写实验记录、评测报告和复盘文档

技能要求
1) 扎实的机器学习/深度学习基础，理解以下内容中的一部分或多部分：
- CNN、Transformer、Attention、Diffusion Model、VAE、GAN、时序建模
2) 熟练使用 Python，熟悉 PyTorch，具备独立训练和调试模型的能力
3) 熟悉常见生成式 AI 工具链或框架者优先：
- Hugging Face Transformers / Diffusers
- Deepspeed / Accelerate / xFormers / Flash Attention
- OpenCV、FFmpeg、PIL、Numpy、Pandas 等
4) 熟悉 Linux 开发环境，掌握基本工程能力：
- Git、Shell、实验管理、日志分析、GPU 调试、性能排查
5) 具备一定论文复现能力，能根据论文或开源仓库完成训练、推理、调参和效果分析

优先条件
1) 有以下任一经验者优先：
- 文生图、视频生成、视频编辑、数字人、虚拟人、角色一致性生成
- 图像编辑、风格迁移、超分、插帧、视频理解、多模态模型
- LoRA / DreamBooth / ControlNet / IP-Adapter / ComfyUI / Stable Diffusion / SDXL / Flux / Wan / CogVideo / Sora-like 方向经验
2) 有公开项目、比赛、论文、开源贡献、技术博客或作品集者优先
3) 有大规模训练、推理加速、分布式训练或模型部署经验者优先

性格与软素质要求
1) 对 AIGC、图像生成、视频生成方向有强烈兴趣，愿意快速学习新技术
2) 有较强的自驱力和好奇心，能主动发现问题、提出假设并推进验证
3) 具备良好的实验习惯，做事细致，能规范记录实验过程和结果
4) 具备较强沟通协作能力，能与算法、产品、设计、工程团队高效配合