职责描述
岗位名称
AIGC算法实习生(图像生成 / 视频生成)
1. 岗位职责
1) 参与图像生成、视频生成、多模态生成方向的算法研发与实验,包括但不限于:
- 文生图、图生图、视频生成、视频编辑、一致性角色生成、可控生成等任务
- Diffusion、Transformer、VAE、Flow Matching、Consistency Model、WAN 等生成模型的训练与优化
2) 参与生成式模型的数据建设与清洗工作,包括:
- 图像/视频/文本数据采集、清洗、标注与质量评估
- 构建训练集、验证集和评测集,迭代数据策略以提升生成质量
3) 参与模型训练、微调和效果优化,包括:
- 基于开源或自研模型进行 SFT / LoRA / DreamBooth / ControlNet / Adapter 等方向探索
- 优化生成质量、风格一致性、人物一致性、时序一致性、可控性和推理效率
4) 参与评测体系建设,包括:
- 建立图像/视频生成效果评估指标与 benchmark
- 从画质、语义对齐、时序稳定性、可控性、用户体验等维度分析模型效果
5) 参与模型落地与工程化,包括:
- 推理加速、显存优化、训练效率优化
- 支持模型服务化部署、接口联调、实验平台接入与线上效果验证
6) 跟踪前沿技术进展,包括:
- 阅读并复现图像生成、视频生成、多模态理解与生成相关论文
- 输出实验报告、复现文档和优化建议,推动方案快速迭代
任职资格:
学历与院校
1) 硕士优先;计算机、人工智能、自动化、电子信息、数学、统计等相关专业
2) 目标院校建议:
- 海内外重点高校优先,如清华、北大、上交、复旦、浙大、中科大、南大、哈工大、北航、同济、华科、电子科大、港前三,以及海外知名高校相关专业
3) 每周可实习最好 5 天,连续实习 3 个月以上,能长期实习者优先
语言要求
1) 具备良好的英文阅读能力,能够高效阅读并理解英文论文、技术博客与开源项目文档
2) 具备清晰的中文表达和书面总结能力,能够独立撰写实验记录、评测报告和复盘文档
技能要求
1) 扎实的机器学习/深度学习基础,理解以下内容中的一部分或多部分:
- CNN、Transformer、Attention、Diffusion Model、VAE、GAN、时序建模
2) 熟练使用 Python,熟悉 PyTorch,具备独立训练和调试模型的能力
3) 熟悉常见生成式 AI 工具链或框架者优先:
- Hugging Face Transformers / Diffusers
- Deepspeed / Accelerate / xFormers / Flash Attention
- OpenCV、FFmpeg、PIL、Numpy、Pandas 等
4) 熟悉 Linux 开发环境,掌握基本工程能力:
- Git、Shell、实验管理、日志分析、GPU 调试、性能排查
5) 具备一定论文复现能力,能根据论文或开源仓库完成训练、推理、调参和效果分析
优先条件
1) 有以下任一经验者优先:
- 文生图、视频生成、视频编辑、数字人、虚拟人、角色一致性生成
- 图像编辑、风格迁移、超分、插帧、视频理解、多模态模型
- LoRA / DreamBooth / ControlNet / IP-Adapter / ComfyUI / Stable Diffusion / SDXL / Flux / Wan / CogVideo / Sora-like 方向经验
2) 有公开项目、比赛、论文、开源贡献、技术博客或作品集者优先
3) 有大规模训练、推理加速、分布式训练或模型部署经验者优先
性格与软素质要求
1) 对 AIGC、图像生成、视频生成方向有强烈兴趣,愿意快速学习新技术
2) 有较强的自驱力和好奇心,能主动发现问题、提出假设并推进验证
3) 具备良好的实验习惯,做事细致,能规范记录实验过程和结果
4) 具备较强沟通协作能力,能与算法、产品、设计、工程团队高效配合