得早学就创

CV/多模态算法实习生

招聘时间

即日起至 2027-01-01

招聘单位

百度

所在地区

北京

工作地点

北京市/北京市/海淀区鹏寰国际大厦

学历要求

硕士

实习时长

每周5天，每天6小时

职责描述

工作职责
1、负责文档场景相关视觉和多模态算法的研发与优化，包括但不限于图像、视频理解、生成、图像增强。
2、视觉算法功能相关的链路/agent搭建。
3、跟踪并研究视觉和多模态算法的前沿技术，对现有算法进行性能分析和优化，提升算法效率和准确性
4、细心分析和总结现有算法的badcase
任职资格
5、掌握计算机视觉算法，熟悉至少一项计算机视觉技能，如：图像分类/理解/检测/超分/人脸识别等。或多模态/aigc图像理解生成技能。
6、熟悉图像增强重建算法优先，有多模态（VLM）/生成（AIGC）大模型训练落地经验优先
7、在国际顶会或期刊（例如：CVPR, ICCV, ECCV, NIPS, ICML, AAAI, TPAMI, IJCV等）发表过论文者优先
8、责任心强，具有良好的沟通能力和团队合作精神