职责描述
工作职责
1、负责文档场景相关视觉和多模态算法的研发与优化,包括但不限于图像、视频理解、生成、图像增强。
2、视觉算法功能相关的链路/agent搭建。
3、跟踪并研究视觉和多模态算法的前沿技术,对现有算法进行性能分析和优化,提升算法效率和准确性
4、细心分析和总结现有算法的badcase
任职资格
5、掌握计算机视觉算法,熟悉至少一项计算机视觉技能,如:图像分类/理解/检测/超分/人脸识别等。或多模态/aigc图像理解生成技能。
6、熟悉图像增强重建算法优先,有多模态(VLM)/生成(AIGC)大模型训练落地经验优先
7、在国际顶会或期刊(例如:CVPR, ICCV, ECCV, NIPS, ICML, AAAI, TPAMI, IJCV等)发表过论文者优先
8、责任心强,具有良好的沟通能力和团队合作精神