职责描述
岗位职责:
1、支持视觉算法相关的研究和开发,包括但不限于OCR、视觉/多模态大模型、通用结构化信息提取、人脸识别、语音等方向
2、跟踪和探索视觉大模型、多模态大模型、通用结构化前沿问题,参与模型的设计、训练、调优及评测工作,并推进视觉大模型、多模态大模型等在业务场景的应用落地。
任职资格:
1、计算机视觉、机器学习、人工智能等相关专业;
2、在计算机视觉、多模态理解等方面有扎实的研究基础,熟悉主流模型和算法,如CLIP/Transformer等,熟悉大模型基础原理,有LLM或者多模态大模型落地经验者优先
4、具有较强的好奇心、自驱力和算法/模型创新能力;
5、高质量论文发表者优先(如CVPR、AAAI、NIPS、ICCV