职责描述
工作职责:
1. 负责视觉产品相关的数据集建立、清洗、标注与增强处理,保障数据质量与规模;
2. 参与数据链路的整体维护,包括数据采集、存储、预处理与版本管理;
3. 基于Python和YOLO模型进行现有功能的迭代开发与优化;
4. 参与产品新功能模块的设计与实现,如目标检测、跟踪、分类等;
5. 探索并将大模型微调技术(如多模态、视觉Transformer等)引入后续产品升级中。
任职要求:
1. 计算机、人工智能、自动化等相关专业本科或硕士在读,能保证3个月以上实习,每周至少3天;
2. 熟悉Python,有PyTorch/TensorFlow等深度学习框架使用经验;
3. 了解YOLO系列目标检测算法,有实际训练或部署经验者优先;
4. 了解常见数据集处理工具(如LabelImg、CVAT等)及数据增强方法;
加分项:
1. 熟悉大模型微调(LoRA、QLoRA等)或多模态模型(CLIP、LLaVA等);
2. 有CUDA编程或模型轻量化经验;
3. 熟悉Docker、Git、Linux开发环境;
4. 有完整视觉项目落地经历(比赛、课程设计或开源贡献)。
实习收获:
1. 接触真实工业级视觉产品全流程,积累数据集与模型落地经验;
2. 有机会参与大模型微调前沿探索,获得技术指导;
3. 提供表现优异者的转正机会。