实习岗位详情

数据实习生
 招聘时间
即日起 至 2026-06-13
 招聘单位
科大讯飞
 所在地区
合肥
 工作地点
安徽省/合肥市/蜀山区 科大讯飞股份有限公司
 学历要求
本科
 实习时长
每周5天,每天3小时
 职责描述
核心工作职责
训练数据入湖:负责多源训练数据的采集、清洗、转换,基于Iceberg/Hudi等数据湖架构完成入库,保障数据质量,处理TB级数据入湖及相关技术问题。
训练数据建模:结合算法需求,参与数据模型设计、数仓分层搭建、特征加工,优化模型性能,保障数据查询与调用效率。
数据同步与运维:设计实现离线/实时数据同步方案(Spark/Flink/Kafka等),搭建监控体系,排查同步异常,保障数据稳定流转及任务调优。
数据质量管控:建立数据质量校验规则,开展巡检、输出报告并推动整改,参与数据治理相关工作。
技术支撑与文档:协助技术调研与流程优化,撰写相关技术文档,配合算法团队对接需求。
任职要求(高阶重点)
硬性要求
本科及以上在读(硕士优先),计算机、数据相关专业,2027届优先,有3个月以上数据开发实习经验者优先。
精通SQL,熟练掌握Python/Java/Scala其一,能独立编写数据处理脚本,具备良好代码规范。
熟悉Hadoop生态,掌握Hive、Spark、Flink,了解数据湖、数仓建模,有实际项目经验者优先。
能独立完成训练数据入湖、建模、同步全流程,具备较强问题排查与逻辑思维能力。
加分项
有训练数据处理、特征工程经验,熟悉维度建模者优先。
参与过大数据项目或有相关竞赛成果者优先。
了解MLOps、数据版本管理、血缘追踪工具者优先。
自驱力强、善于学习,具备良好沟通协作能力。
相关实习岗位
查看更多实习岗位

分享

收藏

 

©版权所有 deizao.net(得早学就创) 粤ICP备2024216716号