职责描述
岗位职责:
- 开发 PySpark 数据同步脚本(MongoDB → Hive → ClickHouse)
- 参与数据仓库建模、ETL 流程设计与实现
- 开发 Flink SQL 实时计算和 Hive SQL 离线处理任务
- 参与线上标签服务维护,配合测试解决数据问题
- 参与分类模型做数据探索分析
- 数据质量监控和数据治理
任职要求:
- 硕士在读,计算机/软件/信息管理/数学等相关专业
- 熟悉 Python 或 Java,编程基础扎实
- 熟悉 MySQL 或 MongoDB,能写 SQL
- 对数据仓库、大数据技术有浓厚兴趣
- 学习能力强,沟通好,能快速适应
加分项
- 数据 Agent 或 AI 应用项目经验
- 数据仓库或大数据项目实习经验
- 熟悉 Tableau / PowerBI 等可视化工具
- 英文技术文档读写能力
- **Vibe Coding**:能熟练使用 Cursor、Claude Code 等 AI 编程工具高效开发