职责描述
【岗位职责】
1. 根据业务需求,负责代码类数据集设计与构建,制定高质量数据生产标准;具备研发(RD)视角,从技术逻辑拆解评测需求、覆盖全面维度,推动数据高效生产并优化模型效果与性能。
2. 协同算法、产品等相关方,主导/参与评测规则研讨、争议案例对齐与策略优化,推动团队达成专家集体体感共识;优化评测工具,保障产品功能落地符合用户需求与科学标准。
3. 执行需求过程中,灵活运用智能化方法与工具提升数据生产效率及质量;凭借多方位思考能力规避同一案例的场景化评测偏差,按计划完成任务分配与成果持续优化。
4. 按计划完成数据交付,负责数据验收与质量核查;精准撰写评测备注、复盘报告等文档,输出严谨可追溯的成果;总结项目经验,提炼最佳实践方法论并向团队输出。
5. 负责团队专业培训,聚焦评测思维、研讨协作等核心素养提升;解答项目疑难问题,记录反馈并协助优化流程与工具;引导建立“共识导向”作业意识,推动团队效率与质量双升。
【任职要求】
1. 本科及以上学历,计算机相关专业背景(软件工程、计算机科学与技术、人工智能、数据科学与大数据技术等),具备代码类专业核心素养。
2. 精通至少一门主流编程语言(Java、Python、C/C++/C#、JavaScript、Go等),具备扎实的编程基础与技术思维,能站RD视角分析数据问题。
3. 对人工智能领域充满热情,具备出色的业务理解与逻辑思维能力;拥有多方位思考能力,能从不同专家视角审视评测对象,规避主观偏差;具备开放迭代心态,能接受观点优化与成果复盘迭代。
4. 具备高效沟通协调能力,能清晰表达观点、推进团队研讨共识;具备精准文字描述能力,可独立撰写项目规则、评测报告、复盘文档等标准化材料。
5. 学习能力强,善于思考总结,能独立分析解决项目疑难问题;具备较强的抗压能力、执行力与团队协作意识,认同评测成果是团队集体输出,聚焦最终交付物的科学性。
【加分项】
1. 有实际开发经验,熟悉算法设计或参与过AI评测相关项目。
2. 熟悉codex、claude code等主流代码agent。
3. 参与过复杂数据集构建或评测项目,具备争议案例研讨、规则优化的实践经验,并能提出有效优化建议。
4. 有运用 AI Agent 技术搭建自动化流程、智能化数据生产经验