职责描述
职责描述:1. 基础模型研发: 负责经典深度学习模型(如 MLP, LSTM, RNN)的研发工作,针对复杂的时间序列数据或高维特征进行建模与分析。2. Transformer 架构研究: 深入研究 Transformer 架构及其变体,探索 Self Attention 机制在特征提取与序列建模中的创新应用。3. 大模型技术预研: 协助开展大语言模型(LLM)与生成式AI(Generative AI)的前沿技术调研与开发,包括但不限于模型微调(Fine-tuning)、 RAG(检索增强生成)及 AI Agent 的设计。4. 算法设计与评估: 负责AI模型的数据处理、特征工程以及算法性能的评估与验证,撰写技术文档与研究报告。岗位要求:1. 学历背景: 硕士或博士在读,计算机、人工智能、数学、统计学或相关理工科专业。2. 理论基础:具有扎实的机器学习与深度学习理论功底,深入理解 MLP(多层感知机)、LSTM(长短期记忆网络) 的内部原理与梯度传播机制。精通 Transformer 架构,深刻理解 Attention 机制、Encoder-Decoder 结构以及位置编码(Positional Encoding)原理。3. 编程能力: 具备良好的编程习惯,熟练掌握 Python 语言,熟练使用 PyTorch 或 TensorFlow 等主流深度学习框架。4. 加分项:具有 NLP(自然语言处理)或 CV(计算机视觉)相关领域的研究经历。熟悉大模型开源生态(如 Llama, Hugging Face)或有相关项目实战经验者优先。5. 学术成果: 在人工智能领域顶级会议/期刊(如 CVPR, ICML, NeurIPS, ICLR, AAAI, ACL 等)发表过论文者优先。6. 标定工具的管理与开发:负责部门标定工具的日常管理,以及工具管理系统的维护。7. 部门经理交代的其他部门管理工作。投递岗位即默认同意博世集团网上招聘相关隐私协议协议地址:请通过访问博世中国官方主页,博世在中国>加入博世>工作机会,在网上招聘数据隐私声明;