职责描述
日常实习:面向全体在校生,为符合岗位要求的同学提供为期3个月及以上的项目实践机会。
团队介绍:作为一家拥有自主创新和研发创造能力的科技品牌,PICO致力于成为领先的世界级XR平台,成就开发者与创作者,共同为全球消费者创造更美好的生活体验。我们开创性地将虚拟现实扩展到了多个领域,为运动、视频、娱乐等消费级场景带来了全新体验;并广泛应用在教育、医疗和企业培训等商用场景,给全球企业级用户提供了多元化的VR解决方案。
1、负责音频感知相关算法研发,方向包括但不限于麦克风阵列信号处理、声源定位、目标说话人检测与跟踪、语音增强、语音分离及多模态视听融合;
2、面向真实使用场景,研究复杂噪声、多人交互、佩戴运动、遮挡干扰等条件下的鲁棒音频感知算法,提升设备在实际场景中的语音采集质量与目标说话人感知能力;
3、结合麦克风阵列、RGB相机、IMU等多传感器信息,参与视听联合感知算法设计,构建面向下一代空间音频理解与主动交互能力;
4、参与音频算法的数据处理、训练评测、问题分析与效果优化,推动算法方案从离线验证走向端侧实时运行与产品化落地。
职位要求
1、硕士及以上学位在读,计算机、电子、通信、自动化、声学等相关专业;
2、全职实习大于3个月,具备扎实的数学基础和算法基础,熟悉数字信号处理、机器学习或深度学习相关知识;
3、熟悉Python,具备良好的代码实现能力,熟悉PyTorch、TensorFlow等至少一种深度学习框架;
4、对以下一个或多个方向有项目或研究经验者优先:
1)麦克风阵列信号处理;
2)声源定位与跟踪;
3)语音增强、降噪、分离;
4)说话人识别或目标说话人提取;
5)音视频多模态学习;
5、具备良好的论文阅读、实验设计、结果分析和问题定位能力。