职位描述
岗位职责
1. 核心模型研发:负责研发面向3D场景理解的先进AI模型,重点聚焦于图像与点云的多模态融合,应用于语义分割、实例分割、目标检测、场景重建等任务。
2. 多模态融合架构设计:探索和设计高效的融合范式(如前融合、特征级融合、结果级融合),以充分发挥图像(纹理、颜色)与点云(几何、深度)的互补优势,提升模型在复杂环境下的鲁棒性与精度。
3. 3D感知算法创新:深入研究基于点云、体素、网格或多视角图像的3D感知算法。
4. 模型轻量化与芯片级优化:对多模态大模型进行轻量化设计、知识蒸馏、量化与硬件友好型结构搜索,确保算法能通用GPU上实现极致的性能、能效与低延迟。
5. 数据闭环构建:参与构建大规模多模态数据集(图像 LiDAR/深度相机),开发自动化数据标注、仿真数据生成及模型迭代流程,驱动算法持续进化。
6. 前沿技术追踪:紧跟多模态学习、3D视觉、自动驾驶感知等领域的最新进展,并将有潜力的技术转化为产品原型。
任职要求
1. 学历与专业:硕士及以上学历,计算机视觉、人工智能、机器人学、自动驾驶及相关专业;至少2年工作经验;
2. 扎实的算法基础:深厚的计算机视觉和深度学习理论基础。
3. 丰富的项目经验:在以下至少一个方向有实际项目经验(包括但不限于顶会论文、竞赛获奖或产品落地):
· 3D点云处理:熟悉点云分割、检测、分类等任务。
· 多模态融合:有将图像与点云/深度信息进行融合处理的项目经验。
· BEV感知:熟悉鸟瞰图视角下的感知算法开发。
4. 强大的工程能力:具备优秀的代码实现、调试与优化能力。
5. 芯片部署意识:对算法在边缘端芯片的部署有基本认知,了解模型压缩、加速的基本概念。