职位描述
公司自研产品,非外包,但是项目原因需要广州白云附近驻场1年,1年后返回公司办公,请留意!!
【岗位职责】
1. 负责人物行为识别算法的设计与优化,针对预设动作序列(如操作步骤、指令响应等)构建时序特征分析与偏差检测模型;
2. 结合大模型(如视觉/语言多模态大模型)编码层能力,改进传统视觉模型的上下文理解与时序建模性能,提升复杂场景下的动作细节捕捉能力;
3. 处理行为数据中的时序依赖问题,设计符合固定流程特点的特征提取与匹配策略,支持动作缺失、顺序错位、执行偏差等多类型异常检测;
4. 参与数据标注规范制定与高质量训练集构建,结合业务场景优化样本分布,提升模型对边缘场景(如模糊动作、干扰环境)的泛化能力;
5. 跟踪算法效果,通过量化指标评估模型性能,持续迭代优化以满足业务对实时性与鲁棒性的要求;
6. 配合工程团队完成模型部署与落地,支持端侧/服务端推理优化,保障实际场景中的高效运行。
【任职要求】
1. 硕士及以上学历,计算机视觉、模式识别、人工智能等相关专业优先;
2. 扎实的机器学习与计算机视觉基础,熟悉主流视觉模型(如CNN、Transformer、3D-CNN)及时序建模方法(如LSTM、Temporal Transformer);
3. 具备多模态大模型(如CLIP、LLaVA、Qwen等)应用或微调经验,熟悉大模型编码层与大视觉模型的融合策略;
4. 有固定流程/标准化动作识别相关项目经验者优先(如工业质检流程监控、服务行业操作规范检测、指令执行合规性验证等);
5. 熟练使用PyTorch深度学习框架,掌握Python/C 编程,具备扎实的代码能力与算法优化经验;
6. 对数据敏感,熟悉行为数据标注规范与质量评估方法,具备从数据到模型效果的全链路分析能力;
7. 良好的沟通能力与团队协作意识,能快速理解业务需求并推动技术方案落地。
【加分项】
1. 发表过计算机视觉/多模态大模型相关顶会论文(如CVPR/ICCV/ECCV/NeurIPS);
2. 有模型压缩、端侧部署(如TensorRT、ONNX)或实时推理优化经验;
3. 熟悉行为识别领域经典数据集或工业级行为分析场景。
4. 具备PyTorch至昇腾920B的迁移调优经验。