职位描述
(用人单位 下属公司 重庆物康科技有限公司)
工作职责:
(1)深入理解行业(地灾)业务需求,针对性开展计算机视觉、多模态及大规模视觉语言模型算法的创新研究,并将算法应用于业务场景,实现技术落地;
(2)设计并开发高效的多模态视觉识别算法和大模型,处理图像、视频、文本、音频等多种数据源;实现跨模态信息整合与理解,提升算法在复杂场景下的适应性和准确性;
(3)负责数据集的收集、清洗、标注工作,确保数据质量满足模型训练和评估需求;
(4)实施模型的部署工作,监控模型性能,并建立反馈机制以持续优化模型表现;
(5)跟踪机器视觉和多模态技术的前沿进展,探索新的科研问题,推动技术发展;
(6)完成相关技术文档的编写。
(7)完成领导交办的其他工作事项。
任职资格:
(1)全日制硕士及以上学历,数学、计算机等相关专业;
(2)精通Python(Numpy、Pandas)等数据处理技术,数据分析能力强,能从数据中获得足够洞察;
(3) 熟练使用Pytorch机器学习框架,有独立开展算法研究的经验,了解时空序列预测、异常检测等算法应用,了解transformer、LSTM、U-net等模型架构原理;
(4)编程习惯良好,熟练掌握数据结构;
(5)工作认真、有责任心,具有良好的团队协作精神。