职位描述
职责描述:
1.负责ARM架构,或其他微处理器上的算子开发;
2.负责Tengine框架-前端/IR功能开发;
3.各种训练框架模型适配,计算图/多线程/内存池性能调优。
4.实现AI推理框架Tengine适配各家NPU,推进Tengine更新迭代;
5.支持视觉检测/识别、语音识别等算法模型在Tengine上部署及调试;
6.各种训练框架模型适配,计算图/多线程/内存池性能调优。
任职要求:
1.5年以上C/C 编程经验。
2.有ARM Linux嵌入式开发经验,有底层调试经验;
3.有NCNN、MNN、TF-Lite等端侧推理框架使用经验优先;
4.有AI算法和图像处理开发经验者优先;
5.了解深度学习算法和算子定义(如Convolution、Pooling、BN、Activation)、layer计算方式、量化训练;
6.熟悉至少一种深度学习训练框架及其模型文件的解析,如Caffe/MXNet/TensorFlow/PyTorch;
7.了解一种开源的AI Compiler(AI编译器);
8.用过ARM汇编(如ARMv7/v8-A、多线程编程,内存管理技术)或者intrinsics 优先。