当前位置:首页>职位列表>职位详情
ai推理优化工程师(020385) 面议
杭州 应届毕业生 不限
维沃移动通信有限公司 2024-05-02 14:35:31 1179人关注
职位描述

岗位职责

1、负责深度学习在线推理引擎的设计与开发,打造低延时,高吞吐的推理引擎;

2、参与神经网络加速技术的调研、探索和落地;

3、负责nlp大模型在实际业务场景中落地。

任职要求

1、本科及以上学历,具备丰富的模型推理加速算法经验,熟悉各类主流加速库,如:tensorrt / cudnn / mkl / xla等;熟悉各类ir,包括不限于onnx;

2、熟悉主流深度学习框架:tensorflow / pytorch,熟悉主流推理引擎:triton / openvino;

3、有算子开发经验,具备深度学习模型性能分析和优化能力;

4、熟悉图优化、混合精度、剪枝、编译优化技术,有实操业务落地经验的优先;

5、熟悉模型部署优化,如模型量化、模型压缩,模型转换,模型稀疏化等;

6、熟练掌握c/c++/python编程,有大模型端到端落地经验者优先;

7、熟悉pytorch源码者优先。

联系方式
注:联系我时,请说是在今日招聘网上看到的。
工作地点
地址:杭州杭州市 | 研发类 | 若干人
以担保或任何理由索取财物,扣押证照,均涉嫌违法,请提高警惕

若您已有简历,可直接登录登录

  • 省份

    注:0表示面议
    获取验证码
    保存并投递
    投递简历
      马上投递
      投递简历
        马上投递

        企业
        服务热线

        • 400-6680-889
        1. 登录
        2. 注册
        客户服务热线:
        400-6680-889
        在线客服:
        点击这里给我发消息 898995850
        工作日:
        8:30-18:00