ai推理优化工程师(020385)
面议



职位描述
岗位职责
1、负责深度学习在线推理引擎的设计与开发,打造低延时,高吞吐的推理引擎;
2、参与神经网络加速技术的调研、探索和落地;
3、负责nlp大模型在实际业务场景中落地。
任职要求
1、本科及以上学历,具备丰富的模型推理加速算法经验,熟悉各类主流加速库,如:tensorrt / cudnn / mkl / xla等;熟悉各类ir,包括不限于onnx;
2、熟悉主流深度学习框架:tensorflow / pytorch,熟悉主流推理引擎:triton / openvino;
3、有算子开发经验,具备深度学习模型性能分析和优化能力;
4、熟悉图优化、混合精度、剪枝、编译优化技术,有实操业务落地经验的优先;
5、熟悉模型部署优化,如模型量化、模型压缩,模型转换,模型稀疏化等;
6、熟练掌握c/c++/python编程,有大模型端到端落地经验者优先;
7、熟悉pytorch源码者优先。
联系方式
推荐职位
-
东方航空杭州疗养院行政管理/综合管理岗位招聘信息 面议西湖区 应届毕业生 2025-08-21中国东方航空股份有限公司
-
建筑机电设计经理 30000-40000元滨江区 本科 应届毕业生 2025-08-20网易(杭州)网络有限公司
-
蚂蚁集团-消费者权益保护专家-客权 30000-50000元西湖区 本科 应届毕业生 2025-08-20蚂蚁科技集团股份有限公司
-
资深前端开发工程师 - 飞书项目 30000-60000元西湖区 本科 应届毕业生 2025-08-20北京字节跳动网络技术有限公司
-
淘天集团-阿里资产-前端工程师 10000-20000元余杭区 本科 应届毕业生 2025-08-20阿里巴巴(中国)有限公司
-
UE客户端开发工程师(战斗/3C方向)-【游戏事业部】 40000-80000元滨江区 本科 应届毕业生 2025-08-20北京快手科技有限公司