職位描述
該職位已進行加V認證,請放心投遞
崗位職責
1、負責深度學習在線推理引擎的設計與開發(fā),打造低延時,高吞吐的推理引擎;
2、參與神經網絡加速技術的調研、探索和落地;
3、負責nlp大模型在實際業(yè)務場景中落地。
任職要求
1、本科及以上學歷,具備豐富的模型推理加速算法經驗,熟悉各類主流加速庫,如:tensorrt / cudnn / mkl / xla等;熟悉各類ir,包括不限于onnx;
2、熟悉主流深度學習框架:tensorflow / pytorch,熟悉主流推理引擎:triton / openvino;
3、有算子開發(fā)經驗,具備深度學習模型性能分析和優(yōu)化能力;
4、熟悉圖優(yōu)化、混合精度、剪枝、編譯優(yōu)化技術,有實操業(yè)務落地經驗的優(yōu)先;
5、熟悉模型部署優(yōu)化,如模型量化、模型壓縮,模型轉換,模型稀疏化等;
6、熟練掌握c/c++/python編程,有大模型端到端落地經驗者優(yōu)先;
7、熟悉pytorch源碼者優(yōu)先。
工作地點
地址:杭州杭州市 | 研發(fā)類 | 若干人
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。
職位發(fā)布者
HR
維沃移動通信有限公司
-
通信/電信
-
1000人以上
-
私營·民營企業(yè)
-
東莞市長安鎮(zhèn)烏沙步步高大道283號

應屆畢業(yè)生
學歷不限
2026-04-10 07:45:12
4390人關注
注:聯(lián)系我時,請說是在江蘇人才網上看到的。
