職位描述
該職位信息待核驗,請仔細了解后再進行投遞!
職位概述
我們在招聘算法架構(gòu)工程師,面向網(wǎng)約車核心算法與大模型業(yè)務,負責大模型訓練與推理性能優(yōu)化、線上推理服務與自動化更新架構(gòu)建設,并持續(xù)提升網(wǎng)約車算法服務的基礎性能與穩(wěn)定性,支撐核心業(yè)務規(guī)?;鲩L與高可用運行。
工作職責
1. 大模型訓練/推理性能優(yōu)化
● 負責大模型訓練與推理鏈路的性能優(yōu)化:吞吐、時延、顯存占用與成本優(yōu)化。
● 推進并落地訓練/推理加速方案(并行訓練、混合精度、編譯/算子優(yōu)化、KV Cache、批處理/動態(tài)batch等),提升整體效率與穩(wěn)定性。
2. 自動化更新與線上推理服務架構(gòu)
● 負責線上推理服務的系統(tǒng)架構(gòu)設計與落地:服務化、彈性伸縮、灰度發(fā)布、回滾、限流熔斷、監(jiān)控告警等。
● 建設模型自動化更新能力:模型版本管理、自動化評測/準入、發(fā)布流水線與可觀測性,保障模型迭代效率與線上風險可控。
3. 網(wǎng)約車算法服務基礎性能優(yōu)化
● 面向網(wǎng)約車核心算法服務(定價/分單/供需預測等)進行基礎性能優(yōu)化:延遲、吞吐、穩(wěn)定性與資源成本。
● 聯(lián)合算法與工程團隊優(yōu)化數(shù)據(jù)鏈路、特征/召回/打分等關(guān)鍵路徑,提升服務SLA與線上效果穩(wěn)定性。
任職要求
● 計算機相關(guān)背景,具備扎實的系統(tǒng)工程能力與性能優(yōu)化經(jīng)驗(C /Go/Java 任一熟悉,Python 熟悉加分)。
● 有模型訓練或推理系統(tǒng)經(jīng)驗,理解GPU/CPU算力、內(nèi)存/顯存、網(wǎng)絡與存儲等性能瓶頸定位方法。
● 熟悉在線服務基礎設施與工程體系:服務治理、容器化/集群資源管理(如K8s)、CI/CD、監(jiān)控可觀測性等。
● 良好的跨團隊協(xié)作能力,能與算法、平臺、業(yè)務團隊高效推動落地。
加分項
● 有大模型推理框架/加速經(jīng)驗(如TensorRT/ONNX Runtime/vLLM/Triton等任一方向)或分布式訓練經(jīng)驗。
● 有高并發(fā)低延遲在線系統(tǒng)性能治理經(jīng)驗(Profiling、壓測、容量規(guī)劃、故障演練等)。
● 有模型發(fā)布與MLOps體系建設經(jīng)驗(評測準入、自動化發(fā)布、灰度與回滾、模型可觀測性)。
工作地點
地址:杭州濱浦路與東冠路交叉口東北方
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務必提高警惕。
職位發(fā)布者
戴HR
杭州優(yōu)行科技有限公司
-
請選擇
-
公司規(guī)模未知
-
公司性質(zhì)未知
-
杭州市濱江區(qū)江陵路1760號1號樓602室

應屆畢業(yè)生
本科
2026-04-09 14:30:12
277人關(guān)注
注:聯(lián)系我時,請說是在江蘇人才網(wǎng)上看到的。
