職位描述
該職位已進(jìn)行加V認(rèn)證,請放心投遞
職位描述:
1. 主導(dǎo)大模型系統(tǒng)架構(gòu)設(shè)計:
負(fù)責(zé)RAG系統(tǒng)的整體架構(gòu)設(shè)計,包括存儲層、檢索層、推理層與緩存層的技術(shù)選型與實現(xiàn)。
構(gòu)建高可用、低延遲的分布式推理服務(wù)框架,支持向量數(shù)據(jù)庫集成(如Milvus、Elastic)、知識庫管理與多模態(tài)檢索優(yōu)化。
設(shè)計并實現(xiàn)Agent工作流編排框架,支持工具調(diào)用(MCP協(xié)議)、任務(wù)規(guī)劃與自動化執(zhí)行。
2.模型部署與性能優(yōu)化:
負(fù)責(zé)大模型(LLM/VLM)的本地化部署、量化壓縮、動態(tài)批處理與推理加速,優(yōu)化GPU/CPU異構(gòu)算力利用率。
3. AI服務(wù)平臺開發(fā):
基于Java/Go/Python構(gòu)建高并發(fā)、可擴(kuò)展的AI微服務(wù),與現(xiàn)有業(yè)務(wù)系統(tǒng)深度集成,實現(xiàn)模型訓(xùn)練-部署-監(jiān)控的全鏈路管理。
4.技術(shù)領(lǐng)導(dǎo)與跨團(tuán)隊協(xié)作:
指導(dǎo)中級工程師,制定技術(shù)方案,并主導(dǎo)技術(shù)攻關(guān)。與產(chǎn)品、算法、基礎(chǔ)設(shè)施團(tuán)隊協(xié)作,定義需求并推動工程落地。
職位要求:
1.計算機(jī)科學(xué)、人工智能或相關(guān)領(lǐng)域本科及以上學(xué)歷,5年以上大型服務(wù)端開發(fā)經(jīng)驗,3年以上AI系統(tǒng)相關(guān)項目經(jīng)驗
2.有牽頭大型AI工程項目經(jīng)驗,具備一定的團(tuán)隊管理或技術(shù)領(lǐng)導(dǎo)經(jīng)驗
3. 具備扎實的 Java 編程基礎(chǔ),熟悉常用的 Java 開發(fā)框架,包括不限于Spring,SpringMvc、SpringBoot、Spring Cloud,有高并發(fā)分布式系統(tǒng)開發(fā)經(jīng)驗
4. 熟悉常用數(shù)據(jù)庫,包括不限于Mysql、MongoDB、ES、Redis等,熟悉常用的消息中間件
5. 熟悉python/GO開發(fā)語言,能進(jìn)行一般的python/Go項目開發(fā)
6. 能夠快速理解業(yè)務(wù)需求,具備良好的溝通能力,將業(yè)務(wù)需求準(zhǔn)確轉(zhuǎn)化為技術(shù)方案
7. 善于學(xué)習(xí)和總結(jié),有團(tuán)隊合作精神和較強(qiáng)執(zhí)行力,較強(qiáng)的問題解決能力、跨團(tuán)隊溝通能力和技術(shù)規(guī)劃能力。
【加分項】
?1. 精通Transformer架構(gòu)、RAG技術(shù)棧、向量數(shù)據(jù)庫優(yōu)化與多模態(tài)檢索策略者優(yōu)先。
?2. 掌握vLLM/SGLang/TensorRT-LLM推理框架中至少一種模型部署方法,掌握模型量化、算子融合、投機(jī)采樣等優(yōu)化技術(shù)者優(yōu)先。
3. 對AI技術(shù)前沿(如Agent、多模態(tài))有持續(xù)跟蹤熱情者優(yōu)先。
工作地點
地址:武漢洪山區(qū)武漢-洪山區(qū)小米武漢總部武漢小米總部
??
點擊查看地圖
詳細(xì)位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓(xùn)費、身份證、畢業(yè)證等),均涉嫌違法,請求職者務(wù)必提高警惕。
職位發(fā)布者
hrHR
小米科技有限責(zé)任公司
-
通信/電信/網(wǎng)絡(luò)設(shè)備/增值服務(wù)
-
1000人以上
-
私營·民營企業(yè)
-
北京市海淀區(qū)清河中街68號華潤五彩城寫字樓
相似職位

應(yīng)屆畢業(yè)生
本科
2026-02-18 07:57:53
3520人關(guān)注
注:聯(lián)系我時,請說是在江蘇人才網(wǎng)上看到的。
