職位描述
該職位信息待核驗,請仔細了解后再進行投遞!
職位概述
我們在招聘算法架構工程師,面向網約車核心算法與大模型業務,負責大模型訓練與推理性能優化、線上推理服務與自動化更新架構建設,并持續提升網約車算法服務的基礎性能與穩定性,支撐核心業務規模化增長與高可用運行。
工作職責
1. 大模型訓練/推理性能優化
● 負責大模型訓練與推理鏈路的性能優化:吞吐、時延、顯存占用與成本優化。
● 推進并落地訓練/推理加速方案(并行訓練、混合精度、編譯/算子優化、KV Cache、批處理/動態batch等),提升整體效率與穩定性。
2. 自動化更新與線上推理服務架構
● 負責線上推理服務的系統架構設計與落地:服務化、彈性伸縮、灰度發布、回滾、限流熔斷、監控告警等。
● 建設模型自動化更新能力:模型版本管理、自動化評測/準入、發布流水線與可觀測性,保障模型迭代效率與線上風險可控。
3. 網約車算法服務基礎性能優化
● 面向網約車核心算法服務(定價/分單/供需預測等)進行基礎性能優化:延遲、吞吐、穩定性與資源成本。
● 聯合算法與工程團隊優化數據鏈路、特征/召回/打分等關鍵路徑,提升服務SLA與線上效果穩定性。
任職要求
● 計算機相關背景,具備扎實的系統工程能力與性能優化經驗(C /Go/Java 任一熟悉,Python 熟悉加分)。
● 有模型訓練或推理系統經驗,理解GPU/CPU算力、內存/顯存、網絡與存儲等性能瓶頸定位方法。
● 熟悉在線服務基礎設施與工程體系:服務治理、容器化/集群資源管理(如K8s)、CI/CD、監控可觀測性等。
● 良好的跨團隊協作能力,能與算法、平臺、業務團隊高效推動落地。
加分項
● 有大模型推理框架/加速經驗(如TensorRT/ONNX Runtime/vLLM/Triton等任一方向)或分布式訓練經驗。
● 有高并發低延遲在線系統性能治理經驗(Profiling、壓測、容量規劃、故障演練等)。
● 有模型發布與MLOps體系建設經驗(評測準入、自動化發布、灰度與回滾、模型可觀測性)。
工作地點
地址:杭州濱浦路與東冠路交叉口東北方
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。
職位發布者
戴HR
杭州優行科技有限公司
-
請選擇
-
公司規模未知
-
公司性質未知
-
杭州市濱江區江陵路1760號1號樓602室

應屆畢業生
本科
2026-04-29 18:39:36
482人關注
注:聯系我時,請說是在江蘇人才網上看到的。
