職位描述
該職位已進(jìn)行加V認(rèn)證,請放心投遞
職位描述:參與內(nèi)部異構(gòu)大模型推理引擎優(yōu)化,支持大模型推理各種優(yōu)化技術(shù)在異構(gòu)硬件上的落地。包括但不限于:
1、參與日常推理引擎的優(yōu)化開發(fā),不斷優(yōu)化大模型業(yè)務(wù)在對應(yīng)硬件上的TTFT、TPOT等指標(biāo);關(guān)注業(yè)界最佳實(shí)踐,能將業(yè)界最佳實(shí)踐落地到內(nèi)部的引擎優(yōu)化中;
2、完成各種大模型推理所需的功能性開發(fā)任務(wù);
3、參與支持日常的大模型推理服務(wù)部署,參與內(nèi)部日常提效工具的研發(fā)。
任職要求:1、有扎實(shí)的C 工程基礎(chǔ);
2、有大模型相關(guān)訓(xùn)練或推理優(yōu)化經(jīng)驗(yàn);有vLLM、TensorRT-LLM、MLC-LLM 等框架之一的實(shí)踐經(jīng)驗(yàn);熟悉LLM infer 相關(guān)技術(shù)棧,熟悉TP/PP/DP等分布式通信原理等;
3、熟悉CUDA 或 ROCM,熟悉Nsight System/ Nsight Compute 工具的使用,有 GPU 或 ASIC 高性能算子開發(fā)經(jīng)驗(yàn);
4、了解AI infra 整體技術(shù)棧需求,有訓(xùn)練框架或推理框架實(shí)戰(zhàn)經(jīng)驗(yàn)、熟悉TensorRT、TVM 等框架的使用、有二次開發(fā)能力或開源社區(qū)貢獻(xiàn)經(jīng)歷更佳。
工作地點(diǎn)
地址:北京海淀區(qū)北京-海淀區(qū)上地西路6號(hào)快手總部
??
點(diǎn)擊查看地圖
詳細(xì)位置,可以參考上方地址信息
求職提示:用人單位發(fā)布虛假招聘信息,或以任何名義向求職者收取財(cái)物(如體檢費(fèi)、置裝費(fèi)、押金、服裝費(fèi)、培訓(xùn)費(fèi)、身份證、畢業(yè)證等),均涉嫌違法,請求職者務(wù)必提高警惕。
職位發(fā)布者
HR
北京快手科技有限公司
-
計(jì)算機(jī)軟件
-
1000人以上
-
私營·民營企業(yè)
-
北京市海淀區(qū)上地西路6號(hào)1幢1層101 D1-10
相似職位
-
資深圖形算法專家(020401) 面議應(yīng)屆畢業(yè)生 不限維沃移動(dòng)通信有限公司
-
游戲性能優(yōu)化專家(020403) 面議應(yīng)屆畢業(yè)生 不限維沃移動(dòng)通信有限公司
-
圖形顯示專家(020404) 面議應(yīng)屆畢業(yè)生 不限維沃移動(dòng)通信有限公司
-
營銷經(jīng)理 6000-10000元應(yīng)屆畢業(yè)生 不限常熟凱靈餐飲娛樂管理有限公司
-
計(jì)量校準(zhǔn)業(yè)務(wù)員 面議應(yīng)屆畢業(yè)生 不限東莞市帝恩檢測有限公司
-
央企 雙休 不加班售后崗 6-9k 6000-9000元應(yīng)屆畢業(yè)生 不限中國人壽保險(xiǎn)股份有限公司南京市分公司
應(yīng)屆畢業(yè)生
本科
2026-01-18 00:10:10
2963人關(guān)注
注:聯(lián)系我時(shí),請說是在江蘇人才網(wǎng)上看到的。
