職位描述

職位描述
基于NPU平臺,開發(fā)高性能計算庫,支撐CV,NLP,大模型等模型運行,包括:
1.完成高性能算子的需求分析與分解,滿足NPU的各種應用場景;
2.與芯片/架構團隊緊密配合,持續(xù)優(yōu)化算子性能,逐步完善軟硬件架構;
3.完成各類算子的軟件方案設計及開發(fā);
4.分析算子/網(wǎng)絡的性能瓶頸,提出性能優(yōu)化策略,達成性能目標;
職位要求
1.圖像處理、模式識別、機器學習等相關專業(yè)碩士及以上學歷;
2.精通C /Python軟件編程語言;
3.熟悉Onnx/TensorFLow/Pytorch一種主流神經網(wǎng)絡框架,熟悉各類算子;
4.熟悉并行/異構計算體系結構,在TPU/NPU/GPU一種平臺有2年以上的開發(fā)和優(yōu)化經驗;
5.具備業(yè)界常用高性能庫(TensorRT/cuDNN/CUDA/OPENCV)開發(fā)和性能優(yōu)化經驗者優(yōu)先;
6.熟悉指令流水,計算機體系結構;
7.良好的團隊溝通能力、技術攻關能力,責任心強,具備一定抗壓能力。
工作地點
地址:北京海淀區(qū)北京-海淀區(qū)海淀區(qū)


職位發(fā)布者
HR
小米科技有限責任公司


-
通信/電信/網(wǎng)絡設備/增值服務
-
1000人以上
-
私營·民營企業(yè)
-
北京市海淀區(qū)清河中街68號華潤五彩城寫字樓