职位描述

职位描述:参与内部异构大模型推理引擎优化,支持大模型推理各种优化技术在异构硬件上的落地。包括但不限于:
1、参与日常推理引擎的优化开发,不断优化大模型业务在对应硬件上的TTFT、TPOT等指标;关注业界最佳实践,能将业界最佳实践落地到内部的引擎优化中;
2、完成各种大模型推理所需的功能性开发任务;
3、参与支持日常的大模型推理服务部署,参与内部日常提效工具的研发。
任职要求:1、有扎实的C 工程基础;
2、有大模型相关训练或推理优化经验;有vLLM、TensorRT-LLM、MLC-LLM 等框架之一的实践经验;熟悉LLM infer 相关技术栈,熟悉TP/PP/DP等分布式通信原理等;
3、熟悉CUDA 或 ROCM,熟悉Nsight System/ Nsight Compute 工具的使用,有 GPU 或 ASIC 高性能算子开发经验;
4、了解AI infra 整体技术栈需求,有训练框架或推理框架实战经验、熟悉TensorRT、TVM 等框架的使用、有二次开发能力或开源社区贡献经历更佳。
工作地点
地址:北京海淀区北京-海淀区上地西路6号快手总部


职位发布者
HR
北京快手科技有限公司


-
计算机软件
-
1000人以上
-
私营·民营企业
-
北京市海淀区上地西路6号1幢1层101 D1-10
相似职位
-
公关总经理 70000-100000元朝阳区 应届毕业生 本科天九共享控股集团有限公司
-
安全发展经理 12000-24000元海淀区 应届毕业生 本科北京小桔科技有限公司
-
公安行业高级经理 30000-50000元海淀区 应届毕业生 本科联想(北京)有限公司(联想集团)
-
商业分析-用户增长策略方向 20000-30000元海淀区 应届毕业生 本科贝壳找房(北京)科技有限公司
-
家装产品研发 20000-30000元海淀区 应届毕业生 本科贝壳找房(北京)科技有限公司
-
搜狗输入法-高级策略产品经理(打字方向) 25000-50000元海淀区 应届毕业生 本科深圳市腾讯计算机系统有限公司