APP下载
机会在手,求职信息实时掌握
    Alternate Text
    APP下载
    Alternate Text
    微信公众号
    Alternate Text
    小程序
当前位置:首页> 列表 >职位详情
【大模型专项】异构大模型推理优化工程师
30000-60000元 北京 应届毕业生 本科
  • 全勤奖
  • 节日福利
  • 不加班
  • 周末双休
北京快手科技有限公司 2025-01-24 16:41:54 690人关注
职位描述
该职位已进行加V认证,请放心投递
职位描述:参与内部异构大模型推理引擎优化,支持大模型推理各种优化技术在异构硬件上的落地。包括但不限于: 1、参与日常推理引擎的优化开发,不断优化大模型业务在对应硬件上的TTFT、TPOT等指标;关注业界最佳实践,能将业界最佳实践落地到内部的引擎优化中; 2、完成各种大模型推理所需的功能性开发任务; 3、参与支持日常的大模型推理服务部署,参与内部日常提效工具的研发。 任职要求:1、有扎实的C 工程基础; 2、有大模型相关训练或推理优化经验;有vLLM、TensorRT-LLM、MLC-LLM 等框架之一的实践经验;熟悉LLM infer 相关技术栈,熟悉TP/PP/DP等分布式通信原理等; 3、熟悉CUDA 或 ROCM,熟悉Nsight System/ Nsight Compute 工具的使用,有 GPU 或 ASIC 高性能算子开发经验; 4、了解AI infra 整体技术栈需求,有训练框架或推理框架实战经验、熟悉TensorRT、TVM 等框架的使用、有二次开发能力或开源社区贡献经历更佳。
联系方式
注:联系我时,请说是在北京人才网上看到的。
工作地点
地址:北京海淀区北京-海淀区上地西路6号快手总部
求职提示:用人单位发布虚假招聘信息,或以任何名义向求职者收取财物(如体检费、置装费、押金、服装费、培训费、身份证、毕业证等),均涉嫌违法,请求职者务必提高警惕。
top
投递简历
马上投递
更多优质岗位等你来挑选   加入北京人才网,发现更好的自己
投递简历
马上投递
提示
该职位仅支持官方网站投递
关闭 去投递
会员中心 提示:订单支付,立即生效
天数: 0
共计: 0
支付方式:
微信支付
支付宝支付
确认 取消