APP下载
机会在手,求职信息实时掌握
    Alternate Text
    APP下载
    Alternate Text
    微信公众号
    Alternate Text
    小程序
当前位置:首页> 列表 >职位详情
AI大模型性能优化工程师(A77684)
面议 北京 应届毕业生 学历不限
  • 全勤奖
  • 节日福利
  • 不加班
  • 周末双休
北京城建智控科技股份有限公司 2025-03-09 22:02:20 17人关注
职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
职位描述:

1、研发分布式训练加速方案,优化ZeRO/FSDP/Pipeline并行策略,提升千亿参数模型训练吞吐量;

2、设计混合精度训练与显存优化方案,开发自适应梯度压缩、通信优化模块,实现单卡训练模型规模提升和降低分布式训练通信开销

开发量化压缩工具链(支持GPTQ/AWQ等算法),实现模型8/4-bit无损量化部署;

3、设计多GPU推理调度策略,优化显存碎片管理与计算资源利用率;

4、跟进vLLM/TensorRT-LLM/SGLang等前沿框架,探索MoE架构/稀疏化训练等新型范式,将最新学术成果快速落地到工程实践。

职位要求:

1、计算机科学/人工智能方向硕士及以上,3年LLM系统优化经验;

2、精通PyTorch/TensorFlow框架底层机制,具备CUDA/C 内核开发能力;

3、掌握Megatron-LM/DeepSpeed/HuggingFace生态核心原理;

4、有千亿参数模型训练优化或百万QPS推理服务落地经验;

5、熟悉NVIDIA GPU架构与性能分析工具;

6、熟悉大模型推理服务架构设计与微服务化部署。

联系方式
注:联系我时,请说是在北京人才网上看到的。
工作地点
地址:北京朝阳区北京城建智控科技股份有限公司琉璃井路2号院4号楼
求职提示:用人单位发布虚假招聘信息,或以任何名义向求职者收取财物(如体检费、置装费、押金、服装费、培训费、身份证、毕业证等),均涉嫌违法,请求职者务必提高警惕。
top
投递简历
马上投递
更多优质岗位等你来挑选   加入北京人才网,发现更好的自己
投递简历
马上投递
提示
该职位仅支持官方网站投递
关闭 去投递
会员中心 提示:订单支付,立即生效
天数: 0
共计: 0
支付方式:
微信支付
支付宝支付
确认 取消