职位描述

1. 参与滴滴机器学习训练框架、推理框架的设计与研发,服务于内部各个产品线;
2. 参与机器学习分布式训练,多卡推理框架等底层组件的抽象与设计,包括训练框架优化,分布式网络优化等;
3. 支持大模型在滴滴内部场景的业务落地。
任职资格:
1. 熟练掌握linux环境下的c/c++与python语言;
2. 熟练掌握至少一种机器学习框架(tensorflow / pytorch / mxnet 或其他自研框架)并熟悉设计思路及工作原理;
3. 有以下至少一项的背景知识与经验:cuda编程,nccl,编译器,高性能网络,并行计算,集群调度;
4. 熟悉deepspeed、megatronlm等分布式训练框架者优先;
5. 有软硬件联合设计的经验,能使用数学工具分析深度学习训练中的优化算法优先;
6. 有大模型训练推理调优经验优先。
工作地点
地址:北京海淀区北京-海淀区弘源·新时代


职位发布者
HR
北京小桔科技有限公司


-
交通·运输·物流
-
1000人以上
-
股份制企业
-
北京市海淀区东北旺西路8号院35号楼5层501室