职位描述

职责描述:
-建设业界出众的ai异构算力容器平台,提供高性能、高稳定性、高易用性的百舸产品,支持智驾、aigc、金融能源、智算中心客户ai应用高效部署
-负责云原生ai容器相关产品的架构设计和产品研发,引入开源社区先进的ai框架、ai调度、ai工作流和ai可观测能力组件构建全栈ai应用云原生解决方案
-构建异构多元芯算力底座,支持国产化信创,支持gpu虚拟化和混部调度,提升ai应用资源效率
-无缝对接客户和云上ai开发平台,支持文心和开源大模型训练推理任务部署,提供训练容错和弹性伸缩能力
-对接客户基础设施环境构建异构算力平台解决方案,支持大模型训练/推理tob交付
-探索业界最新技术方向,参与开源社区,提升百度云原生ai核心竞争力
任职要求:
-本科及以上学历,有一定程度的计算机相关专业知识背景
-优秀的编码能力,熟悉golang/python/java/c/c++至少一项,有扎实的算法及数据结构基础,有良好的编程习惯
-精通kubernetes基本工作原理,了解调度器、device-plugin、容器运行时运行机制、容器网络、rdma通信;有kubeflow、volcano等相关开发经验优先
-熟悉开源大模型glm/llama/gpt3优先,熟悉tensorflow/caffe/pytorch框架者优先,有大规模训练实践经验者优先
-对异构芯片虚拟化、cuda编程、rdma有一定了解者优先
-优秀的团队协作能力;具备较强的ownership,以结果为导向,负责领域内善于思考并积极改进
工作地点
地址:北京海淀区北京-海淀区奎科大厦


职位发布者
HR
百度在线网络技术(北京)有限公司


-
互联网·电子商务
-
1000人以上
-
私营·民营企业
-
北京海淀区上地十街10号百度大厦