职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
岗位职责:
跟踪和探索CV,NLP,多模态等大模型关键技术,参与预训练大模型研发,实现数字政府和工业领域的行业大模型建设和相关产品落地
搭建符合公司需要的大模型训练框架,开展AI大模型训练、微调、优化、推理等工作,推动所研发模型达到业界领先效果
深入理解公司各类业务和运营场景,分析和沉淀AI共性能力,支撑智能化产品相关算法研发和迭代调优工作
任职要求:
硕士研究生及以上学历,人工智能、计算机、通信、自动化等相关专业
具备一定的科研能力,具备快速学习新技术的能力,能熟练阅读并理解相关领域的学术论文
掌握Python、C 等至少一种开发语言,熟悉Pytorch/TensorFlow/PaddlePaddle/MindSpore等至少一种框架
具备CV,NLP大模型训练经验者优先,如CAE、MAE、Transformer、Diffusion等相关经验
具备业界典型大模型训练和调优经验者优先,如百度文心VIMER、华为盘古、BERT、GPT-3等LLM相关经验
熟悉深度学习与分布式算法,有大规模分布式算法相关开发经验者优先
在计算机视觉(CVPR,ICCV,ECCV)和机器学习(NIPS,ICML,AAAI)等相关会议发表论文者优先考虑
工作地点
地址:北京东城区北京北京市东城区和平里北街51号雍和宫壹中心A3座2层


职位发布者
HR
联通大数据有限公司

-
通信/电信/网络设备/增值服务
-
200-499人
-
股份制企业
-
海淀区农大南路1号院3号楼5层2501