职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
一、岗位职责:
1、负责开源大模型、移动自有基础大模型的调优(如SFT、RLHF等)、训练范式优化及性能优化;
2、负责大模型prompt工程、模型蒸馏、推理加速、超长上下文等优化技术研究;
3、负责大模型自动化训推、Agent构建、场景应用、生态融合;
4、负责大模型安全与幻觉研究,提高大模型安全性及稳定性,解决大模型可控可信度不足问题;
5、参与大模型的产品落地,包括基于反馈的算法调优、算法创新、系统评测等。
二、任职要求:
1、计算机、人工智能、自然语言处理等相关专业硕士及以上学历,具备5年以上自然语言处理算法经验;
2、熟练掌握语言大模型相关算法,掌握GPT-series、LLaMa等预训练模型,精通微调模型、自监督学习、注意力机制、Transformer、多模态学习等技术;
3、熟练掌握Python、C 等编程语言,熟悉常用的Pytorch/Tensorflow/PaddlePaddle/MindSpore等深度学习算法,掌握Deepspeed/Megatron等分布式训练框架;
4、具备大模型微调部署、Agent构建、大模型应用工程开发经验者优先;
5、优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情;
6、具有良好的团队合作精神和沟通能力,能够牵头带领团队承担大模型应用与落地任务;
7、具备超大规模(千卡及以上)集群进行大模型(100B )训练及调优经验者优先;
8、有优秀的英文学术论文写作能力,在英文期刊和学术顶会上发表过学术论文者优先;
9、对人工智能领域的前沿研究和算法有很高的热情,渴望用人工智能技术解决商业世界的难题。
1、负责开源大模型、移动自有基础大模型的调优(如SFT、RLHF等)、训练范式优化及性能优化;
2、负责大模型prompt工程、模型蒸馏、推理加速、超长上下文等优化技术研究;
3、负责大模型自动化训推、Agent构建、场景应用、生态融合;
4、负责大模型安全与幻觉研究,提高大模型安全性及稳定性,解决大模型可控可信度不足问题;
5、参与大模型的产品落地,包括基于反馈的算法调优、算法创新、系统评测等。
二、任职要求:
1、计算机、人工智能、自然语言处理等相关专业硕士及以上学历,具备5年以上自然语言处理算法经验;
2、熟练掌握语言大模型相关算法,掌握GPT-series、LLaMa等预训练模型,精通微调模型、自监督学习、注意力机制、Transformer、多模态学习等技术;
3、熟练掌握Python、C 等编程语言,熟悉常用的Pytorch/Tensorflow/PaddlePaddle/MindSpore等深度学习算法,掌握Deepspeed/Megatron等分布式训练框架;
4、具备大模型微调部署、Agent构建、大模型应用工程开发经验者优先;
5、优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情;
6、具有良好的团队合作精神和沟通能力,能够牵头带领团队承担大模型应用与落地任务;
7、具备超大规模(千卡及以上)集群进行大模型(100B )训练及调优经验者优先;
8、有优秀的英文学术论文写作能力,在英文期刊和学术顶会上发表过学术论文者优先;
9、对人工智能领域的前沿研究和算法有很高的热情,渴望用人工智能技术解决商业世界的难题。
工作地点
地址:深圳龙华区中移软件园
求职提示:用人单位发布虚假招聘信息,或以任何名义向求职者收取财物(如体检费、置装费、押金、服装费、培训费、身份证、毕业证等),均涉嫌违法,请求职者务必提高警惕。
职位发布者
高迅/人..HR
中移(苏州)软件技术有限公司
- 通信/电信/网络设备/增值服务
- 500-999人
- 国有企业
- 虎丘区科灵路78号