高级软件开发工程师(模型服务平台方向)(J12878)
面议
苏州
应届毕业生
学历不限
- 全勤奖
- 节日福利
- 不加班
- 周末双休
职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
工作职责:
1、负责开源大模型、移动自有基础大模型的调优(如SFT、RLHF等)、训练范式优化及性能优化;
2、负责大模型prompt工程、模型蒸馏、推理加速、超长上下文等优化技术研究;
3、负责大模型安全与幻觉研究,提高大模型安全性及稳定性,解决大模型可控可信度不足问题;
4、参与大模型的产品落地,包括基于反馈的算法调优、算法创新、系统评测等。
任职资格:
1、计算机、人工智能、自然语言处理等相关专业硕士及以上学历,具备5年以上自然语言处理算法经验;
2、熟练掌握语言大模型相关算法,掌握GPT-series、LLaMa等预训练模型,精通微调模型、自监督学习、注意力机制、Transformer、多模态学习等技术;
3、熟练掌握Python、C 等编程语言,熟悉常用的Pytorch/Tensorflow/PaddlePaddle/MindSpore等深度学习算法,掌握Deepspeed/Megatron等分布式训练框架;
4、优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情;
5、具有良好的团队合作精神和沟通能力,能够牵头带领团队承担大模型应用与落地任务;
6、具备超大规模(千卡及以上)集群进行大模型(100B )训练及调优经验者优先;
7、有优秀的英文学术论文写作能力,在英文期刊和学术顶会上发表过学术论文者优先;
8、对人工智能领域的前沿研究和算法有很高的热情,渴望用人工智能技术解决商业世界的难题。
1、负责开源大模型、移动自有基础大模型的调优(如SFT、RLHF等)、训练范式优化及性能优化;
2、负责大模型prompt工程、模型蒸馏、推理加速、超长上下文等优化技术研究;
3、负责大模型安全与幻觉研究,提高大模型安全性及稳定性,解决大模型可控可信度不足问题;
4、参与大模型的产品落地,包括基于反馈的算法调优、算法创新、系统评测等。
任职资格:
1、计算机、人工智能、自然语言处理等相关专业硕士及以上学历,具备5年以上自然语言处理算法经验;
2、熟练掌握语言大模型相关算法,掌握GPT-series、LLaMa等预训练模型,精通微调模型、自监督学习、注意力机制、Transformer、多模态学习等技术;
3、熟练掌握Python、C 等编程语言,熟悉常用的Pytorch/Tensorflow/PaddlePaddle/MindSpore等深度学习算法,掌握Deepspeed/Megatron等分布式训练框架;
4、优秀的分析问题和解决问题的能力,对解决具有挑战性的问题充满激情;
5、具有良好的团队合作精神和沟通能力,能够牵头带领团队承担大模型应用与落地任务;
6、具备超大规模(千卡及以上)集群进行大模型(100B )训练及调优经验者优先;
7、有优秀的英文学术论文写作能力,在英文期刊和学术顶会上发表过学术论文者优先;
8、对人工智能领域的前沿研究和算法有很高的热情,渴望用人工智能技术解决商业世界的难题。
工作地点
地址:苏州虎丘区苏州市高新区昆仑山路58号
求职提示:用人单位发布虚假招聘信息,或以任何名义向求职者收取财物(如体检费、置装费、押金、服装费、培训费、身份证、毕业证等),均涉嫌违法,请求职者务必提高警惕。
职位发布者
刘女士/..HR
中移(苏州)软件技术有限公司
- 通信/电信/网络设备/增值服务
- 500-999人
- 国有企业
- 虎丘区科灵路78号