高级软件开发工程师(大模型方向)(J12867)
面议
苏州
应届毕业生
学历不限
- 全勤奖
- 节日福利
- 不加班
- 周末双休
职位描述
该职位还未进行加V认证,请仔细了解后再进行投递!
工作职责:
1、负责大模型训练研发。构建训练数据集,运用SFT、RLHF等技术对大模型进行微调,满足大模型领域场景落地需求;
2、负责大模型推理优化。运用prompt工程、模型蒸馏、推理加速、超长上下文等技术,优化大模型性能,提升大模型落地成效;
3、负责大模型安全研究。降低大模型输出幻觉,提高大模型安全性及稳定性,解决大模型可控可信度不足问题;
4、参与大模型产品化落地,提供大模型产品化、公有云和私有云落地方案。
任职资格:
1、计算机、人工智能等专业,硕士及以上学历,具备5年以上算法工作经验;
2、熟练掌握主流大模型,包括不限于GPT-series、LLaMA、GLM等预训练模型;
3、精通大模型微调、自监督学习、注意力机制、Transformer、多模态学习、模型蒸馏、推理加速等技术;
4、精通Python/C 等编程语言,熟练掌握Pytorch/Tensorflow等深度学习框架、Deepspeed/Megatron等分布式训练框架;
5、具备优秀的分析问题和解决问题能力,勇于挑战困难问题;
6、具备良好的团队协作和沟通能力,能够带领团队达成大模型目标任务;
7、具备超大规模(集群千卡 /大模型100B )训练、调优经验者优先;
8、在英文期刊和学术顶会上发表过学术论文者优先。
1、负责大模型训练研发。构建训练数据集,运用SFT、RLHF等技术对大模型进行微调,满足大模型领域场景落地需求;
2、负责大模型推理优化。运用prompt工程、模型蒸馏、推理加速、超长上下文等技术,优化大模型性能,提升大模型落地成效;
3、负责大模型安全研究。降低大模型输出幻觉,提高大模型安全性及稳定性,解决大模型可控可信度不足问题;
4、参与大模型产品化落地,提供大模型产品化、公有云和私有云落地方案。
任职资格:
1、计算机、人工智能等专业,硕士及以上学历,具备5年以上算法工作经验;
2、熟练掌握主流大模型,包括不限于GPT-series、LLaMA、GLM等预训练模型;
3、精通大模型微调、自监督学习、注意力机制、Transformer、多模态学习、模型蒸馏、推理加速等技术;
4、精通Python/C 等编程语言,熟练掌握Pytorch/Tensorflow等深度学习框架、Deepspeed/Megatron等分布式训练框架;
5、具备优秀的分析问题和解决问题能力,勇于挑战困难问题;
6、具备良好的团队协作和沟通能力,能够带领团队达成大模型目标任务;
7、具备超大规模(集群千卡 /大模型100B )训练、调优经验者优先;
8、在英文期刊和学术顶会上发表过学术论文者优先。
工作地点
地址:苏州虎丘区苏州市高新区昆仑山路58号
求职提示:用人单位发布虚假招聘信息,或以任何名义向求职者收取财物(如体检费、置装费、押金、服装费、培训费、身份证、毕业证等),均涉嫌违法,请求职者务必提高警惕。
职位发布者
刘女士/..HR
中移(苏州)软件技术有限公司
- 通信/电信/网络设备/增值服务
- 500-999人
- 国有企业
- 虎丘区科灵路78号