职位描述

职责描述:
1. 负责大模型数据集的整体规划、设计和研发工作,从数据采集接入、标注和领域建模构建大模型所需的预训练数据集;
2. 参与风控、反洗钱、数据安全等相关安全业务数据仓库建设,包括数据接入、etl、数据建模、图数仓、知识图谱等数据研发工作,全面支撑业务发展;
3. 参与数据中台架构设计和实现,不断优化和提升中台赋能能力,通过合理的数据抽象和建模,沉淀可复用的数据资产;
4. 参与数据治理、数据质量、数据服务及数据产品等基础数据平台和设施建设;
任职要求:
1. 大学本科及以上学历,计算机、统计学、数学或相关专业,3年以上数据仓库研发经验;
2. 熟练掌握sql/hive sql,较为丰富的数据仓库及数据平台的架构及研发经验,精通数据仓库建模理论、分层思想及etl设计开发;
3. 熟悉hive/hadoop/spark/odps等大数据分布式平台;
4. 在如下专业领域有丰富经验:大模型、机器学习、数据挖掘、aiops、自然语言处理,在顶级机器学习、数据挖掘和ai相关领域会议和期刊有论文发表的优先考虑;
5. 关注业界新技术,有技术热情和自驱力,善于沟通和协作;
工作地点
地址:杭州西湖区杭州中国浙江省杭州市西湖区蚂蚁a空间


职位发布者
HR
蚂蚁科技集团股份有限公司


-
银行
-
1000人以上
-
中外合资(合资·合作)
-
浙江省杭州市西湖区西溪新座5幢802室