职位描述
该职位已进行加V认证,请放心投递
职责描述:
1. 负责大模型数据集的整体规划、设计和研发工作,从数据采集接入、标注和领域建模构建大模型所需的预训练数据集;
2. 参与风控、反洗钱、数据安全等相关安全业务数据仓库建设,包括数据接入、etl、数据建模、图数仓、知识图谱等数据研发工作,全面支撑业务发展;
3. 参与数据中台架构设计和实现,不断优化和提升中台赋能能力,通过合理的数据抽象和建模,沉淀可复用的数据资产;
4. 参与数据治理、数据质量、数据服务及数据产品等基础数据平台和设施建设;
任职要求:
1. 大学本科及以上学历,计算机、统计学、数学或相关专业,3年以上数据仓库研发经验;
2. 熟练掌握sql/hive sql,较为丰富的数据仓库及数据平台的架构及研发经验,精通数据仓库建模理论、分层思想及etl设计开发;
3. 熟悉hive/hadoop/spark/odps等大数据分布式平台;
4. 在如下专业领域有丰富经验:大模型、机器学习、数据挖掘、aiops、自然语言处理,在顶级机器学习、数据挖掘和ai相关领域会议和期刊有论文发表的优先考虑;
5. 关注业界新技术,有技术热情和自驱力,善于沟通和协作;
工作地点
地址:杭州西湖区杭州中国浙江省杭州市西湖区蚂蚁a空间
求职提示:用人单位发布虚假招聘信息,或以任何名义向求职者收取财物(如体检费、置装费、押金、服装费、培训费、身份证、毕业证等),均涉嫌违法,请求职者务必提高警惕。
职位发布者
HR
蚂蚁科技集团股份有限公司
- 银行
- 1000人以上
- 中外合资(合资·合作)
- 浙江省杭州市西湖区西溪新座5幢802室