职位描述

职位描述:1、在短视频和直播场景下,结合图像,声音,文字等,对视频进行理解,包括但不限于音频分离、音频检测与分类、语音识别、语种识别、音乐理解等;
2、推动音频理解算法在快手短视频相关应用上的落地;
3、追踪多模态视频理解的前沿算法和技术,保持算法先进性。
任职要求:1、机器学习、模式识别、信号处理等计算机相关专业的硕士或者博士;
2、有多模态技术、音频分离和生成等相关经验者优先;
3、熟练掌握C/C 、Python,有较强的工程实现能力。熟悉常见的机器学习算法工具,如tensorflow,pytorch等;
4、相关顶会或期刊上发表论文者优先(ICASSP,Interspeech,ACL,ICML,NIPS,CVPR等);
5、有团队精神,良好的表达能力和沟通能力。
工作地点
地址:北京海淀区北京-海淀区上地西路6号快手总部


职位发布者
HR
北京快手科技有限公司


-
计算机软件
-
1000人以上
-
私营·民营企业
-
北京市海淀区上地西路6号1幢1层101 D1-10