3月22日消息,据36氪报道,阿里M6大模型的前带头人杨红霞已加入字节AI Lab(人工智能实验室),参与语言生成大模型的研发。一名知情人士表示,杨红霞在语言生成大模型团队中处于领导地位,直接向字节跳动副总裁杨震原汇报。
截至发稿前,字节跳动暂未回应。
此前Tech星球曾报道,阿里达摩院大模型带头人杨红霞已于2022年9月初离职。作为达摩院近期离开的重要人工智能科学家,杨红霞是超大规模多模态预训练模型M6的技术负责人。
据悉,杨红霞曾带领团队获2019世界人工智能大会最高奖卓越人工智能引领者(Super AI Leader,简称SAIL奖),2020年国家科学技术进步奖二等奖。2022年,杨红霞也获得当年福布斯中国科技女性50强的荣誉。
在人工智能深度学习领域中,杨红霞带头的大模型算法M6是达摩院较为出色的成果之一,2021年发布的时候,曾获得广泛宣传。简单来说,这款产品仅仅使用480块GPU,就能实现万亿参数体量的智能运算。相比原来的百亿参数模型,“功耗降低8成,效率提升11倍。”
上个月,36氪曾报道,字节跳动在大模型上已有所布局,分别在语言和图像两种模态上发力。对此,字节跳动相关技术负责人回应称,技术中台在这些领域有探索,还很初期,不成熟。
知情人士透露,语言大模型团队由字节搜索部门牵头,目前团队规模在十数人左右。图片大模型团队则由产品研发与工程架构部下属的智能创作团队牵头。另有知情人士表示,字节跳动语言大模型团队在今年组建,探索方向主要为与搜索、广告等下游业务的结合。
,