5月4日消息,在第六届数字中国建设峰会“人工智能分论坛”上,阿里云智能计算集群灵骏负责人、资深技术专家王超发表了题为《建设大规模绿色智算,护航人工智能产业可持续发展》的演讲。王超指出,大模型在推理和训练场景都需要大算力,云计算将成为大模型的必选算力底座。
图源:阿里云官微,下同
王超在演讲中表示,大模型训练通常需要数千张GPU卡,基于TB级别的数据,耗时几个月进行训练,然后其他用户在预训练大模型的基础上再进行强化学习,而这需要数百张GPU卡,耗时一两个月。
但这种现状存在很多问题:一方面,厂商投资数亿元建设的计算集群只用几个月极不经济;另外一方面,购买、规划和组建超大规模的算力集群也要耗时半年到一年的时间。此外,把算力集群的算力提供给全球各地的其他客户使用也有着很大的技术挑战。
王超透露,阿里云正在基于灵骏智算集群和机器学习平台PAI解决这些问题,希望未来帮助大模型厂商只需要花费一天的时间就能在云上建设一个数千张GPU卡规模的训练集群,在完成训练任务后,算力可以快速释放出来供其他客户使用。
王超介绍,目前,阿里云使用多年积累的技术,已经可以在云上打造一个“10万卡”体量的超大规模智算集群,并且解决了关键的网络、数据存储、算力的可观测、可调度和负载平衡等技术问题,构建了一个从集群IaaS到PaaS到MaaS全栈式的服务,方便各行各业的大模型厂商和企业客户使用。
在本次大会上,阿里云还集中展示了在绿色数据中心、双碳解决方案以及少年云助学计划等领域的最新产品和进展。
少年云助学计划2021年10月由阿里巴巴集团发起,目前在20个欠发达区域,让6万多个中小学生用上了自己的专属云电脑,除信息技术外,数学、语文、音乐、美术、劳动、沟通等43门特色课程被搬进了这个信息科技教学空间。
,