今日,寒武纪正式宣布推出云端AI芯片中文品牌"思元"、第二代云端AI芯片思元270(MLU270)及板卡产品。寒武纪官宣显示,产品参数在低精度训练领域实现重大突破,印证之前知乎网友的爆料。 中文品牌"思元" 寒武纪曾于去年正式推出云端AI芯片品牌"MLU"(Machine Learning Unit),此次推出中文品牌"思元"是对MLU品牌的补充,"思元"的含义是"思考的基本单元"。 据悉,思元商标的字体来自于中国元代书法家赵孟頫,他诸体兼擅,这与寒武纪追求人工智能芯片的通用性不谋而合。今年初,寒武纪已经为旗下芯片注册两大中文商标名,分别是「思元」、「玄思」。 集成系列创新 根据寒武纪官方报道,最新发布的思元270芯片集成了寒武纪在处理器架构领域的一系列创新性技术。 理论峰值性能提升4倍: 处理非稀疏深度学习模型的理论峰值性能提升至上一代MLU100的4倍,达到128TOPS(INT8); 定点训练领域取得关键性突破: 寒武纪在定点训练领域已实现关键性突破,思元270训练版板卡将可通过8位或16位定点运算提供卓越的人工智能训练性能,该技术有望成为AI芯片发展的重要里程碑。 兼容INT4和INT16、浮点运算和混合精度运算: 同时兼容INT4和INT16运算,理论峰值分别达到256TOPS和64TOPS;支持浮点运算和混合精度运算。 多样化AI应用: 思元270采用寒武纪公司自主研发的MLUv02指令集,可支持视觉、语音、自然语言处理以及传统机器学习等高度多样化的人工智能应用,更为视觉应用集成了充裕的视频和图像编解码硬件单元。 便于开发: 在系统软件和工具链方面,思元270继续支持寒武纪Neuware软件工具链,支持业内各主流编程框架。此外,为方便开发者更好地挖掘思元270超强的运算能力、开拓更多的应用领域,寒武纪将在近期向社区和开发者开放专用编程语言。 (思元270板卡) 思元270芯片采用TSMC 16nm工艺制造,其板卡产品可以通过PCIe接口快速部署在服务器和工作站内。寒武纪本次公开的思元270板卡产品面向人工智能推断任务,在ResNet50上推理性能超过10000fps。MLU270-S4型板卡(半高半长)面向数据中心部署,集成16GB DDR4内存,支持ECC;MLU270-F4型板卡(全高全长)采用主动散热设计,面向非数据中心部署场景,集成16GB DDR4内存,支持ECC。面向人工智能训练任务的思元270训练版板卡产品将于本年度第四季度推出。 生态是关键 寒武纪第一代云端AI芯片MLU100及板卡于2018年5月发布。经过在一年的适配和部署证明,MLU100系列产品已为寒武纪客户在智能视频分析、语音合成、推荐引擎、AI云等多个领域提供了高能效比的解决方案。思元270的发布,意味着寒武纪进一步完善寒武纪端云一体产品体系。 寒武纪大型AI芯片能在一年时间迭代一代确实令人无法忽视,同时研发多款高复杂度的芯片,证明寒武纪已经具备非常完备的芯片研发能力,从AI芯片初创企业迈向AI芯片新巨头的道路上,寒武纪今年又前进了一步。 寒武纪CEO陈天石表示:"寒武纪始终致力于为合作伙伴提供性能卓越、高度灵活的人工智能芯片。最新推出的思元270芯片和板卡产品将为客户带来速度更快、功耗更低、性价比更高的AI加速解决方案。作为人工智能芯片的先行者和引领者之一,寒武纪将持续推动该领域的技术和产品创新,为全球人工智能产业注入新鲜的血液,带来全新的动力。" 峰值高低并不能直接决定市场上的胜负,对于AI芯片创业企业寒武纪而言,持续的研发投入、过硬的技术、围绕芯片衍生的全套软硬件开发维护、建立强大的生态系统是长久发展的关键。