据3月14日消息,Cerebras Systems发布了其第三代晶圆级AI加速芯片“WSE-3”(Wafer Scale Engine 3)。规格参数更疯狂,功耗和价格不变,性能不变。翻倍了。
2019年第一代WSE-1基于台积电16nm工艺,面积46,225平方毫米,1.2万亿个晶体管,40万个AI核心,18GB SRAM缓存,支持9PB/s内存带宽和100Pb/s互连带宽。功耗高达15千瓦。
2021年第二代WSE-2将升级至台积电7nm工艺。面积保持46225平方毫米不变,晶体管数量增加到2.6万亿个,核心数量增加到85万个,缓存扩大到40GB,内存带宽为20PB/s。连接带宽为220Pb/s。
如今的第三代WSE-3再次升级为台积电5nm工艺。面积没有指定,但应该是相似的。毕竟,制造芯片需要一块晶圆,而且不可能做得更大。
晶体管数量持续增加至惊人的4万亿个,AI核心数量进一步增加至90万个,缓存容量达到44GB,外存容量可选1.5TB、12TB、1200TB。
乍一看,核心数量和缓存容量并没有增加多少,但性能却实现了飞跃。峰值AI算力高达125PFlops,即每秒12.5亿次浮点计算,堪比顶级超级计算机。
它可以训练相当于GPT-4和Gemini十倍以上的下一代AI大型模型,并且可以在单个逻辑内存空间中存储24万亿个参数,无需分区或重构。
用它训练1万亿个参数的大型模型的速度相当于用GPU训练10亿个参数。
四路并行,一天可以完成700亿参数的训练,最多支持2048个互连,因此一天可以完成Llama 700亿参数的训练。
WSE-3的具体功耗和价格尚未公布。按照前代的说法,应该在200万美元以上。
[免责声明]本文来源于网络,不代表本站立场,如转载内容涉及版权等问题,请联系邮箱:3801085100#qq.com,#换成@即可,我们会予以删除相关文章,保证您的权利。