it之家 8 月 31 日消息,google cloud 在今天召开的云 next 大会上,宣布下月上线 a3 虚拟机实例。谷歌云在今年 5 月召开的 i / o 开发者大会上宣布 a3 实例,最大的亮点在于配备英伟达 h100 tensor core gpu,满足生成式 ai 和大语言模型的需求。
it之家之前有报道,a3实例使用了第4代英特尔至强可扩展处理器、2tb ddr5-4800内存,以及8张英伟达h100“hopper”gpu,通过nvlink 4.0和nvswitch实现了3.6 tbps的对分带宽
新的a3超级计算机被专门设计用于训练和服务对人工智能模型要求非常严苛的任务,这些模型推动了当今生成人工智能和大型语言模型的创新。据介绍,这台超级计算机能够提供26 exaflops的人工智能性能
在今天的发布会上,谷歌云还介绍了全新的tpu v5e,这是迄今为止成本效益最高、最易于访问的云tpu。这些tpu和定制的asic旨在加速人工智能和机器学习工作负载
根据sdxcentral的报道,tpu v5e相较于前代产品,在每美元的训练性能上提高了一倍,在每美元的推理性能上提高了2.5倍
以上就是谷歌即将推出a3实例:搭载英伟达h100,提供26 exaflops的ai性能的详细内容。