NVIDIA展示了世界上最大的GPU,黄仁勋从烤箱里拿出来的产品真的爆炸了。
不是他就是那个人,那个熟悉的皮夹克。
14年5月6日晚,黄仁勋在厨房举行了NVIDIA GTC 2020线上发布会。由于新冠肺炎疫情的影响,原计划在英伟达的现场活动被迫取消,原定于3月24日通过媒体发布的新闻稿也消失了。经过漫长的等待,黄仁勋终于在烤箱前见到了大家。
今年的GTC从预热开始就不走寻常路。黄仁勋在发布会前一天曝光了自己,从烤箱里拿出了一个全新的安培架构GPU NVIDIA A100。
令人惊讶的是,虽然无法举办线下活动,但英伟达也懒得在线上做直播,直接在自己的厨房播放黄仁勋录制的视频,完成新品发布。果不其然,如果你手里有“硬货”,就不在乎形式了。
英伟达首款安培架构GPU可以算是“史上最强”。基于7nm工艺,拥有540亿个晶体管,面积826mm?与Volta架构相比,性能提升20倍,既可用于训练,也可用于推理。
NVIDIA A100拥有TF32的第三代Tensor Core核心,在不改变任何代码的情况下,可将FP32精度下的AI性能提升20倍,达到每秒19.5万亿次。
多实例GPU-MG可以将单个A100 GPU划分为7个独立的GPU,根据不同的任务提供不同的计算能力,从而最大化的获得最佳的利用率和投资回报。
NVIDIA A100的新效率技术利用了AI数学固有的稀疏性,优化后性能翻倍。
英伟达将英伟达A100的特点总结为以下五点:
黄仁勋表示:“Ampere架构的突破性设计为NVIDIA第八代GPU提供了迄今为止最大的性能飞跃,它集成了AI训练和推理,性能比上一代产品最高提升20倍。历史上第一次可以在一个平台上加速水平扩展和垂直扩展负载。A100将提高吞吐量,降低数据中心的成本。”
NVIDIA A100是第一款基于NVIDIA Ampere架构的GPU,提供了NVIDIA VIII GPU中最大的性能提升。还可用于数据分析、科学计算和云图形,并已全面投产,交付全球客户。
18全球领先的服务提供商和系统构建商正在将NVIDIA A100集成到他们的服务和产品中,包括阿里云、AWS、百度云、思科、戴尔技术、谷歌云、HPE、微软Azure和甲骨文。
黄仁勋还推出了基于英伟达A100的第三代AI系统DGX-A100 AI。DGX-A100 AI是世界上第一台单节点AI计算能力为5 PFLOPS的服务器。每个DGX A100可以分成多达56个独立运行的实例,装配了8个NVIDIA A100 GPU,每个GPU支持12个NVLink互联总线。
据了解,相比其他高端CPU服务器,DGXA100的AI计算性能高150倍,内存带宽高40倍,IO带宽高40倍。
黄仁勋说:“AI已经应用到很多领域,比如云计算、汽车、零售和医疗,AI算法变得越来越复杂和多样。ResNet模型的计算能力需求从2016到现在增长了3000倍,我们需要更好的解决方案。”
如此强大的DGX-A100 AI价格自然不便宜。标价19.9万美元,约合人民币141万元。
此外,黄仁勋还提到了英伟达新一代DGXSuper POD集群,由140个DGXA100系统组成,AI计算能力达到700 Petaflops,相当于上千台服务器的性能。
据了解,首批DGXSuper POD将部署在美国能源部阿贡国家实验室,用于新冠肺炎疫情相关研究。
除了上述两款重磅产品,黄仁勋还宣布推出NVIDIA Merlin,这是一个用于构建下一代推荐系统的端到端框架,正在迅速成为更加个性化的互联网的引擎。Merlin将创建一个100 TB数据集推荐系统所需的时间从四天缩短到了20分钟。
NVIDIA也推出了许多与AI领域相关的产品,包括Mellanox ConnectX-6 Lx SmartNIC、EGX Edge AI平台以及一系列软件更新和扩展。
1.以太网智能网卡Mellanox ConnectX-6 Lx SmartNIC
ConnectX-6 Lx是业界首款针对25Gb/s进行优化的安全智能网卡,可提供两个25Gb/s端口或一个50Gb/s端口。
2.EGX edge AI平台
EGX Edge AI平台是首款基于NVIDIA Ampere架构的Edge AI产品,可以接收高达200Gbps的数据,直接发送到GPU内存进行AI或5G信号处理。
3.火花3.0
英伟达也宣布在Spark 3.0上支持英伟达GPU加速。基于RAPIDS的Spark 3.0打破了数据提取、转换、加载的性能标杆。它帮助Adobe Intelligent Services降低了90%的计算成本。
4.英伟达贾维斯
黄仁勋在发布会上详细介绍了NVIDIA Jarvis,这是一个全新的端到端平台,可以充分发挥NVIDIA AI平台的强大功能,打造实时多模态对话式AI。
5.迷雾交互人工智能
在现场演示中,一个名为Misty的AI系统实时展示了理解和回答一系列关于天气的复杂问题的交互过程。
在自动驾驶方面,英威达也将安培架构嵌入了新的英伟达驱动平台。据了解,马骁智行和法拉第未来等自动驾驶公司已经宣布采用英伟达DRIVE AGX计算平台。
英伟达的NVIDIA Isaac软件定义机器人平台也将用于宝马集团工厂。英伟达的机器人全球生态系统涵盖分销、零售、自主移动机器人、农业、服务业、物流、制造和医疗保健。
NVIDIA三年发布会诚意满满,第一个安培架构就是一大惊喜。NVIDIA A100 GPU性能提升了20倍,是性能的飞跃。
发布会虽然没有直播,但依然爆满。一台DGX-A100 AI,胜过一千台,也印证了黄仁勋的经典名言“买的越多,赚的越多”。英伟达的AI解决方案已经覆盖各行各业,一个强大的AI生态系统正在形成。
中国工程院院士倪光南曾表示:“芯片设计的门槛极高,只有少数企业能够承担中高端芯片的研发成本,这也制约了芯片领域的创新。」
NVIDIA的Ampere架构和基于它的一系列AI平台在本次GTC上展示了一个AI芯片巨头的实力,并再次树立了性能标杆。
根据Gartner的预测数据,全球人工智能芯片市场将在未来五年内飙升,从2018年的42.7亿美元增长到343亿美元,增长超过7倍,可见AI芯片市场有很大的增长空间。
尽管中国与西方发达国家在AI芯片的研发方面仍有差距,但在过去两年中,中国的AI芯片初创企业获得了数亿美元的资金。华为等公司也开发出了令人印象深刻的芯片设计。
然而,芯片开发极其复杂。中国人才短缺,全球销售额排名前65,438+05的中国半导体公司少了几家,说明中国要在半导体领域与美国竞争,还需要取得重大进展。