首页 > 社交 > 科普中国

榨干GPU,AI存储进入200G

常驻编辑 科普中国 2022-06-15 以太网   节点   负载   文件系统   对象   性能   阶段   时代   数据   用户   网络

AI存储,百亿空间H8H拜客生活常识网

IDC预测,全球AI(人工智能)市场支出将在2021年达到850亿美元,并在2025年增至2,000亿美元,五年复合增长率(CAGR)约为24.5%。2025年,全球约8%的AI相关支出将来自于中国市场,市场规模在全球九个区域中位列第三。H8H拜客生活常识网

“十四五”规划纲要将“新一代人工智能”作为议题重点提及,加上新基建、数字经济在内的持续利好政策的推动,中国AI市场将稳步发展。根据最新预测,2021年,中国在AI市场的支出规模将达到82亿美元。2021-2025的五年预测期内,中国市场AI相关支出总量将以22%左右的CAGR增长,有望在2025年超过160亿美元。H8H拜客生活常识网

人工智能市场的高速发展,也带动了AI存储的发展。根据IDC,从2018年开始,全球AI存储的年复合增长率高达37%,到2022年,AI存储的市场规模将达100亿美金。H8H拜客生活常识网

也就是说,今年AI存储的市场规模就将进入百亿美金俱乐部了。H8H拜客生活常识网

AI存储, IB领跑H8H拜客生活常识网

为什么有AI存储这个分类,因为AI场景比较特殊,它和GPU关系密切。由于GPU价格昂贵,AI存储必须足够快,这样才能充分利用GPU的能力,榨干GPU的带宽。H8H拜客生活常识网

由计算密集型机器学习 (ML) 和深度神经网络 (DNN) 组成的 AI 工作负载在不同阶段具有不同的输入/输出 (IO) 特征,这要求 I&O 负责人部署互补型存储架构。AI 和 ML 工作负载的独特需求会让 I&O 负责人重新评估其存储选择方法,并采用新的技术和部署方法。H8H拜客生活常识网

从上表我们可以看到,AI工作流程一般分5个阶段:采集、数据准备、训练、推理、归档,不同阶段对存储的要求不同。H8H拜客生活常识网

ML和DNN工作负载对存储架构有重大影响。由于GPU等更常用的专用处理器(特别是在神经网络的训练阶段)的并行处理能力和绝对密度,从基于磁盘的系统中读取训练数据是最常见的瓶颈之一。I&O领导者应该设计他们的网络和存储子系统以减少 I/O 瓶颈,以便他们能够充分利用他们在GPU等专用计算硬件上的投资价值。为了减少GPU空闲时间,使用固态阵列或驱动器,或其他形式的非易失性存储或持久内存来优化预处理流水线变得越来越普遍。由于在训练阶段摄取的数据量很大,最好将这些数据集存储在共享存储中,以便组织可以独立扩展计算和存储环境。集中式存储还有助于进行版本控制,以便用户和应用程序可以在整个组织中处理单个一致的副本。较新的 NVMe SSD 可以改善与神经网络相关的低带宽和高延迟挑战。H8H拜客生活常识网

从AI的负载分析来看,高速的全NVMe闪存的分布式文件系统成为AI存储的最佳形态。H8H拜客生活常识网

AI存储的网络接口,毫无疑问必须采用RDMA技术,只有这样才能有效降低系统的时延。RDMA技术原来主要用在Infiniband(IB)网络上,但现在无损以太网也支持。但除了RDMA,IB还具有协议栈简单、处理效率高、管理简单等优点。与以太网的分层拓扑不同,InfiniBand 是扁平结构,这意味着每个节点都与所有其他节点直接连接。与 TCP/IP 网络协议相比,IB 采用基于信任和流量控制的机制来保证连接的完整性,并且数据包很少丢失。数据传输完毕后,接收端返回一个信号,指示缓冲区空间的可用性。因此,IB协议消除了由于原始数据包丢失而导致的重传延迟,从而提高了协议的性能。H8H拜客生活常识网

由于IB的固有优势,目前高端的AI存储,一般优选IB网络,这也可以从历年的全球TOP500超级计算榜单可以看出。H8H拜客生活常识网

根据2021年11月的全球TOP500超级计算榜单,InfiniBand连接了全球 10 大超级计算机中的 7 台,全球100大计算机中的65台。InfiniBand 已成为高性能计算系统的事实标准,被深度学习基础设施广泛采用,并且越来越多地用于超大规模云数据中心。H8H拜客生活常识网

InfiniBand 提供了许多关键优势。它是一个全传输卸载网络,这意味着所有网络操作都由网络管理,而不是由 CPU管理。它是最有效的网络协议,这意味着能够以更少的开销传输更多数据。InfiniBand 的延迟也比以太网低得多,最重要的是,它在网络内部集成了处理引擎,可加速深度学习和高性能计算的数据处理。这些是任何计算和数据密集型应用程序的关键技术优势。这就是为什么 InfiniBand 已成为高性能、科学和产品模拟的公认标准。 H8H拜客生活常识网

随着GPU的能力越来越强,对带宽要求也愈来愈高。目前IB虽然已经有了400G NDR的产品,但是产品太新,性价比不高,从性价比角度考虑,200G HDR IB是目前高端AI存储的首选。

相关阅读:

  • 如何删除网络连接(怎么删除以太网连接)
  • Microchip拿下5000万美元美国国家航空航天局HPSC处理
  • iphone lte网络是什么意思 iphonelte网络怎么设置 iph
  • 计算机网络知识全面梳理(完整版)
  • cat6是几类网线
  • 昆山锐诚达:一种SRs线缆生产方法及SRS线缆与流程
  • ssr链接怎么用(安卓手机ssr怎么添加节点)
  • ssr怎么设置(ssr加速器节点)
  • 节点是什么意思(手机怎么换节点)
  • 「数据结构之字典树Trie」C语言版本实现
    • 网站地图 |
    • 声明:登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不做权威认证,如若验证其真实性,请咨询相关权威专业人士。