使用NVMe-oF共享闪存存储的AIoT数据基础架构的新方法
到2023年,物联网(IoT)预计将包含近300亿个互联设备。这些物联网设备可在网络上创建和传输大量数据。但是数据所有者如何从传输的数据中获得情报?这就是AIoT的到来,即人工智能(AI)和IoT的结合。
AIoT将智能处理功能添加到IoT设备收集的各种大型数据集中。它使企业能够分析数据并提供见解。如今,AIoT在互联用例(例如用于远程患者监控和预防医学的医疗保健)中仍然存在;在制造业中的机器人领域;在自动驾驶汽车中;在网络监控中;并在诸如C3.ai数字转化研究所的研究中努力减轻流行病并防止未来的传染病爆发。对于需要深度筛选大量数据以执行深度学习算法的任何用例,AIoT是一种功能强大的工具。它是自我学习,自我监控和自我修复。AIoT使预测决策具有很高的预测精度,远远超过了人类。
AIoT面临的挑战是系统涉及具有多个阶段的复杂数据管道。企业不仅需要处理来自物联网的数据的数量,种类,速度和准确性,还需要在实现AI解决方案时保持模型质量,数据访问延迟,吞吐量和数据缓存功能。如果优化了计算系统以快速处理数据,那么除非建立正确的计算,存储和内存组合,否则将数据导入这些系统可能会成为瓶颈。
存储是关键基础,需要解决AIoT数据管道的所有阶段,从摄取到数据准备再到模型训练和推理,并仔细考虑TCO,性能和功耗要求。它还需要满足AI工作负载不断变化的需求。企业为了满足AI高吞吐量和低延迟的需求而转向NVMe闪存存储,但让我们通过基于结构的NVMe(NVMe-oF)进一步迈进一步
一种新方法–共享存储
一种新方法是将可组合的分解基础架构(CDI)与NVMe闪存,GPU池和大容量存储系统结合使用,以在动态的,软件定义的应用程序环境中实现快速响应时间和AI的扩展需求。
CDI会从物理上分解资源(计算,网络,存储和GPU),并根据特定应用程序的需要将它们汇总在一起。这可以实现灵活,独立的资源扩展,以满足AI工作负载不断变化的需求。
可组合存储将大大提高企业调配和优化其数据基础架构以满足动态应用程序需求的灵活性和灵活性。
CDI允许在许多主机之间共享和扩展存储,网络和计算资源。与融合系统不同,当数据随着服务器容量的增长而增长时,它避免了后续数据传入和传出GPU服务器本地SSD的延迟。它可以立即访问经过训练的模型和共享闪存中的数据,并可以快速响应。
选择存储解决方案时,具有NVMe闪存的开放式可组合基础架构可以跨团队无缝分配共享存储池,以提高效率,成本和CIO关心的KPI指标。
如何跨AIoT数据管道实施NVMe-oF共享存储
实施AI计划时,重要的是设计一种存储基础架构,以支持前所未有的AIoT数据量。优化TCO和效率的一种方法是查看AI工作负载的每个阶段,以确定哪种存储类型最适合每个阶段。NVMe-oF共享存储几乎适用于AIoT工作流程的所有阶段:
接收 – 接收阶段需要具有速度和规模,以维持从IoT系统传入的数据的数量和速度。要提取到临时着陆区,可以使用NVMe存储平台或大容量存储系统(基于HDD,对象或云存储),而要提取到集中式的全局可访问容量层,则可以使用大容量存储系统。为了吸收到高性能层(无论是在本地还是在云上部署),都需要NVMe闪存来进行实时分析。
数据准备 –数据准备阶段的主要重点应该放在数据质量上。就成本和性能而言,NVMe存储平台也是一个不错的选择。或者,您可以选择闪存和HDD的混合选件,以提供性能和更高容量的好处。
模型训练 -模型训练阶段对已实现的AI解决方案的模型质量,数据访问延迟,吞吐量和数据缓存功能敏感。这需要低延迟,面向吞吐量,可扩展的高性能存储层,并且NVMe-oF存储平台非常适合满足这些需求。
推论 –推论阶段同样需要低数据访问延迟,吞吐量响应时间和数据缓存功能。模型训练和推理阶段在分解架构中访问一个共享存储时,它们之间是高度相互依赖的。例如,如果推理评分很差,则需要对模型进行重新训练,并且在模型训练结束之前,无法生成推理。因此,对两者使用相同类型的共享存储池是有意义的。
备份/还原 –在备份阶段,大容量HDD,对象存储或云存储最适合存储和按需访问旧模型和数据。通常需要从备份中还原旧模型以进行推理或重新训练,以满足新的传入IoT数据的需求,因此最好利用近线或在线备份解决方案。
适用于AIoT的NVMe-oF可组合分解基础架构
NVMe-oF正在统一如何大规模共享,组合和管理存储,以满足不断变化的应用程序和工作负载的需求。使用NVMe闪存的可组合分解基础架构允许IT即时分配存储,以支持AI每个阶段的AIoT实施。
我们将继续看到越来越多地采用可组合的分布式存储解决方案,这些解决方案可以有效地在以太网结构上扩展,并将NVMe设备的全部性能潜力提供给各种数据中心应用程序。可组合存储将大大提高企业配置和优化其数据基础架构的灵活性和灵活性,以满足AIoT及其数据中心KPI的动态应用需求。