炼数成金 门户 大数据 虚拟化 查看内容

计算虚拟化:VMware和Nvidia联手!

2021-3-15 14:31| 发布者: 炼数成金_小数| 查看: 16743| 评论: 0|原作者: Laura|来自: SSDFans

摘要: VMware和Nvidia近日将联手加速企业人工智能应用程序的开发。新发布的虚拟化巨头vSphere 7服务器虚拟化和vSAN 7存储虚拟化产品将运行需要支持人工智能基础设施的应用程序,在简化操作的同时提升安全性。VMware和Nvidi ...
VMware和Nvidia近日将联手加速企业人工智能应用程序的开发。

新发布的虚拟化巨头vSphere 7服务器虚拟化和vSAN 7存储虚拟化产品将运行需要支持人工智能基础设施的应用程序,在简化操作的同时提升安全性。VMware和Nvidia表示,他们将提供一个软件栈,使客户能够开发新的应用程序,并使用Nvidia硬件对现有的应用程序和基础设施进行现代化改造。

联合开发的AI Ready Enterprise平台的更新包括针对Nvidia AI Enterprise的VMware vSphere 7 Update 2认证,该平台是优化AI应用程序和框架的云本地集合。这种组合使基于Nvidia图形处理单元的工作负载在VMware虚拟机上的性能比以前提高了20倍。

Nvidia边缘计算部门总经理Justin Boitano表示:“vSphere的性能与裸机几乎没有区别,可以在一个没有筒仓的控制平面下进行管理。”

vSphere更新还增加了对Nvidia认证系统上的Nvidia A100和Nvidia A40 Tensor Core GPU的支持,这些系统包括公司的HGX和EGX服务器平台。这使客户能够将特定于AI的平台添加到其现有的虚拟化环境中,而不是单独运行AI工作负载。

Boitano说:“人工智能是一个全栈计算问题,但可以自己动手来建立和管理。这使我们能够在vSphere下充分利用现有的用于AI的VMware工具。”

工作负载可移植
集成将使VMware客户能够充分利用一代Nvidia GPU的特性,如多实例GPU,它允许GPU周期在多个用户之间共享。现在可以使用VMware的vSphere vMotion调度这些资源,使用vSphere分布式资源调度器实现负载均衡。

VMware云平台业务部门副总裁Lee Caswell表示,后者使用户能够跨公共集群中的节点移动应用程序,或者随着工作负载需求的变化实时分发应用程序。另一个特性支持Nvidia多实例GPU,允许单个GPU通过故障隔离在多达七个vm之间共享,防止停机。

此外,Nvidia还认证了一个AI和数据科学应用和框架库、云本地部署工具和Nvidia基础设施优化库用于vSphere,被称为Nvidia AI Enterprise。Boitano表示:“如果一家新公司开始研发人工智能,他们需要花80周以上的时间来整理数据、训练模型,然后才能投入使用。”他说,英伟达的预训练模型和迁移学习工具包可以从现有的神经网络模型中提取学习到的特征,可以将训练模型的过程缩短至8周。”

除了与Nvidia的合作,VMware表示,它将把VMware NSX高级负载平衡器(Advanced Load Balancer Essentials)作为vSphere的Tanzu应用程序现代化套件的一部分。这使得vmware支持的Kubernetes集群的多云负载平衡成为可能,并为NSX高级负载平衡器企业版提供了完整的功能。

Kubernetes是一种流行的编排器,用于称为容器的可移植、模块化软件平台。在的Kubernetes 1.19版本中,带有Tanzu的VSphere包含了一个更新的管理器,它提供了简化升级和提高稳定性的增强功能。

vSAN超融合特性
vSAN存储虚拟化层正在升级为增强的HCI Mesh,VMware表示现在有超过3万名客户正在使用。这是一种基于软件的超融合基础架构,它使组织能够将存储孤岛统一为单一的虚拟资源。

Update 2特别针对希望通过仅计算或非HCI群集远程使用数据中心内vSAN群集中的存储,从而使计算和存储独立扩展的客户,以提高其现有vSAN环境之外的资源效率。

Caswell 表示:“这一直是对HCI的敲打:我们如何知道下一个节点是计算和容量的正确组合?这将使用户能够跨服务器共享容量,甚至允许单个刀片服务器直接访问vSAN存储。HCI Mesh“打破了可扩展性的限制,”可以将所有剩余容量利用起来”

vSAN 7的另一项更新是添加了新的功能,以更好地支持各种物理拓扑,包括集成分布式资源调度程序对扩展集群配置的感知。这将为扩展集群和双节点集群提供更一致的故障性能和vSAN文件服务支持。

Caswell说:“如果把计算机转移到不同的位置,通常会出现性能问题。即使在发生故障转移事件时,增强的扩展集群仍可以保持计算和存储的并置。”通过支持远程直接内存访问,还可以提高性能,该访问允许主机在无需CPU干预的情况下访问彼此的内存。

在安全性方面,vSphere 7 Update 2为vSphere Pods引入了机密容器,它使用了AMD的硬件,当虚拟机停止运行时,会加密所有CPU寄存器内容。还有一个新的vSphere原生密钥供应商,提供基本的密钥管理服务器功能,使客户更容易启用加密和高级安全特性。

Caswell说:“我们可以使本地空白的远程办公室独立于中央密钥管理运行。这避免了外部密钥管理服务的成本和复杂性。”

新的vSAN 7还支持vSphere Proactive High Availability,可以主动将应用程序状态和存储的数据转移到另一台主机上,以避免降级硬件上的数据丢失。增强的数据持久性减少了意外中断(如多个磁盘故障)的停机时间和数据丢失。

原文链接:
https://siliconangle.com/2021/03/09/vmware-nvidia-team-deliver-virtualized-ai-workloads/

声明:文章收集于网络,版权归原作者所有,为传播信息而发,如有侵权,请联系小编删除,谢谢!

欢迎加入本站公开兴趣群
软件开发技术群
兴趣范围包括:Java,C/C++,Python,PHP,Ruby,shell等各种语言开发经验交流,各种框架使用,外包项目机会,学习、培训、跳槽等交流
QQ群:26931708

Hadoop源代码研究群
兴趣范围包括:Hadoop源代码解读,改进,优化,分布式系统场景定制,与Hadoop有关的各种开源项目,总之就是玩转Hadoop
QQ群:288410967 

鲜花

握手

雷人

路过

鸡蛋

相关阅读

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

 

GMT+8, 2021-4-13 07:08 , Processed in 0.241297 second(s), 25 queries .