NVIDIA英伟达

NVIDIA英伟达（http://www.nvidia.cn//）

向厂商驻站专家提问

0/50开始提问

来自主题GPU 容器云平台 GPU资源池
在容器云环境建设和优化GPU资源池的过程中，平台的兼容性和可靠性如何保证？
Monica WangNVIDIA英伟达擅长领域：GPU，服务器，云计算
发布于 2022-04-28 · 2 会员关注
NVAIE软件套件基于Redhat Openshift, VMware Vsphere 7.02+, 上游Kubernets 平台都已经过认证和测试。客户选用NVIDIA 开源AI软件是未经过测试的。
赞同2
回答
浏览 2934
来自主题GPU AI GPU资源池
gpu池化是基于物理机直接池化还是在gpu虚拟化的基础上进行池化？二者优缺点对比？
Cui XiaonanNVIDIA英伟达擅长领域：服务器，GPU，人工智能
发布于 2022-04-28 · 4 会员关注
补充一个在GPU池化过程中需要注意的地方。GPU池化表面看起来CPU池化的效果是一样，但是本质有很大的区别，因为在CPU池化后，CPU直接彼此的工作是很少的，但是GPU完全不同，尤其是多张GPU在一些并行计算密集的地方，还需要集合NVLINK技术实现高速的GPU之间的数据交换。另外对于通过虚... (more)
赞同1
回答
浏览 5370
来自主题GPU GPU资源池
GPU资源池化加速AI工作负载方向上，是怎么解决切分、跨节点资源聚合与调用问题的呢？
Monica WangNVIDIA英伟达擅长领域：GPU，服务器，云计算
发布于 2022-04-28 · 2 会员关注
使用GPU Operator。它使基础架构团队能够在集群级别与 Kubernetes 一起使用时管理 GPU 的生命周期。因此，无需单独管理每个节点。以前，基础架构团队必须管理两个操作系统镜像，一个用于 GPU 节点，一个用于 CPU 节点。使用 GPU Operator 时，基础架构团队也可以将 CPU 映像与 ... (more)
赞同1
回答
浏览 2642
来自主题虚拟化 GPU GPU资源池
GPU资源池化技术对比传统虚拟化技术，计算加速比提升效果如何呢？
Monica WangNVIDIA英伟达擅长领域：GPU，服务器，云计算
发布于 2022-04-28 · 2 会员关注
NVIDIA AI Enterprise软件套件在VMware Vsphere 上做了认证和测试，在A100 GPU裸金属环境下运行 BERT-Large或者SSD-Resnet34模型，和在VMware Vsphere 运行的速度是非常接近的。如果客户已经有了VMware的虚拟环境，建议采用NVIDIA AI Enterprise软件套件，可以确保GPU... (more)
赞同1
回答
浏览 2869
来自主题容器容器云 GPU
容器云环境建设和优化GPU资源池的生态和管理？
Monica WangNVIDIA英伟达擅长领域：GPU，服务器，云计算
发布于 2022-04-28 · 2 会员关注
可以使用NVAIE软件套件，该软件套件在Openshift, VMware Tanzu以及上游K8S都已做了性能认证，可以通过NVAIE中的Operator模块支持云原生的编排调度和扩展。
赞同1
回答
浏览 2265
来自主题GPU 云原生 GPU资源池
GPU池化能力如何以及实现方案？
Monica WangNVIDIA英伟达擅长领域：GPU，服务器，云计算
发布于 2022-04-28 · 2 会员关注
通过使用NVAIE软件套件中的GPU Operator 来实现GPU池化能力。NVAIE也已在Redhat Openshift, VMware Tanzu,以及K8S 平台做了认证。客户可以通过购买NVAIE软件获得专业服务指导如何配置GPU池化方案。
赞同1
回答
浏览 3642
来自主题虚拟机容器云 GPU
容器和虚拟机混用环境下，同一个GPU资源可以同时对两者提供服务吗？
Monica WangNVIDIA英伟达擅长领域：GPU，服务器，云计算
发布于 2022-04-28 · 2 会员关注
使用 NVIDIA AI Enterprise on vSphere 交付 AI 工作负载时，有多种编排方法。1.带有 Docker 的虚拟机允许您使用带有启动脚本的虚拟机模板。启动脚本将运行 docker 容器和 Jupyter 笔记本，供您的 AI 从业者或数据科学家使用。通过这些 VM 模板，您可以使用 VMware 的 vRA、Ho... (more)
赞同4
回答
浏览 3059
来自主题容器云 GPU GPU资源池
容器环境中GPU资源池中可以多种切分方式并用吗？效果如何？
Cui XiaonanNVIDIA英伟达擅长领域：服务器，GPU，人工智能
发布于 2022-04-28 · 4 会员关注
关于GPU高效共享的解决方案，行业有很多的技术实现，大致分成Remote CUDA，CUDA原生实现，GPU硬件实现。 1. R-CUDA的方案，也叫远程CUDA和CUDA劫持，是一种基于驱动或CUDA句柄的拦截和转发机制，英伟达官方并不支持这样的做法，尤其在跨服务器请求转发方面，其性能和效果对于网络和处理延... (more)
赞同2
回答
浏览 3087