NVIDIA利用最新驱动程序将GeForceRTXGPU RTXPC和RTX工作站的AI性能进一步提升3倍

导读 NVIDIA利用最新驱动程序将GeForceRTXGPU、RTXPC和RTX工作站的AI性能进一步提升3倍1NVIDIA通过最新的R555驱动程序版本进一步提升了其GeForce

NVIDIA利用最新驱动程序将GeForceRTXGPU、RTXPC和RTX工作站的AI性能进一步提升3倍1NVIDIA通过最新的R555驱动程序版本进一步提升了其GeForceRTXGPU和RTXAIPC平台的AI性能。

NVIDIAGeForceRTXGPU和RTXPC在所有领域提供最快的AI性能，现在通过最新驱动程序将性能提升3倍

在今天的MicrosoftBuild大会上，NVIDIA宣布了一系列新的AI性能优化，这些优化现已在RTX平台上推出，其中包括GeForceRTXGPU、工作站和PC。

新的优化专门对一系列为最新的生成式人工智能体验提供支持的LLM(大型语言模型)。使用最新的R555驱动程序，NVIDIA的RTXGPU和AIPC平台现在通过ONNXRuntime(ORT)和DirectML提供高达3倍的AI性能提升。这两个工具用于在WindowsPC上本地运行AI模型。

除此之外，WebNN还通过DirectML使用RTX进行了加速。这是一个应用程序编程接口，供网络开发人员部署新的人工智能模型。Microsoft正在与NVIDIA合作，进一步提升RTXGPU性能，同时在PyTorch上添加DirectML支持。以下是新R555驱动程序为GeForceRTXGPU和RTXPC提供的功能的完整列表：

支持DQ-GEMM元命令来处理LLM的仅INT4权重量化

Llama2、Llama3、Mistral和Phi-3模型的新RMSNorm归一化方法

组和多查询注意力机制，以及支持Mistral的滑动窗口注意力

就地KV更新以提高注意力表现

支持非8倍数张量的GEMM，以提高上下文阶段性能

在Microsoft发布的生成式AI扩展ORT的性能基准测试中，NVIDIA在INT4和FP16数据类型上均表现出全面提升。由于Phi-3、Llama3、Gemma和Mistral等LLM扩展中添加的优化技术，性能提升高达3倍。

除了这些增强功能之外，NVIDIA还凭借其强大的TensorRT和TensorRT-LLM套件在消费级AIPC领域处于领先地位。该公司还提供由其GPU中集成的AI硬件(如TensorCores)提供支持的多种解决方案。

这些解决方案包括改变游戏规则的DLSS超分辨率技术、NVIDIAACE、RTXRemix、Omniverse、Broadcast、RTXVideo和其他几种技术。NVIDIA的GPU提供高达1300TOPS的AI计算能力，这远远领先于今年推出的最快，后者预计只能达到100TOPS。此外，这些PC将配备最新的NVIDIARTXGPU，进一步推动RTXAIPC平台的发展，并进一步推动AI领域在消费领域的发展。

NVIDIA利用最新驱动程序将GeForceRTXGPU RTXPC和RTX工作站的AI性能进一步提升3倍

猜你喜欢

最新文章

今日推荐

站长推荐

热门文章