您的位置:首页 >科技 >

NVIDIA利用最新驱动程序将GeForceRTXGPU RTXPC和RTX工作站的AI性能进一步提升3倍

导读 NVIDIA利用最新驱动程序将GeForceRTXGPU、RTXPC和RTX工作站的AI性能进一步提升3倍1NVIDIA通过最新的R555驱动程序版本进一步提升了其GeForce...

NVIDIA利用最新驱动程序将GeForceRTXGPU、RTXPC和RTX工作站的AI性能进一步提升3倍1NVIDIA通过最新的R555驱动程序版本进一步提升了其GeForceRTXGPU和RTXAIPC平台的AI性能。

NVIDIAGeForceRTXGPU和RTXPC在所有领域提供最快的AI性能,现在通过最新驱动程序将性能提升3倍

在今天的MicrosoftBuild大会上,NVIDIA宣布了一系列新的AI性能优化,这些优化现已在RTX平台上推出,其中包括GeForceRTXGPU、工作站和PC。

新的优化专门对一系列为最新的生成式人工智能体验提供支持的LLM(大型语言模型)。使用最新的R555驱动程序,NVIDIA的RTXGPU和AIPC平台现在通过ONNXRuntime(ORT)和DirectML提供高达3倍的AI性能提升。这两个工具用于在WindowsPC上本地运行AI模型。

除此之外,WebNN还通过DirectML使用RTX进行了加速。这是一个应用程序编程接口,供网络开发人员部署新的人工智能模型。Microsoft正在与NVIDIA合作,进一步提升RTXGPU性能,同时在PyTorch上添加DirectML支持。以下是新R555驱动程序为GeForceRTXGPU和RTXPC提供的功能的完整列表:

支持DQ-GEMM元命令来处理LLM的仅INT4权重量化

Llama2、Llama3、Mistral和Phi-3模型的新RMSNorm归一化方法

组和多查询注意力机制,以及支持Mistral的滑动窗口注意力

就地KV更新以提高注意力表现

支持非8倍数张量的GEMM,以提高上下文阶段性能

在Microsoft发布的生成式AI扩展ORT的性能基准测试中,NVIDIA在INT4和FP16数据类型上均表现出全面提升。由于Phi-3、Llama3、Gemma和Mistral等LLM扩展中添加的优化技术,性能提升高达3倍。

除了这些增强功能之外,NVIDIA还凭借其强大的TensorRT和TensorRT-LLM套件在消费级AIPC领域处于领先地位。该公司还提供由其GPU中集成的AI硬件(如TensorCores)提供支持的多种解决方案。

这些解决方案包括改变游戏规则的DLSS超分辨率技术、NVIDIAACE、RTXRemix、Omniverse、Broadcast、RTXVideo和其他几种技术。NVIDIA的GPU提供高达1300TOPS的AI计算能力,这远远领先于今年推出的最快,后者预计只能达到100TOPS。此外,这些PC将配备最新的NVIDIARTXGPU,进一步推动RTXAIPC平台的发展,并进一步推动AI领域在消费领域的发展。

免责声明:本文由用户上传,如有侵权请联系删除!