英伟达NVIDIA L4 Tensor Core GPU卡 用于高效视频、 AI 和图形的突破性通用加速器,3年质保

英伟达NVIDIA L4 Tensor Core GPU卡 用于高效视频、 AI 和图形的突破性通用加速器,3年质保

英伟达NVIDIA L4 Tensor Core GPU卡 用于高效视频、 AI 和图形的突破性通用加速器,3年质保

NVIDIA L4 Tensor Core GPU

用于高效视频、 AI 和图形的突破性通用加速器。

加速视频、 AI 和图形工作负载

NVIDIA L4 Tensor Core GPU 基于 NVIDIA Ada Lovelace 架构构建,采用低外形尺寸封装的 L4 GPU 是一款经济高效的解决方案,可在从边缘、数据中心到云端的每台服务器中实现高吞吐量和低延迟。

阅读 NVIDIA L4 数据表
阅读 NVIDIA L4 产品简介

高达 120 倍的 AI 视频性能

测量性能 : 8 卡 L4 与 2S Intel 8362 CPU 服务器比较,采用 CV - CUDA 预处理、解码、推理 (SegFormer) 、编码、后处理的端到端视频管线,NVIDIA ® TensorRT ® (TRT) 8.6 与使用 OpenCV 4.7 的纯 CPU 管线、 PyTorch 推理。

体验实时 AI 视频管线性能

借助 NVIDIA L4 GPU 的强大功能变革视频应用。无论是向数百万观众直播流媒体、帮助用户构建创意故事,还是提供沉浸式增强现实和虚拟现实 (AR / VR) 体验,配备 L4 的服务器均可为移动端用户托管多达 1040 个 720p30 并发 AV1 视频流。¹

NVIDIA L4 GPU 与 CV - CUDA ® 库搭配使用,可将视频内容推理提升到一个新的水平。 L4 提供的 AI 视频性能比基于 CPU 的解决方案高出 120 倍,可让企业获得实时洞察,从而个性化内容、提高搜索相关性、检测不良内容并实施智能空间解决方案

1. 测量性能: 720p30 时 8x L4 AV1 低延迟 P1 预设编码。

借助 L4 节约更多的能耗和空间

随着 AI 和视频的日益普及,对高效且经济的计算需求也比以往任何时候都更高。 NVIDIA L4 Tensor Core GPU 可将 AI 视频性能提高多达 120 倍,与基于 CPU 的传统基础设施相比,其能源效率提高 99 % , 降低总拥有成本。这使得企业能够减少机架空间并显著降低碳足迹,同时能够将数据中心扩展到更多用户。在 2 兆瓦的数据中心内从 CPU 换为 NVIDIA L4 所节省的能源可为近 2000 户家庭供电一年,​​或者相当于 10 年内种植 172000 棵树所抵消的碳 ²。

2. 结果来自 EPA 计算器,节省 1.677 兆瓦 。

提高能源效率

8 卡 L4 与 2S 英特尔 8362 CPU 服务器 TCO 比较:带有 CV - CUDA 预处理和后处理、解码、推理 (SegFormer) 、编码、 TRT 8.6 的端到端视频管线与使用 OpenCV 4.7 、 PyTorch 推理的纯 CPU 管线。

加速生成 AI 性能

高达 2.5 倍的生成 AI 性能

预计性能:L4 与 NVIDIA T4 Tensor Core GPU 图像生成、512x512 稳定扩散 v2.1、FP16、TRT 8.5.2。

用于图像和文本的生成式 AI 使客户的生活更加便利,并在所有行业中获得更加身临其境的体验。 NVIDIA L4 增强了计算密集型生成式 AI 推理,其性能比上一代 GPU 提高了 2.5 倍。 L4 的内存容量增加了 50 % , 可实现更大的图像生成,最高可达 1024x768 , 这是上一代 GPU 所无法实现的。


优化图形性能

超过 4 倍的实时图形和 3 倍的光线追踪性能

测量性能:
实时渲染: NVIDIA Omniverse 性能,可在 1080p 和 4K 下使用 DLSS 3 进行实时渲染。
光线追踪:支持光线追踪和 DLSS 3 的 AAA 级游戏的游戏性能 geomean。

采用第三代 RT 核心和 AI 驱动 NVIDIA 深度学习超级采样 3 (DLSS 3), NVIDIA L4 为基于 AI 的头像、 NVIDIA Omniverse ™ 虚拟世界、云游戏和虚拟工作站提供了超过 4 倍的性能提升。这些功能使创作者能够构建实时、电影级的图形和场景,实现 CPU 无法实现的沉浸式视觉体验。

L4 高效且可持续地加速工作负载

高效且可持续地加速工作负载

NVIDIA L4 是 NVIDIA 数据中心平台的重要组成部分。专为视频、 AI 、NVIDIA RTX ® 虚拟工作站 (vWS) 在图形、仿真、数据科学和数据分析等方面构建,该平台可加速 3000 多个应用,并可在从数据中心到边缘再到云端的任何地方大规模使用,带来显著提升性能和能源效率。

L4 针对主流部署进行了优化,提供了在 72W 低功耗封装中运行的小尺寸外形,使其成为适用于 NVIDIA 合作伙伴生态系统中任何服务器或云实例的高效、经济的解决方案

AI 软件简化开发

借助企业级 AI 软件简化开发和部署

为简化 AI 开发和部署,NVIDIA AI Enterprise 软件套件为包括 AI 解决方案工作流、框架、预训练模型和基础设施而优化,这些都经过认证,并可在通用数据中心平台和装有 NVIDIA L4 GPU 的主流 NVIDIA 认证系统上运行。

NVIDIA AI Enterprise 是 NVIDIA L4 GPU 的新增许可,使几乎每个组织和企业都可以访问 AI ,并在训练、推理和数据科学方面具有最高性能。 NVIDIA AI Enterprise 与 NVIDIA L4 一起简化了 AI 就绪平台的构建,加快了 AI 开发和部署,并提供了性能、安全性和可扩展性,从而更快地收集见解并更快地实现业务价值。

产品规格

外形规格 L4
FP32 30.3 teraFLOPS
TF32 Tensor Core 120 teraFLOPS *
FP16 Tensor Core 242 teraFLOPS *
BFLOAT16 Tensor Core 242 teraFLOPS *
FP8 Tensor Core 485 teraFLOPS *
INT8 Tensor Core 485 teraTOPS *
GPU 显存 24GB
GPU 显存带宽 300GB/s
NVENC | NVDEC | JPEG 解码器 2 | 4 | 4
最大热设计功率 (TDP) 72 瓦
外形规格 PCIe
互联技术 PCIe 4.0 x16 64GB/s
服务器选项 配备 1 至 8 个 GPU 的 NVIDIA 认证系统及合作伙伴服务器

* 表示采用稀疏技术。在不采用稀疏技术的情况下,性能降低一半。

其他NVIDIA GPU产品型号介绍


北京九州云联——专业ICT综合服务提供商业务领域:服务器存储、交换机、路由器防火墙、系统软件、系统集成、ICT运维外包 


北京九州云联科技有限公司超聚变/华为产品销售团队经过多年深耕与发展,至今已成功助力超过数千家中小企业的成长。一直以来,我们的几十位销售顾问和技术专家,坚持以倾听您的需求和愿望为工作核心,以丰富的方案经验、敏锐的行业洞察和过硬的IT技术,为您提供高匹配度的解决方案,帮您做出更明智的决定。