NVIDIA RTX4090,你能用它做什么?
都说男生是世界上最简单的动物,为什么呢?举个例子,你要给女朋友送礼,你可以选择包、口红、护肤品、化妆品等,而包的品牌和样式、口红的色号等足以让你挑得眼花缭乱。而男生不一样,如果女生选择给男生送礼,我相信一块 RTX4090 就足以让他高兴得死去活来。
RTX4090 到底是何方神圣?它凭什么赢得所有男生的“芳心”?
了解GTX4090
我们先来看下 NVIDIA 官方对 RTX4090 的介绍。
The NVIDIA GeForce RTX 4090 is the ultimate GeForce GPU. It brings an enormous leap in performance, efficiency, and AI-powered graphics. Experience ultra-high performance gaming, incredibly detailed virtual worlds, unprecedented productivity, and new ways to create. It’s powered by the NVIDIA Ada Lovelace architecture and comes with 24 GB of G6X memory to deliver the ultimate experience for gamers and creators.
RTX4090 是终极的 GeForce GPU。它带来了性能、效率和人工智能驱动的图形方面的巨大飞跃,体验超高性能的游戏、极其详细的虚拟世界、前所未有的生产力和新的创作方式。它采用 NVIDIA Ada Lovelace 架构,并配备 24 GB G6X 显示内存,为游戏玩家和创作者提供终极体验。
RTX4090 采用的是 AD102 核心,拥有 11 组共 16384 个流处理器、512 个 Tensor Core、176 个 RT Core 和 176 个流处理器单元。RTX4090 采用了 NVIDIA Ada Lovelace 架构,致力于打造出色的游戏与创作、专业图形、AI 和计算性能,采用了新型 SM 多单元流处理器、第四代 Tensor Core、第三代 RT core 等多种新技术。
第四代Tensor Core
NVIDIA DLSS 3 是 AI 驱动图形领域的革命性突破,可大幅提升性能。DLSS 3 由 GeForce RTX40 系列 GPU 所搭载的全新第四代 Tensor Core 和光流加速器提供支持,可利用 AI 创造更多高质量帧。
另外,凭借全新的 FP8 Transformer 引擎,Ada 的全新第四代 Tensor Core 拥有不可思议的飞快速度,可将吞吐量提升 4 倍,达到 1.4 Tensor-petaFLOPS。
第三代RT Core
NVIDIA 发明的 RT Core 在视频游戏中实现了实时光线追踪。这种搭载在 GPU 上的特殊核心专为处理性能需求密集的光线追踪工作负载而设计。
Ada 架构采用的第 3 代 RT Core 不仅将光线与三角形求交性能提高了一倍,还将 RT-TFLOP 峰值性能提高了一倍之多。
新款 RT Core 还配备全新 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎。OMM 引擎可大幅提升对 alpha 测试纹理进行光线追踪的速度,此类纹理通常应用于树叶、颗粒和围栏。DMM 引擎能够以近乎 9 倍的速度构建光线追踪边界体积层次结构 (BVH),而所占用的显存只有之前的二十分之一。从而实现几何复杂场景的实时光线追踪。
RTX4090的应用场景
RTX4090 这么强,主要应用在哪些方面呢?
游戏
首先毫无疑问是在游戏方面的应用。RTX4090 是能驾驭各种游戏的硬核 GPU,拥有惊人的性能和超大 24GB G6X 显存,能以 8K 分辨率轻松运行多款热门游戏,支持 HDMI 2.1 所提供的 8K 60Hz HDR 和可变刷新率功能。你可以借助 RTX4090 强大的能力,在 8k 分辨率的 HDR 模式下,可以尽情体验游戏大作,尽享视觉盛宴。这也是为什么 RTX4090 是大部分男生的梦想。
相较于 RTX 3090,RTX4090 的性能基本上能达到它的两倍。当然,相应的功耗也大了不少,比 3090 高出了将近100W。下图是 RTX4090 和 RTX3090Ti 在各个游戏中的性能对比,大家可以看到 RTX4090 的表现是相当亮眼的。
△ RTX4090 vs RTX3090Ti 性能对比
AI绘画
Stable Diffusion 是我们常用的 AI 绘画软件,Stable Diffusion 是支持使用 CPU 或 GPU 来完成 AI 绘画。而在 AI 绘画中,RTX4090 展现出它在目前消费级显卡中最强的 AIGC 性能,处理速度要比次顶级的RTX 4080强上约 30%,相较于 RTX3090 Ti 也有接近 2 倍的性能提升。
说到 AI 绘画,也顺便提一下前面已经说过的 NVIDIA DLSS(深度学习超级采样 )。DLSS 是一种神经图形技术,它使用 AI 来提高性能,创建全新的帧,通过图像重建显示更高分辨率,并提高密集光线追踪内容的图像质量,同时提供最佳的一流的图像质量和响应能力,其实这也是一种 AIGC。DLSS 在部分游戏中已经支持,如今一些创作软件也有利用 DLSS 技术来做加速。这对 GPU 的性能要求很高,即使是上一代最强的 RTX3090 Ti 都难以实现,但新一代 RTX 40 系显卡的 DLSS 3 技术加入帧生成技术,使得单张显卡也都可以进行一些中轻度的创作。
深度学习推理
在大模型的训练阶段,RTX4090 是不行的。为什么这么说呢?RTX4090 虽然算力强,性价比也高,但是不支持 NVLink,这就成为了 RTX4090 不能成为大模型训练的主要原因。当然,相较于 A100 40GB、80GB的大显存,RTX4090 只有 24GB 的显存,也显得相对弱了不少。于大模型训练而言,A100 相较于 RTX4090,并不是因为单卡性能强了多少,而是在于拓展性、服务、显存这些方面的优势。
RTX4090 不适用于大模型训练,为什么却可以用于深度学习推理呢?我们来了解下推理和训练有什么区别。
深度学习推理是指在已经完成训练的深度学习模型上进行实际应用和预测的过程。在深度学习中,模型的训练阶段是为了调整模型的参数和权重,以使其能够准确地对训练数据进行分类、预测或生成。一旦深度学习模型完成训练,它就可以用于推理阶段,即对新的输入数据进行处理和预测。
在训练阶段,GPU 不仅需要存储模型参数,还需要存储梯度、优化器状态、正向传播每一层的中间状态(activation)。训练任务是一个整体,流水线并行的正向传播中间结果是需要存下来给反向传播用的。为了节约内存而使用流水线并行,流水级越多,要存储的中间状态也就更多。
而在推理阶段,模型将接收输入数据,并通过前向传播算法计算输出结果。这个过程不涉及参数的更新或反向传播的计算,而是利用模型已经学到的知识来进行预测。推理任务中的各个输入数据之间并没有关系,因此流水线并行不需要存储很多中间状态。
0元体验RTX4090
在了解 RTX4090 的强大后,你可能在为没办法体验到它而感到遗憾。那么我偷偷告诉你,又拍云联合厚德云推出 RTX4090 GPU,新用户完成注册即可 0 元体验 。你只要完成下面 3 个步骤即可:
1. 创建厚德云账号并完成实名认证;
2. 领取体验金
登录厚德云后在 GPU 中选择 NVIDIA 4090,点击免费体验,按步骤领取体验金即可。
3. 开启体验之旅
领取体验金后即可创建 4090 云主机,点击免费体验,选择镜像,镜像根据需要进行选择,比如 “image-gpu-sd_webui_20231018” 已经预装了 stable Diffusion,然后点击立即下单即可,体验金会抵扣掉下单金额哦。
下单后等待创建,显示运行中就可以使用啦。
NVIDIA RTX4090,你能用它做什么?的更多相关文章
- ubuntu16.04 caffe(GPU模式)安装
历时5天终于完成了,配置中出现了各种各样的Error,这里记录一下,希望能为正在安装的人提供一点帮助. 配置中主要参考博客:http://blog.csdn.net/yhaolpz/article/d ...
- [AI开发]深度学习如何选择GPU?
机器推理在深度学习的影响下,准确性越来越高.速度越来越快.深度学习对人工智能行业发展的贡献巨大,这得益于现阶段硬件计算能力的提升.互联网海量训练数据的出现.本篇文章主要介绍深度学习过程中如何选择合适的 ...
- 嵌入式cpu架构
原文:http://www.kaixin001.com/repaste/11007221_7220618944.html### 内容: 目前主要CPU架构有ARM.X86/Atom.MIPS.Powe ...
- ubuntu(linux)占领小米平板2(mipad2)
昨天 2014年,媳妇坐月子,给媳妇买了mi6和一个小米平板2(16G).是我们人生拥有的第一个平板,激动不已. 买之前看了小米平板1的口碑不错,arm构架,NVIDIA的主板好像,图形处理做得当然没 ...
- Perseus-BERT——业内性能极致优化的BERT训练方案
一,背景——横空出世的BERT全面超越人类 2018年在自然语言处理(NLP)领域最具爆炸性的一朵“蘑菇云”莫过于Google Research提出的BERT(Bidirectional Encode ...
- NVIDIA面目生成器再做突破
导读 NVIDIA创建的AI系统“GAN”可以通过对图像数据库的学习,来随机生成超逼真人脸照片而一炮走红,经过长时间的研发与晚上目前这套系统已经有了极大的进步.除了可以自主学习之外,生成的内容逼真,让 ...
- Fedora 21 安装 Nvidia 驱动以及失败后的补救方法
在 Linux 桌面系统下玩了这么久,大部分时间都是使用 Ubuntu,偶尔使用一下 Fedora.我的电脑中安装有多个 Linux 发行版,见这里<在同一个硬盘上安装多个Linux发行版及Fe ...
- ubuntu14.04+nvidia driver+cuda8+cudnn5+tensorflow0.12
文章在简书里面编辑的,复制过来貌似不太好看,还是到简书的页面看吧: http://www.jianshu.com/p/c89b97d052b7 1.安装环境简介: 硬件: cpu:i7 6700k g ...
- [转]Android通过NDK调用JNI,使用opencv做本地c++代码开发配置方法
原文地址:http://blog.csdn.net/watkinsong/article/details/9849973 有一种方式不需要自己配置所有的Sun JDK, Android SDK以及ND ...
- ubuntu14.04下的NVIDIA Tesla K80显卡驱动的安装教程
搞深度学习如何能够不与浑身是“核”的显卡打交道呢? 人工智能的兴起除了数据量的大量提升,算法的不断改进,计算能力的逐步提高,还离不开软件基础设施的逐步完善.当下的主流的深度学习工具软件无论是Caffe ...
随机推荐
- 《Kali渗透基础》11. 无线渗透(一)
@ 目录 1:无线技术 2:IEEE 802.11 标准 2.1:无线网络分层 2.2:IEEE 2.3:日常使用标准 2.3.1:802.11 2.3.2:802.11b 2.3.3:802.11a ...
- 《SQL与数据库基础》09. 事务
@ 目录 事务 简介 操作 方式一 方式二 四大特性(ACID) 并发事务问题 事务隔离级别 本文以 MySQL 为例 事务 简介 事务是一组操作的集合,它是一个不可分割的工作单位.事务会把所有的操作 ...
- (2023.7.15)软件加密与解密-番外1-PWN2REVERSE[XDbg]
/提示:如果你看到了这行文字,那说明您的预览器不支持内嵌 CSS 代码,请使用 VSCode 阅读本 Markdown 文件/ 每天一个技术点 (2023.7.15)软件加密与解密-番外1-PWN2R ...
- [译]这几个CSS小技巧,你知道吗?
前言 在网页设计和前端开发中,CSS属性是非常重要的一部分.掌握常用的CSS属性不仅可以使你的网页看起来更美观,还能提升用户体验,今天小编为大家介绍8个常见的CSS小技巧: 1.修改滚动条样式 下图是 ...
- C#中的ConcurrentExclusiveSchedulerPair类
为什么使用ConcurrentExclusiveSchedulerPair? 现实生活中的例子是一个停车场的入口和出口,多辆车可以同时进入和离开停车场,但是只有一个车辆可以进入或离开一次. 这时候就需 ...
- FastDFS入门
一.系统架构 二.构成部分 1.Tracker Server:跟踪服务器,记录文件信息,可单台或集群部署. 2.Storage Server:存储服务器,文件存储位置,分卷或分组部署. 3.Clien ...
- 《Hadoop大数据技术开发实战》新书上线
当今互联网已进入大数据时代,大数据技术已广泛应用于金融.医疗.教育.电信.政府等领域.各行各业每天都在产生大量的数据,数据计量单位已从B.KB.MB.GB.TB发展到PB.EB.ZB.YB甚至BB.N ...
- 防火墙&&firewalld&&iptables
防火墙&&firewalld&&iptables 目录 防火墙&&firewalld&&iptables 一.firewalld 1.c ...
- HTML一键打包APK工具最新版1.9.2更新(附下载地址)
HMTL网址打包APK,可以把本地HTML项目, Egret游戏,网页游戏,或者网站打包为一个安卓应用APK文件,无需编写任何代码,也无需配置安卓开发环境,支持在最新的安卓设备上安装运行. 打包软件会 ...
- Vue-进阶:路由及elementUI组合开发
Vue-router路由 什么是vue-router? 服务端路由指的是服务器根据用户访问的 URL 路径返回不同的响应结果.当我们在一个传统的服务端渲染的 web 应用中点击一个链接时,浏览器会从服 ...