荒野行动15倍镜在训练场的哪里(荒野行动的无人机怎么用)
荒野行动15倍镜在训练场的哪里(荒野行动的无人机怎么用),本文通过数据整理汇集了荒野行动15倍镜在训练场的哪里(荒野行动的无人机怎么用)相关信息,下面一起看看。
英伟达RTX 40系列显卡终于与我们见面了。按照以往的惯例,游戏级别的“80”显卡通常是最先与我们见面的,但这一次,推出的第一款产品却是“90”级别的产品。
事实上,根据目前的情况,GeForce RTX 4090最初是为了照顾仍在市场上销售的RTX 30系列产品而推出的。还记得RTX 30系列显卡推出的时候,大部分RTX 20系列显卡其实都停产了,整体升级节奏明显。
目前GeForce RTX 3090的价格基本在万元以内,已经停产。,此时推出GeForce RTX 4090不足以影响RTX 30系列的整体销量。
每一个“90”级产品NVIDIA官方,其实很少宣传游戏领域。这一次,就连NVIDIA也在性能悬殊如此之大的情况下谈其游戏性能。
顺带一提,这次英伟达将限量推出GeForce RTX 4090 FE公版,将于北京时间10月12日晚9点在JD.COM上市。喜欢公版设计或者想收藏的玩家一定要做。只有拿在手里才能感受到什么是满分的工业设计。
01 NVIDIA GeForce RTX 4090概述今年的GeForce RTX 4090在外观上没有太大的变化,包装一如既往的漂亮,而且这次NVIDIA加入了环保的概念。
外包装依然使用哑光黑色纸盒,可以明显看到“GeForce RTX 4090”字体的变化。GeForce RTX的英文字符更流畅,而数字更粗。
从侧面可以看到,这款显卡的包装除了外圈的纸箱外,全部是黑色瓦楞纸。箱子两边还有黑胶带,防止运输过程中损坏。
打开的包装有点像帐篷。这个“性能怪兽”静静地躺在那里,有趣的是,显卡周围的装饰线条带来了自己的“震撼”效果。
取出显卡后,包装内包含一根16针转8针 4跳线。其实GeForce RTX 4090的推荐电源和GeForce RTX 3090 Ti是一样的,都是850W,所以RTX 30系列配备高瓦数电源的玩家可以放心升级。
NVIDIA GeForce RTX 4090 FE显卡整体尺寸为30413761mm,占用3个插槽。事实上,长度与RTX 30系列显卡相比没有变化,甚至比RTX 3090 Ti少了10mm,但整体质感和重量都有所提升。整个卡重约2.2kg,是以简洁设计著称的公版。很难想象每块AIC的显卡会有多重。
NVIDIA GeForce RTX 4090的整体设计仍然沿用了RTX 30系列显卡的外观。但由于架构升级,发热量增加,散热自然需要同步升级。这一次,GeForce RTX 4090风扇的尺寸增加,基本达到了显卡整体框架的直径。在增加散热风扇的基础上,最大风量动态增加20%,同样噪音水平的风量动态增加15%。
视频接口上,依旧采用HDMI 2.1 DP 1.4a3的四接口设计。HDMI 2.1可以支持4K 120Hz HDR和8K 60Hz HDR,对于现阶段的产品已经足够了。
至于呼声很高的DP 2.0,其实目前大部分消费级游戏显示器都没有安装,DP 1.4a标准也可以支持8K 60Hz刷新率显示器。所以,,绝对够用。
,我们真的需要这么极端的规格吗?羊毛出在羊身上,这个道理大家都懂。
由于公版使用的双轴流散热系统,在视频输出接口可以看到大量的散热片,与上一代相同。
GeForce RTX 4090的整卡功耗为450W,采用单16pin供电。目前有电源厂商发布了最新的ATX 3.0标准高端电源,自带12VHPWR的16针电源接口,最高可支持600W电源。所以如果不出意外的话,或许下一代显卡也会采用这样的单16pin供电。
目前所有显卡厂商基本都会给一根转接线,8pin4的杂乱程度可想而知。如果条件允许,一个ATX 3.0标准电源不要太整齐。
需要注意的是,目前适用于RTX 30系列的12针接口和电源适配器与RTX 40系列显卡不兼容。
,在RTX 40系列显卡中,即使是先推出的旗舰GeForce RTX 4090也不支持NVLink,无法重现昔日的四路泰坦。
,看看GeForce RTX 4090内部的PCB板。它依然采用“深V”形PCB,所有元器件依然排列紧凑,没有任何浪费,在如此紧凑的环境下配备20个3相电源。工整,堪称艺术品。
,英伟达还强调,在高负载下,GeForce RTX 4090的供电更加稳定,不会出现剧烈的电压和电流波动。
2ada Lovelace,她姓什么?让我们来看看英伟达阿达洛芙莱斯架构的介绍。让我们从阿达洛芙莱斯开始,他似乎比安培更陌生。
阿达洛芙莱斯(1815-1852)是英国数学家和计算机程序的创始人,他建立了循环和子程序的概念,被称为世界上第一个程序员。
阿达从小就很有数学天赋。她的父亲称她为“平行四边形公主”,她后来的搭档查尔斯巴贝奇称她为“数字女巫”。19岁时,阿达嫁给了她以前的理科导师,婚后她对数学充满热情。
从1842年到1843年,花了9个月的时间翻译巴贝奇《分析机概论》的备忘录,还写了很多笔记,其中对用计算机求解伯努利数做了详细的解释。,Ada被广泛认为是世界上第一个程序员。
以她的名字命名的语言——ada已经成为美国军方用来开发战斗机等尖端武器的语言。
从几行简短的传记中不难看出,阿达的一生只经历了短短的37年,却足以被后人铭记。
这就是为什么英伟达RTX 40的第一次宣传中使用了“尊重未来传奇”的口号。下面我们就来详细分析一下这款阿达洛芙莱斯有哪些创新和超越。
0Nvidia阿达洛芙莱斯架构此次发布的GeForce RTX 40系列显卡由全新的Nvidia阿达洛芙莱斯架构打造,采用TSMC 4 nm NVIDIA定制工艺。旗舰核心AD102达到了可怕的760亿个晶体管,而RTX 30系列显卡只有280亿个。
与上一代NVIDIA Ampere相比,NVIDIA阿达洛芙莱斯在相同功率下有2倍以上的性能提升。着色器数据吞吐量最高可达90-TFLOPS,而此次发布的GeForce RTX 4090达到83-TFLOPs,与上一代NVIDIA Ampere相比仅为40-TFOPs。
完整的AD102内核中有18,432个CUDA,包括12个图形处理集群(GPC)、72个纹理处理集群(TPC)和144个流多处理器(SMs)。第三代光追踪核心(RT核心)44个,第四代张量核心(张量核心)576个。可以看到,Boost频率从1.9GHz飙升到了2.5GHz。
架构图中没有反映的另一点是,AD102内核还包含288个FP64双精度浮点内核(每个SM 2个),以确保正确处理FP64代码,包括FP64张量内核代码。
,单精度浮点运算用于深度学习模型训练,双精度浮点运算用于数值模拟。通常会将FP64从游戏卡上切掉,这样既节省了成本,又对游戏本身没有影响。而专业卡是用FP64预留的,目的是训练和计算精度更高。
在这个数据中,只提到了AD102的内核配备了288 FP64。不知道后面推出的产品有没有变化。
了解了GA102的完整内核,我们再来看看RTX 4090的内核。其实知道了RTX 4090的参数,大概就能知道未来可能推出的“Ti”系列有什么区别了。
与完整的GA102相比,RTX 4090共有16,384个CUDA,包括11个GPC、64个TPC和128个SM单元,第三代RT核中有128个,第四代张量核中有512个。
实际上,根据完整的架构图可以看出,Ada架构的整体结构变化并不显著,这一点可以通过SM单元明确确认,比如相同的FP32 CUDA内核、相同的FP32/INT32混合CUDA内核、相同的L1 cache等,每个SM单元内部的Tensor Core都升级到了第四代。
,最显著的变化是第三代光学跟踪核心。我们将结合两代架构来看。在第二代光学跟踪核心中,有用于边界相交测试的盒相交引擎和用于三角形相交测试的三角形相交引擎。
在第三代光学跟踪核心中,增加了两个新的引擎不透明度微贴图引擎(OMM)和位移微网格引擎(DMM)。这两个新的硬件单元可以大大提高光学跟踪性能(具体原理后面会详细介绍)。
到目前为止,每两个SM单元组成一个TPC单元,每六组TPC单元组成一个完整的GPC顶层单元(在某些内核中,五组TPC单元组成一个GPC单元)。
每个GPC单元配有一个独立的光栅引擎和两组ROP分区(每组包含8个ROP单元)。
关于数数太多的部分就不介绍了。毕竟这个架构图大体上和NVIDIA Ampere架构基本相同。再来看看性能Ada架构以外的升级。
着色器执行重新排序(SER)着色器执行重新排序。
SER的主要作用是提高着色器性能,它可以将低效的工作负载动态重组为更高效的工作负载。光线跟踪的性能大大提高。
简单来说,GPU在执行类似工作时效率最高。随着追光效果越来越强大,每一个场景中可能会有数百万条光线照射在不同的材质上,我们知道不同材质的反射率和反射效果也是不同的。,为着色器创建了大量分散且低效的工作负载。
SER可以将这些杂乱的指令重新分类,并动态地重新组织成更高效的工作负载。根据NVIDIA的说法,SER可以将着色器性能提高多达2倍,将游戏帧率提高多达25%。
举个简单的例子,当光线第一次从发射端到碰撞端是非常规则的光线,与物体碰撞后的第二次光追,会有大量的发散和不规则的反射,对于光追负载来说是非常高的。如图所示,SER可以对这些指令进行两次排序,以最大限度地提高着色器的性能。
好在这样的实用功能并不是RTX 40系列的专利。它是一个易于集成的SDK,目前需要游戏开发者集成到游戏中。,由于是通用逻辑,未来可能会直接集成到Windows的API中,让游戏开发者直接调用系统API,无需专门引用。
可以说SER对于持有RTX 20系列及以上(可以开启光线追踪)的n卡用户来说是一大福音。毕竟谁不喜欢自由的追光表演呢?
第三代RT内核
RT Core的作用在于更快的光线追踪计算能力。如果在RTX 30系列显卡上享受4K高帧率游戏有点困难,在RTX 40系列显卡上就容易了。
在GeForce RTX 4090显卡上,实现了191 RT-TFLOPs的处理能力,而RTX 30系列显卡的最快处理能力为78 RT-TFLOPs,提升了2.4倍。而且根据英伟达官方的说法,第三代RT Core的峰值RT-TFLOPs是上一代的2.8倍。这只能说明这4090年并不是阿达洛芙莱斯建筑的最终形式。
不透明度微贴图引擎
在第三代RT内核中,引入了两个重要的硬件单元。第一个是不透明微贴图引擎,可以理解为微贴图透明引擎。它的主要作用是优化光线跟踪渲染,可以大大减少着色器的工作量。
比如树叶等复杂物体,不同的光线会影响其表现状态,光线在树叶间的反弹,所以光线追踪的计算量是巨大的。
,不透明微贴图引擎可以将光线跟踪功能烘焙到不透明遮罩中,那些形状不规则且半透明的对象可以更快、更准确地渲染,从而大大减少着色器的工作量。
位移微网发动机(DMM)
移位微网引擎可以理解为微网替代引擎,其光线追踪的BVH(包围体层次)构建速度提升10倍!使用的显存减少了20倍!
DMM由第三代RT内核在本地处理。与前几代相比,它只使用基本的三角形来渲染复杂的几何图形,大大降低了存储和处理要求。
DMM的具体工作原理从图中一目了然。新的DMM可以简化具有大量面的复杂图形,并创建简单的模型,但整体光线跟踪效果保持不变。
通过一些模型数据,我们可以看到新的DMM对模型的简化程度。原来1100万个三角面的模型,简化后只有15万个左右的微网格。BVH的建设速度增加了8.5倍,减少了6.5倍。
而这还不是最夸张的。模型越复杂,优化效果越好。在官方展示的这几组对比实例中,最快的型号可以提升15倍以上的速度,简化20倍的容量。
第四代张量核
除了追光单元的升级,第四代张量核的升级更吓人。它采用了全新的FP8 tensor引擎,在显卡GeForce RTX 4090上,吞吐量达到1.32 Tensor petaFLOPs,提升了5倍。
注意这里的单元——petaFLOPs。以前TFLOPs是万亿次浮点运算,petaFLOPs是万亿次浮点运算。
DLSS 3
此次推出的DLSS 3也是RTX 40系列的一大卖点。从DLSS 2.3到3.0版本,也可以看出这次升级的幅度有多大。DLSS 3也被英伟达官方称为神经网络渲染的新时代。
在原有DLSS超分辨率的基础上,新的DLSS 3增加了光学多帧生成技术,以生成全新的帧,而不是只有像素。
DLSS 3结合了DLSS超分辨率、DLSS帧生成和英伟达反射技术,可以重建7/8像素,性能大幅提升。
在GPU有限的游戏中,比如2K分辨率和更高分辨率,DLSS 2可以提升2倍帧率,DLSS 3可以提升4倍帧率。
这次DLSS 3跨越了一个大版本,在理念和原则上升级。我们完全“猜中”了one frame的技术。我们简单解释了一下,实现起来需要大量的推理和演算,绝对先进的理念。
,“凭空”生成的一帧,延迟肯定比《DLSS 2》高。,NVIDIA Reflex被捆绑在这个完整的DLSS 3中,可以有效地帮助减少延迟。
这不辜负英伟达“神经网络渲染新时代”的名号。纵观目前市面上的XeSS和FSR技术,DLSS绝对可以称得上是“巨人的肩膀”。,经过多年的创新,拥有上一代显卡的玩家很难体验到DLSS 3帧代。目前唯一的办法就是买一个RTX 40系列显卡。
新型光流加速器
新的光流加速器光流加速器是在第四代张量核心中新引入的,这也是为什么DLSS 3中的帧生成是RTX 40系列显卡独有的。
在原版《DLSS 2》的基础上,光加速器还可以计算连续两帧的光流场,捕捉游戏画面从第一帧到第二帧的方向和速度,捕捉粒子、反射、光照等像素信息。并分别计算运动矢量和光流,获得精确的阴影重建效果。
以《赛博朋克2077》为例。在第一帧中,光流加速器将捕获每个像素中的粒子、反射和光照的信息。并在第二帧中找到匹配的像素区域,计算帧间的差值。
如果事实证明DLSS 2可以“猜测”一张图片中的剩余像素,那么DLSS 3除了这些还可以“猜测”下一帧。
,由于《DLSS 3》的帧生成是在GPU中处理和运行的,即使在CPU瓶颈的游戏中,AI也能提高帧率。这就是为什么在这次发布会上说DLSS 3可以突破CPU的限制来增加帧数。
双通道AV1编码器
升级后的第八代NVENC编码器可以说是直播、视频、后期制作工作者的一大福音。第一次加入了对AV1编码的支持,最明显的效果就是直播。
与传统的H.264编码相比,AV1编码的效率平均提高了40%,同样的码率下,AV1编码的图像质量会更好。目前,大多数实况广播的分辨率和清晰度受到由指定的最大比特率的限制.以Twitch限制的8Mbps为例,我们可以看到,在相同带宽、相同2K 60帧的情况下,AV1编码的清晰度明显高于H.264。
说起直播,OBS相信大家都不陌生。在10月份即将发布的补丁中,OBS增加了对NVENC的AV1编码支持。
,直播只是我们更容易看到的AV1的优势。在视频工作的各个环节中,AV1编码都能带来很大的提升。
如你所见。英伟达为用户铺就了一条完整的生态链,从编码API、软件、到播放器,并将完全支持AV1编码。
先说NVIDIA一直在强调的双AV1编码。顾名思义,有些显卡配备了两个编码器,它带来的效果很明显。
,根据官方宣传,在4K H.265的出口速度上,RTX 4090比RTX 3090 Ti快2.2倍;8K H.265的导出速度是2.5倍。这部分推广,大家常用的剪辑也适用,感兴趣的用户不妨亲身体验一下。
除了导出速度,8K 60帧的视频录制在以前是不可想象的,而双编码器的优势在于可以将图像分成两部分,两个编码器分别处理76802160的图像信息,最终拼接完整。
至于编码部分,大部分用户可能感受不深,有一天,当你想录屏的时候,却发现显卡不支持,你就会意识到它的重要性.
随着图像逐渐进入超清时代,硬件编码和渲染几乎成了必不可少的帮手。虽然硬件编码在质量上还不如CPU软编码,但软编码已经做到了极致的画质,还要承受无限的时间。即使在一个8K的渲染中,两种编码方式的时间差距也达到了几个小时,更何况是一个10秒的CG动画。在硬件编码的不断改进中,质量和时间不断被挑战和刷新。
04测试.引言,我们来介绍一下考试.为了确保怪兽NVIDIA GeForce RTX 4090的性能,我们的.又被完全更新了。
但因为手头没有旗舰处理器,所以采用了这一代的中高端产品,着重升级了电源和显示屏。
因为这次性能升级和DLSS 3的加入,真正的4K时代已经到来。我们选择了爱去攻击u0026amp保时捷设计联合设计的PD32M。这里就不说设计理念了,这款显示器的性能真的很强。
配备了4K/144Hz的硬性指标,采用MiniLED背光技术,支持1600尼特峰值亮度和8000万1动态对比度,通过HDR1400认证。
10.7亿显示色彩,百分之九十七DCI-P3,99% Adobe RGB覆盖率,色彩准确度eu 0026 lt;2(平均值),色彩呈现更加准确丰富。
与此,RTX 40系列显卡的功耗也大幅增加。新谷昆仑KL-1250G金牌全模块电源配备原生12VHPWR 16pin线,无需跳线。扎实的做工设计,优质的日本电容等材料,保证了电源的稳定性和较长的使用寿命。1250W的额定功率提供了较大的冗余,轻松应对RTX 4090和80Plus金牌认证,最高可提供90%
先来看看GPU-Z的参数,NVIDIA GeForce RTX 4090采用AD102核心,TSMC 4 nm NVIDIA定制工艺。芯片面积为608平方毫米,小于RTX 30系列的GA102的628平方毫米。
CUDA有16,384台,比RTX 3090 Ti的10,752台多52%。Boost频率达到2520MHz,而RTX 3090 Ti为1860MHz,提升很大。
采用24GB GDDR6X微米内存,位宽384bit,内存带宽1008.4 GB/s,光栅单元和纹理单元分别为176和512。
05理论性能测试下面是用来测量显卡DX11理论性能的3DMARKFS包FS、FSE、FSU分别对应显卡在1080P、2K、4K的理论性能。实际测试结果如下
在3DMARK FS封装测试显卡DX11的性能时,GeForce RTX 4090的提升是惊人的。可以看出,分辨率越高,这款显卡的提升越大,FS提升48%;FSE增长了66%;FSU的暴力事件增加了75%。
整体而言,在整个FS套件测试中,GeForce RTX 4090比GeForce RTX 3090 Ti高出约63%。
在DX12环境下的Time Spy和Time Spy Extreme测试中,GeForce RTX 4090相比GeForce RTX 3090 Ti的提升如下TS提升56%;TSE增长69%,合计约63%。
PortRoyal是3DMARK中的一个测试项目,专门测试光学跟踪性能。与GeForce RTX 3090 Ti相比,GeForce RTX 4090高出约56%。
总体而言,GeForce RTX 4090的理论性能比GeForce RTX 3090 Ti高61%左右。按照CUDA的量,这个成绩是合理的。
不过,其实在功耗测试中,我们发现这款卡是有功耗限制的,这个我们后面会详细解释。
在这个测试中,我们使用了3DMARK的测试版本来测试DLSS 3。DLSS关闭时为52.19帧,DLSS 3开启时为154.98帧。
,我们还测试了GeForce RTX 3090 Ti在该程序下的性能,其中DLSS接近32.73帧,由于不支持DLSS 3,DLSS 2下的性能为83.63帧。
对于两代架构不同的产品来说,这种比较有些不公平。我们比较自己不同的改进。
GeForce RTX 4090开启DLSS 3后比关闭时增长197%;而GeForce RTX 3090 Ti在打开DLSS 2后相比关闭时增长了155%。
,《DLSS 3》最夸张的地方不仅仅是数字。我们再来看看这张图。
在8K(76804320)分辨率的DLSS 3测试中,GeForce RTX 4090在DLSS关闭的情况下只有12.7帧,属于PPT范畴。但DLSS 3开启后,达到86.11的流畅度水平,提升578%!
通过DLSS测试实际上让我非常震惊。感觉老黄说的RTX 30系显卡的“8K游戏体验”终于在RTX 40系显卡上实现了。对了,后续我们会弄个8K的显示器来测试游戏,看看8K离我们还有多远。
06常规游戏性能测试由于RTX 40系列增加了新的DLSS 3技术,稍后将单独测试。这里还是选取几款主流3A大作进行游戏性能对比。
,在《地平线5》可以明显看到,不仅在1080p分辨率,在2K分辨率下,CPU受限的情况还是很明显的。可以说,如果你从这款GeForce RTX 4090入手,4K/144Hz的显示器应该是最低配置了。
性能方面,GeForce RTX 4090相比GeForce RTX 3090 Ti的提升如下1080p提升32%;2K提升35%;4K综合增长了56%和41%。
《刺客信条英灵殿》中,GeForce RTX 4090相对于GeForce RTX 3090 Ti的提升为1080p,48%;2K增长51%;4K增长了40%,总体增长了46%。
《无主之地3》中,GeForce RTX 4090相对于GeForce RTX 3090 Ti的提升为1080p,43%;2K增长63%;4K增长了65%,总体增长了57%。
755-79000的光线追踪测试软件是一个独立于游戏的测试工具,它比游戏中使用的光线追踪技术更多。测试条件是“RTX最高/DLSS质量”。所以测试帧数比较低,实际游戏配置还是挺亲民的。
性能方面,GeForce RTX 4090相比GeForce RTX 3090 Ti的提升是1080p提升42%;2K增长54%;4K增长了60%,总体增长了52%。
在另一款国产游戏《光明记忆无限》的跑分软件中,情况与《边境》基本相同,测试条件都是在“RTX最高/DLSS品质”下进行的。
《光明记忆无限》,相比GeForce RTX 3090 Ti,GeForce RTX 4090在1080p提升50%;2K增长67%;4K增长了77%,总体增长了65%。
0DLSS 3性能测试由于这项新技术的推出DLSS 3,35游戏将在不久的将来推出新的DLSS 3功能。这次,我们也拿到了一些游戏的测试版。
,《边境》、《超级人类》、《生死轮回》《福听云》、《逆水寒》、《微软模拟飞行》将在10月陆续发布DLSS 3个版本。
《瘟疫传说安魂曲》,《赛博朋克2077》,《F1 22》,《瘟疫传说安魂曲》,《微软模拟飞行》这次测试了DLSS 3,Unity和虚幻引擎也提供了这个测试程序。
DLSS 3这次的测试图标比较复杂,增加了1%低FPS和延迟测试。普通FPS很好理解,那么这1%的低FPS是什么意思呢?
,游戏基准通常测试的FPS是游戏在一段时间内的平均帧数。1%低FPS是将一段时间内的帧数由大到小排列,取最小的1%,然后将这1%平均。
其实一言以蔽之,这两个数值并不能代表我们在玩的时候某个特定时刻的感受,只是FPS更注重整体,而1%低FPS则是从最差开始平均,更加谨慎。
知道了1%的低FPS,我们再来看看这个图表。坐标轴左边的延迟(越低越好),坐标轴右边的帧数(越高越好),两边的数值可能会因为涉及到正负坐标而不同。
目前测试《DLSS 3》的游戏都是beta版,难免会出现bug。
在《逆水寒》中,当DLSS 2打开和关闭时,分数几乎没有变化。这个游戏是一个极度吃CPU资源的游戏。如果瓶颈卡在处理器上,那么传统的DLSS 2真的无法提供更多的帧红利。
在《DLSS 3》中,我们可以明显看到帧数的显著增加。要知道我们所有的DLSS 3测试都是在4K分辨率下进行的。看起来用帧生成突破CPU瓶颈的实际表现就像宣传的那么神奇。
,帧生成并非没有缺点,这也是该测试增加延迟的原因。而打开DLSS 3后,NVIDIA Reflex是捆绑打开的。不过与DLSS 2增加的这种延迟相比,实际体验中的感觉并不强烈。
《微软模拟飞行》的数据是真实的。可以看到,即使是GeForce RTX 4090显卡也只有41帧,当DLSS以最高光线追踪关闭时,延迟达到85.7毫秒。打开DLSS 3后,帧数为127,增长了210%。尽管DLSS 2号的延迟比DLSS 2号高6毫秒左右,但仍保持在较低水平。
055-79000是一款即将发售的游戏。DLSS 3和DLSS之间的帧数增加,也达到130%。可以看出,虽然DLSS 3的延迟有所增加,但仍低于DLSS关闭后的延迟。
目前《赛博朋克2077》的数据测试也有同样的问题,DLSS off和DLSS 2都没有延迟数据。这组主要看帧数的提升。其中,与DLSS 3相比,DLSS 3的关帧数增加了124%,与DLSS 2相比,也增加了55%。
是国产游戏《瘟疫传说安魂曲》的追光测试。这一次,我们选择的演示采用了真实的全局光照。所以我尝试关闭DLSS后,第一次电脑死机重启,第二次幸运运行,帧数只有个位数,延迟已经上万了。
还记得在纯光线追踪软件中测试的《F1 22》和《逆水寒》,在这种情况下仅用DLSS 2就能达到80帧左右。而《光明记忆无限》,真正的全局光照,在DLSS 2开启后只有40帧左右,真的很恐怖。
,在画质方面,我们也进行了测试。上图中我们切掉了《边境》的一角,可以看到在两种DLSS模式下,相比原图画质几乎没有明显变化,只有栅栏处的光影效果不同。,对于帧数如此大幅度的增加,这个缺陷几乎可以忽略不计。
在Unity的测试程序中,有一组实时计算的光线跟踪DLSS的帧比较。GeForce RTX 4090打开DLSS 3后有83实时帧数;另一方面,打开DLSS 2后,GeForce RTX 3090 Ti的实时帧数为39,高出约113%。
UE5提供的测试游戏中,方便给出DLSS的快速测试,分为DLSS关(超分辨率关帧生成关反射关);DLSS 2(超分辨率性能帧生成关闭,反射开启);DLSS 3(反射开启时的超分辨率性能帧生成)第三档测试。
其中DLSS off的瞬时帧数为66帧,DLSS 2为112帧,DLSS 3为154帧。而DLSS 3在UE5测试中的延迟为57.1ms,DLSS 2的延迟为20.5ms,相对较高。
08专业软件测试作为一款“90”级显卡,拥有24GB超大显存,在内容创作者领域的应用必不可少。我们使用工业和专业软件SPECviewperf 13来运行分数测试。
对比GeForce RTX 4090显卡,上一代旗舰GeForce RTX 3090 Ti显卡和上一代游戏旗舰GeForce RTX 3080 Ti显卡。
在SPECviewperf 13的软件测试中,仍然存在很多问题。每个专业软件都有不同程度的性能提升,新推出的显卡在软件适配上或多或少都有问题。3DS MAX甚至出现了负增长,所以会在软件更新完善后进行测试。,一些软件的分数仍然可以反映GeForce RTX 4090的实力。
Blender是一款专业的3D渲染软件。这次推出的是固定基准运行软件,省去了安装软件和下载资料的麻烦。这个运行软件只需要下载启动程序,软件会自动渲染测试怪物/废品店/教室三个场景。
上图是GeForce RTX 4090显卡的分数,分别是6320/2894/2937,平均分4050;下图是GeForce RTX 3090 Ti显卡的评分,分别是3136/1812/1549,平均分2165。通过对比平均分,不难发现提升非常明显,达到了87%,对于以帧为渲染单位的动画,可以大大节省时间。
09功耗和温度测试在功耗测试中,我们选择FurMark软件进行复制测试,使用GPU-Z检测温度。功耗只算显卡本身。
GeForce RTX 4090最令人惊叹的是温度控制。看来改进后的散热器是有效的。经过14分钟的抄测,温度一直保持在60以下,核心温度只有66,对于AD102的这款旗舰芯片来说是难能可贵的。
值得一提的是,在复制测试中,我们发现显卡虽然全占,但峰值功耗徘徊在300W左右,TDP很少超过70%。在官方数据中,GeForce RTX 4090的功耗为450W。
在3DMARK的TSE复印机中,功耗有所增加,但离450W还差得很远。
,作者随后尝试手动增加功耗。虽然理论考试成绩有所提高,但作用不大。所以猜猜在目前的参数配置下300W是不是一个甜区间?也就是超过功耗后,虽然显卡的分数有所提升,但并不与增加的功耗成正比。还是出于稳定性考虑,车手限制了首发的表现,所以我们会随着RTX 40系列的上市继续观察。
10小变大飞跃。事实上,GeForce RTX 4090显卡的第一次测试时间非常紧张,而且由于DLSS 3增加的功能,大部分游戏都是beta版本,其中存在各种不稳定因素和bug。后续我们会继续更新测试方式和游戏。
Ada架构的问世,其实在我们看到架构图的时候,并没有带来非常惊艳的感觉。毕竟在大框架上,和安培太像了。我们能看到的唯一变化是在追光单元中增加了两个微型引擎。
不过实测结果真的超出了大家的预期,尤其是《逆水寒》,这是最新的能够很大程度上提取CPU和GPU性能的硬件杀手锏。但在4K分辨率下,DLSS 3开启后的平均帧数可以达到150帧。什么概念?
之前的显卡,包括RTX 30系列的旗舰产品,在4K分辨率下测试3A游戏都达不到100帧。随着Ada和DLSS 3的出现,4K/144不再是我们一直追求的极限,甚至触手可及!
可以这么说,如果你买的是GeForce RTX 4090显卡,那么4K/144Hz的显示器应该是最低配的,但这个最低配的也是市面上最顶级的。带动变相显示产业的发展,这只是其中之一,视频协议甚至会升级。
除了关系强烈的显示领域,电源、数据线、鼠标等相关领域也将陆续升级。可以说,RTX 40系列显卡的推出,对于整个DIY行业来说,是一次难得的提升。
回到显卡本身,外观方面,RTX 30系公版的设计整体变化不大,但做工用料还是王道。人们会忍不住用手去搓,但又怕不容易去掉指纹。
GeForce RTX 4090散热器的升级,除了外观更厚实之外,还有着完美的散热效果。满负荷拷贝机才60,对于一款泰坦级旗舰显卡来说真的很难得。单纯玩3A游戏迷连转都不转。这是一种怎样的体验?
在性能提升方面,GeForce RTX 4090的理论成绩比GeForce RTX 3090 Ti高出60%左右。按照CUDA的数量来说,这个改进是比较合理的。但可能是因为起跑线保守,我觉得还是没到极限。
关于GeForce RTX 4090或RTX 40系列的市场定位,很难说它会很快占据RTX 30系列或RTX 20系列的位置。况且这种“超时代”的产品也不是大多数玩家需要的。违背常理的是,NVIDIA率先推出了“90”级别的显卡,还打算让RTX 30系列消化的时间长一点。毕竟这个时间节点已经到了,不能说什么都做不了。
,英伟达将限量推出GeForce RTX 4090 FE公版,于北京时间10月12日晚9点在JD.COM上市。喜欢公版设计或者想收藏的玩家一定要做。只有拿在手里才能感受到什么是满分的工业设计。
本文到此结束,希望对你有所帮助。
更多荒野行动15倍镜在训练场的哪里(荒野行动的无人机怎么用)相关信息请关注本站。