影驰RTX 4060 Ti星曜OC评测:纯白颜值甜点,纵享1080p高帧光追游戏

陈沐梁 泡泡网原创

2023年05月24日 21:00

评测

RTX 40系的中高端显卡在这半年多的时间里面已经陆续发布,但对于更广大的玩家来说或许更加关心的是甜品级的60级别显卡表现。毕竟根据Steam游戏平台的统计,目前硬件排行榜前五的显卡当中有4款都是60级别,而接近80%的玩家都在1080P或更低的分辨率下运行游戏。而刚刚发布的RTX 4060 Ti显卡起售价也正好是定在了3199元,和上一代同定位产品大致接近,那么本期我们就来实测看看它的表现。

01/ Ada Lovelace架构与GeForce RTX 4060 Ti 8GB

Ada Lovelace架构

作为RTX 40系列显卡核心所采用的新一代架构,Ada Lovelace架构Ada Lovelace架构核心配备了全新的第三代RT Core(光线追踪核心)、第四代Tensor Core(张量核心)以及SM(流式多处理器)。而其SM(流式多处理器)可带来至多两倍的性能提升,并且结合全新的TSMC 4N工艺加持,带来至多两倍的能效提升。

▲Ada Lovelace架构核心 SM结构图

而在光追性能的提升上,Ada Lovelace架构核心于RT Core上引入的两个全新硬件单元——Opacity Micro-Map引擎和Displaced Micro-Mesh引擎,其可以提升光线追踪的计算效率,则使得全景光线追踪得以实现,从而带来更为逼真的阴影及纹理细节,

▲第三代RT Core结构示意图,相比前代,增加了2个功能

Ada Lovelace架构核心配备的第四代Tensor Core则是引入了来自专业级H100数据中心GPU的 FP8 Transformer 引擎,通过引入专业级产品的配置带来了更加强悍的AI算力。在算力方面的提升不仅是在DLSS 3技术中有所发挥,也可以使得其在AIGC的内容生产上拥有更好的表现。

Ada Lovelace架构核心的升级也带来了Shader Execution Reordering(SER/着色器执行重排序)技术来更好的对于着色器的工作进行调度排序。在夜间接入这一项功能接口的应用中,可根据使用过程中的不同负载进行执行渲染,将负载较为统一的画面进行集中处理以提升效率,降低画面渲染的工作资源开销。

▲SER 着色器执行重排序

对于影视需求用户来说,Ada Lovelace架构核心还配备有全新的第八代NVENC硬件编解码器,这一全新的第八代NVENC硬件编解码器在支持传统的H.265等格式之外,整合了对AV1视频编码格式的支持,有效提升了在视频内容创作方面的生产力表现。

Ada Lovelace架构核心在现阶段显存带宽提升有限的情况下,大幅度提升了Die上的L2缓存容量,从而带来数据命中率的有效提升,减少数据频繁访问VRAM的次数,为光线追踪等相关性能场景的表现带来更高的收益。

DLSS 3

Ada Lovelace架构核心的多方面升级,也让RTX 40系列显卡获得DLSS 3技术的加成。而根据NVIDIA官方的介绍,DLSS 3技术由DLSS 2(DLSS 超分辨率技术)+DLSS 帧生成技术+NVIDIA Reflex这三方面所共同组成。

DLSS 3帧生成技术依赖于Ada Lovelace架构核心的独立光流处理器以及Tensor Core的AI算力,这一项技术在运作过程中,将通过光流处理器所得到的一系列数据,以光流加速技术(Optical Flow Acceleration,简称为OFA)以及Tensor Core所提供的AI算力来进演算画面内容以及进行画面的优化,从而实现帧数上的提升。

DLSS 3帧生成技术可直接生成游戏第1帧3/4的像素以及整个游戏第2帧,相当于使用1/8的算力,就完成了整个计算过程。而通过这一个流程的循环,可在提升帧数的同时节省资源开销,进一步带来更好游戏体验。

DLSS 3帧生成技术可以极大提升游戏的帧数表现,但由于可能带来延迟的增加,因此DLSS 3中帧生成技术的开启需要整合NVIDIA Reflex这一技术来降低渲染以及操作的延迟,从而带来帧数更高且流畅性更佳的体验。根据NVIDIA官方的说法,DLSS 3帧生成技术配合NVIDIA Reflex,可使得游戏体验拥有媲美甚至是超越原生级的渲染、操作体验。

RTX 4060 Ti 8GB

GeForce RTX 4060 Ti采用的是全新一代Ada Lovelace架构核心AD106, 一颗完整的AD106核心拥有完整的3组GPC,每个含有6个TPC,共18组TPC,每组有两个SM单元,共36组,4608个CUDA单元,拥有一个NVENC和两个NVDEC。

完整AD 106核心架构切片图

不过,和完整的AD106核心相比,RTX 4060 Ti少了两个SM单元,有4352个CUDA单元,而且NVDEC也少一个,与RTX 4070一样拥有NVENC和NVDEC各一个。

RTX 4060 Ti 8GB 核心架构切片图

在显存带宽方面,我们可以注意到RTX 4060 Ti 8GB配备的是128 Bit的显存控制器,结合18 Gbps的显存速率以及8GB的GDDR6显存容量,总计显存带宽为288 GB/s。

从这一显存带宽数据来看,其相比较于上一代RTX 3060 Ti的448GB/s显存带宽有很大的跌幅。不过英伟达官方的解释是,由于RTX 4060 Ti 在Die上配备了32MB的大容量L2,相比较于RTX 3060 Ti所配备的4MB L2有着8倍的容量提升。大容量L2的配备使得数据命中率有着大幅度的提升,核心无需频繁访问VRAM,从而有效减少了对于显存带宽的依赖。

英伟达官方举例表示RTX 4060 Ti 通过配备32MB的大容量L2,实现了等效554 GB/s的显存带宽,而通过32MB大容量L2的配备,即可支持RTX 4060 Ti 在1080P定位下全高画质+光追的高帧率游戏体验。

▲小容量L2缓存需频繁调度VRAM

▲大容量L2缓存可减少调度VRAM的次数

我们本次测试的影驰 GeForce RTX 4060 Ti 8GB星曜OC的Boost频率提升到了2685MHz,相比较于公版RTX 4060 Ti的2535 MHz更高,可以在性能方面带来一定提升。

02/ 外观拆解

外观方面,40系影驰星曜显卡主打纯白美学与ARGB炫光设计,外壳采用钻石风切割设计覆盖,下放则是的纯白色的一体金属装甲。影驰 GeForce RTX 4060 Ti 8GB星曜OC显卡三围尺寸为含挡板为327*147*48mm,相比同系的RTX 4070体积要更小一些。

显卡采用的新一代星卓 III 散热系统,配备 3 个特制直径 92mm、厚度 20mm 的高规格风扇,每个风扇拥有 11 片透明的静霜扇叶,可实现更强风力和更大风量,并支持智能启停。

纯白色的金属背板有将近一半的区域采用了镂空设计,气流可以直接穿透显卡,大大提升了散热效率。

显卡供电接口采用了传统的单8 Pin设计,除了安装更加方便以外,对纯白主题装机来说,旧款电源的白模组线可以之间连接,免去转接到新接口也会让机箱更加整洁。

显卡侧板提供3个DP1.4a和1个HDMI 2.1接口,整卡厚度约占2.5槽。

随显卡附赠了星曜专属的ARGB灯光支架,可以实现与显卡的灯光同步。

灯效也是星曜系列的设计亮点之一,显卡顶部信仰 LOGO 灯营造出千层镜光效,搭配三个透明 ARGB 扇叶,酷炫兼具未来科技感,电竞氛围感全线拉满。

星曜系列的透明上盖一直是采用了易于拆卸的设计,可以支持个性 DIY涂装定制且不影响售后质保,玩家可以更加自由地打造个人专属外观。

进一步拆开散热模组我们还能看到星卓 III 散热系统包含的三根6mm 镀镍复合热管、大面积高效能均热板和鳍片,结合回流焊接工艺,带来更强的散热性能。

在PCB的部分,影驰 GeForce RTX 4060 Ti 8GB星曜OC采用了8+1相的强化供电设计,规格高于公版的5+1相。

位于正中间的,自然是AD106-350-A1核心,核心周围有四颗三星的GDDR6显存,单颗容量2GB、位宽32bit,合计8GB、位宽128bit。

03/ 基准测试

为了更好的模拟日常用户的配置情况,笔者将以影驰 GeForce RTX 4060 Ti 8GB星曜OC与英特尔13代酷睿i5-13600K为基础,搭建相对应的测试平台,具体配置可看下方图表。

=

通过GPU-Z查看相关的信息,我们可以看到影驰 GeForce RTX 4060 Ti 8GB星曜OC的相关信息,其Boost频率为2685MHz,TGP为160W,MAX 功耗可手动解锁至 200W以获得更高的手动超频空间。

在3D Mark的理论测试中,影驰 GeForce RTX 4060 Ti 8GB星曜OC相比较于上一代的甜点级产品RTX 3060 Ti综合下来拥有13%左右的理论性能提升。而得益于RTX 4060 Ti显卡在核心方面针对光追性能的提升,我们也可以看到,影驰 GeForce RTX 4060 Ti 8GB星曜OC在代表光追测试的Port Royal项目上拥有15%的得分差距。

04/ 游戏性能测试

在测试的四款3A游戏中,影驰 GeForce RTX 4060 Ti 8GB星曜OC除了在《战争机器5》这一款游戏中相比较于上一代RTX 3060 Ti基本持平以外,在其他的游戏中都能有10%左右的性能领先,可实现流畅的画面运行。

当然,对于RTX 40系列显卡来说,更为显著的优势会体现在支持DLSS 3帧生成的游戏上。影驰GeForce RTX 4060 Ti 8GB星曜OC可凭借核心内置的光流加速器以及更强的AI算力,来对游戏画面进行演算,提升游戏帧率表现。

随着英伟达越来越多的游戏开发者进行合作,后续推出的游戏中会有越来越多产品支持DLSS 3。而目前,已经有包括《F1 22》、《赛博朋克 2077》、《巫师三 重制版》等一系列游戏加入了DLSS 3的支持,即将推出的《魔戒:咕噜》这一指环王IP的游戏也会有DLSS 3的加入。

通过以下三款光追游戏的实测对比我们也可以看到,影驰 GeForce RTX 4060 Ti 8GB星曜OC在开启DLSS 3后,对比只能开启到DLSS 2的RTX 3060 Ti来说,帧率领先的幅度可以扩大到40%以上,甚至部分光追游戏在2K分辨率下也能获得超过60帧的平均帧。



有朋友可能会对DLSS 3是否会对游戏画面以及游戏延迟产生劣化影响,因此笔者也是对其进行了实际的测试。

在同样的游戏画面中通过OSB截取开启DLSS 3和关闭DLSS的画面可以看到,开启DLSS 3模式的画质(下图左半部分),比原生分辨率(下图右半部分)甚至拥有更为锐利的画面表现。因此玩家基本上无需担心开启DLSS 3后会有游戏画面劣化的问题。


而在游戏的延迟方面,我们可以看到影驰 GeForce RTX 4060 Ti 8GB星曜OC在开启了DLSS 3之后,游戏不仅是在帧数方面有所提升,并且也可以因为NVIDIA Reflex的介入以及平均帧数的提升,带来更低的游戏延迟。


笔者也在游戏过程中记录了RTX 3060 Ti以及影驰 GeForce RTX 4060 Ti 8GB星曜OC的平均功耗情况。可以看到,同样为“甜点”级别显卡的情况下,RTX 4060 Ti在游戏过程中所需的功耗相比较于上一代产品有大幅度降低,结合上面我们实测的帧数来看,能耗比有了很大的提升。

 

05/ 生产力测试

首先在视频创作方面,在对同一段10分钟的1080P素材导出为H.265格式时,影驰 GeForce RTX 4060 Ti 8GB星曜 OC相比较于RTX 3060 Ti已经是快出了不少。而当进行视频转码为AV1格式时,由于RTX 3060 Ti并不支持到AV1格式的编解码,所以只能依赖于CPU进行软件编解码,效率大幅度下降。影驰 GeForce RTX 4060 Ti 8GB星曜OC相比较于来说有了近10倍的效率提升。

在渲染能力方面,笔者采用到了V-Ray5 BenchMark 以及Blender BenchMark来对RTX 3060 Ti以及影驰 GeForce RTX 4060 Ti 8GB星曜OC进行相关的对比。从两个项目的测试可以看到影驰 GeForce RTX 4060 Ti 8GB星曜OC的相当明显,相比较于RTX 3060 Ti拥有更好的表现。

在集成了众多工业软件基准测试的SPECviewperf2020中, RTX 4060 Ti也是形成了对于RTX 3060 Ti的全方位提升,对于有相关需求的用户来说更加适合购买。

近期基于AIGC的生成式AI应用也是非常的火热,笔者进行了相同生成条件下的Stable Diffusion绘图测试。在同样的条件设置下,影驰 GeForce RTX 4060 Ti 8GB星曜OC生成20张图片的耗时为194秒,而RTX 3060 Ti耗时为222秒。综合换算下来,影驰 GeForce RTX 4060 Ti 8GB星曜OC每分钟可生成 6.185张图片,RTX 3060ti 每分钟可生成5.405张图片。RTX 4060 Ti整体拥有14%的算力提升。

另外,英伟达在近期推出了一项重磅更新——RTX Video Super Resolution,这一项功能翻译过来就是视频超分辨率技术,简称VSR。它可以允许用户在播放视频时,以GPU配备的Tensor Core以及强悍的AI算力来进行内容的计算,从而提升画面分辨率,带来至多4K分辨率视频输出,为用户带来视频观感的提升。

在这里我们也通过截取同一帧画面,通过英伟达ICAT进行画面对比,方便各位感受到VSR 带来的画面效果提升。可以看到,通过开启VSR进行增强后,画面的细节有了明显的改善,并且画面的噪点有了明显的降低。

▲左480P原生画面,右 480P RTX VSR 4X画面

▲左480P原生画面,右 480P RTX VSR 4X画面

在本地端的VLC播放上,笔者选取了720P的《少女与战车》播放,通过播放内容的对比我们可以看到,在VLC播放时开启VSR功能后,画面的噪点被进行了明显的压制,并且画面的线条整体更为锐利清晰,对于观感加成不少。

▲左720P原生画面,右 720P RTX VSR 4X画面

▲左720P原生画面,右 720P VSR 4X画面

从画面的对比上,我们可以看到VSR功能带来了更好的画面观感,对于用户的体验是有明显的加分的。而有朋友会好奇,开启VSR后GPU会进行相关的内容计算,这部分计算会不会带来更高的功耗?因此我们也是针对这一问题进行了功耗测试。

在4K分辨率屏幕下通过网页端播放1080P《某科学的超电磁炮》时,RTX 4060 Ti 8GB在不同的VSR档位设置中的功耗区间如下:

在4K分辨率屏幕下通过本地VLC播放器播放720P《少女与战车》时,RTX 4060 Ti 8GB在不同VSR档位设置中的功耗区间如下:

从功耗来看,RTX 4060 Ti 8GB在开启VSR功能后,其功耗的增长并不大,但是却可以带来更好的画面观感,因此推荐用户开启这一项功能。

06/ 散热测试

在室温24±1℃,采用开放式测试台的情况下,笔者对于影驰 GeForce RTX 4060 Ti 8GB星曜OC进行了散热方面的测试。

在使用FurMark烤机测试30分钟后,影驰 GeForce RTX 4060 Ti 8GB星曜OC的温度稳定在58℃左右、显卡风扇转速为1553转、功耗约160W,低温而安静。

07/ 总结

在光线追踪游戏对配置要求越来越高的当下,影驰Ge ForceRTX 4060 Ti星曜 OC作为新一代的甜品级显卡,通过DLSS 3技术为1080P游戏玩家带来了全高光追画质过百帧级的高帧流畅体验,甚至在部分2K光追游戏当中也有了一战之力,对比RTX 3060 Ti的提升还是非常明显的。同时,AV1编码功能的加入也为游戏主播及创作者带来了更高效的选择。此外,它超低的功耗以及传统的8 Pin供电接口也为旧机升级的用户带来了不少的便利。

您可能感兴趣的文章

文章模式

影驰RTX 4060 Ti星曜OC评测:纯白颜值甜点,纵享1080p高帧光追游戏

RTX 40系的中高端显卡在这半年多的时间里面已经陆续发布,但对于更广大的玩家来说或许更加关心的是甜品级的60级别显卡表现。毕竟根据Steam游戏平台的统计,目前硬件排行榜前五的显卡当中有4款都是60级别,而接近80%的玩家都在1080P或更低的分辨率下运行游戏。而刚刚发布的RTX 4060 Ti显卡起售价也正好是定在了3199元,和上一代同定位产品大致接近,那么本期我们就来实测看看它的表现。

长按识别二维码 进入泡泡网查看全文

请长按保存图片