今年1月7日,NVIDIACEO黄仁勋在美国CES活动中正式发布了图灵架构的甜品级显卡RTX,而这张显卡的性能也超过了帕斯卡架构高端卡GTXTi,至此我们都认为NVIDIA已经完成了图灵架构从甜品级到旗舰级的布局,可万万没想到的是,时间过去仅仅一个月,又一款图灵架构显卡出现了,它就是令所有人都意想不到的GTXTi,比较神奇的是这张显卡奇怪的命名方式,另外虽然GTXTi使用了图灵核心,但依然打着GTX的旗号,而今天我们就将解析这张显卡的真实性能。
虽然和RTX同出身60系列的甜品级,但和RTX不同的是,GTXTi内建核心为TU(RTX核心为TU),那么使用了不同核心的GTXTi性能上是否会和RTX相差很多呢?这也是笔者非常关心的一点,我们在本次测试中也会加入RTX作为对比参照。
(GTXT并无公版发售,图为网友制作)
在测试之前我们简单分析一下GTXTi的市场定位和命名原则,很明显的一点是GTXTi使用了“GTX”的命名,因此不难理解这是一张不包含光线追踪核心和张量核心(RTCore和TensorCore)的显卡,面向的群体自然就是对两个新特性不感冒的玩家,而定价方面GTXTi为美元起(国内售价人民币¥元起),对比上代GTX0的¥元首发价,架构和性能都有大幅提升的GTXTi售¥元起非常具有吸引力。
TU都有什么新特性?
回到TU核心,和TU及GP相比,笔者也列出了如下表格:
从参数上看,GTXTi比GTX0在规格上提升了不少,而对比RTX来说确实是有着不小的阉割的,首先从流处理器上看,GTXTi比GTX0多了个流处理器单元,但比RTX少个流处理器单元,因此这是一张介于GTX0和RTX的显卡,但性能上更靠近GTX0一些。
不过显存方面GTXTi使用了图灵架构更新的GDDR6显存,因此对比GTX0的GDDR5显存有着更大的进步,显存单块比GTX0快了50%,对比RTX差距为16%,因此显存方面的差距显然让GTXTi更靠近RTX一些。
同时需要注意的是由于GTX的两张显卡并没有TensorCore及RTCore,因此对比RTX核心面积小了很多,而在制程提升的同时,为了塞入更多的晶体管,GTXTi核心面积还是大了GTX0很多,好在制程进步之后发热量也会得到更好的控制,因此我们能看到GTX0和GTXTi的TDP均为W,因此散热方面理论上我们无需担心,散热配置只要保持和GTX0一致就会得到相同的效果。
另外值得注意的一点是频率方面,虽然在20系和16系图灵显卡中,NVIDIA还是给出了频率范围,但由于新的NVIDIABOOST技术,显卡频率在实际高负荷运行时会高出纸面很多,因此这里频率数据并没有太大参考意义,同时本次笔者测试的七彩虹iGameGTXTiUltra一件OC频率设定已经高出NVIDIA给出的不少了,这款显卡的默频同表格一致,OC后核心频率为MHz,同时通过iGameZoneII官方超频软件还可以对显卡性能进行进一步超频,本文笔者也会进行GTXTi超频初体验。
最后售价方面,GTXTi定价美元起,国内售价会在元左右(七彩虹iGameGTXTiUltra6G国内售价¥元),仅比元首发的GTX0高了元,同比美元的RTX价格降低28%,因此纵向对比下来GTXTi性价比还是非常高的。
自适应着色技术?
那么TU有什么新特性呢?比较出色的一点是TU核心可以同时处理单精度浮点运算和整数运算,而即便游戏中运用单精度浮点运算更多一些,但网页端、视频流、H编码运算等都需要大量的整数运算来保证应用的流畅度,这也是为什么NVIDIA宣称在图灵架构显卡中进行直播推流会获得更加出色体验的原因之一。
此外图灵架构中NVIDIA还加入了一项可变速率着色(VRS)的新着色技术,简单来说VRS自适应着色技术分为两个部分,分别是自适应阴影着色和自适应运动着色;所谓阴影自适应着色就是图灵架构允许GPU针对特定对象进行着色的功能,当游戏画面出现不需要呈现丰富细节的阴影部分时,GPU将不会对这部分阴影进行着色,这样就可以达到节省性能的目的;而运动自适应着色则是根据游戏的动态画面智能选区着色区域的技术,例如在一款赛车游戏中,当车辆高速移动时,道路、车道标记和街道标志正常都会呈现动态模糊状态,此时玩家对于这部分也不再需要过于精细的着色效果,因此当显卡智能降低这部分的着色表现时,玩家的肉眼也不会察觉出任何变化,但此时GPU的性能就可以更多的专注于强化赛车本身的着色效果,而目前根据NVIDIA的官方信息,《德军总部:新巨像》将是第一款采用VRS自适应着色技术的游戏。
在存储系统方面,NVIDIA重新设计了图灵架构SM单元,在新的SM单元中,L1缓存、纹理单元缓存成为了新的统一缓存架构,这样的集成设计可以让L1缓存更加高效的利用系统资源,还可以重新配置共享内存使其缓存容量变得更大,举例来说,图灵SM中的96KB的缓存可灵活配置,比如传统图形计算可以划分为64KB的图形着色器缓存和32KB纹理缓存,但是在计算工作负载下,又可以变化为32KB的共享内存和64KBL1缓存,或者反过来。相比帕斯卡,图灵SM中的缓存设计带来了2倍的L1带宽、更低的L1命中延迟、最高2.7倍的L1容量和2倍的L2容量。因此理论上每个TPC单元都可以增加4倍的命中率,这也就让GPU调用系统资源更加高效,而这些特性都是帕斯卡架构所不具备的,因此理论上搭载了图灵TU核心的GTXTi也能够获得超过自身规格限制的性能水平。
潮牌本质,iGameGTXTi外观解析
这一次笔者测试的是来自NVIDIA核心AIC七彩虹的GTXTiUltra6G版本,自从Computex中七彩虹重新确立了iGame的LOGO和方向,iGame这个品牌已经越来越年轻化了,而本次笔者拿到的这款显卡仍然保持了iGame的家族设计,另外在下方小字可以看到这张卡还是基于图灵架构打造并使用了GDDR6显存,对比上一代GTX0的GDDR5,GDDR6在显存频率上有很大的提升。
显卡配件比较常规,iGame定制海报+信仰贴纸+保修卡+快速上手指南的组合已经成为了当今iGame显卡的标配,不过这一次笔者没有看到转换线和驱动光盘,不知道显卡正式发售后会不会配齐。
取出显卡,可以看到GTXTi采用和RTX一样的外观设计,三围尺寸**42mm,外壳正面保持了鲜明的电竞风格设计,显卡左侧外壳加入了纹理设计,右侧则保持磨砂外观,另外红色的iGameLOGO与外壳形成了红黑撞色。
彰显“潮牌”本性的iGame外壳设计。
这一次在GTXTi中,iGame依然使用了2*90mm+80mm三风扇设计,支持智能停启技术。
显卡侧边iGame的RGBLOGO,搭配iGameZoneII可以实现多种幻彩灯效,可玩性十足。
iGameGTXTiUltra采用了单8Pin外接供电,毕竟去掉了RTCore和TensorCore之后功耗整体下降不少,已经维持到了和GTX0同级的W规格,建议电源搭配W以上。
全金属背板使用了镂空设计,可以防止显卡热量过度堆积,同时个性化的iGameLOGO和线条点缀也让显卡背部更具设计感。
接口规格支持1*DP+1*HDMI+1*DVI,没有Type-C加入,相比RTX规格有所缩减,但DP+HDMI的组合已经能够满足多数玩家的日常所需了。
另外在接口上方iGame配置了一键超频按钮,可以通过按压实现双BIOS转换,默认状态下核心频率为MHz,一键OC后核心频率增加到MHz,性能会有小幅度提升,如果想获得更出色的表现,我们还需要进入iGameZoneII进行手动超频。
显卡拆解,剥开外表看本质
接下来笔者对这张iGameGTXTiUltra进行了一番拆解,在拆解时非公版相比公版显卡的优势完全体现了出来,不知道各位是否记得RTX和RTX公版饱受诟病的辅助供电飞线设计,在iGameGTXTiUltra中,我们看到了“正常”的供电设计。
而拆出来的PCB给笔者最大的感觉就是“空”,整个PCB右侧几乎完全空出,iGame甚至不甘寂寞的在右侧PCB玩起了线条设计,看到这样的PCB设计,对于小机箱玩家来说或许是个福音,相信未来我们能看到更多刀卡GTXTi型号出现。
供电方面,iGameGTXTiUltra使用了8相供电,电感全部使用七彩虹自家研发的i.P.P至纯供电电感,一体化的成型结构有助于更稳定纯净的传输电流。而据七彩虹介绍,这块PCB也加入了七彩虹独家打造的超量镀银技术,在每一颗电气元件和PCB的接触层全部进行镀银处理,可以保障电流传输更加稳定并减少电损耗,可以让显卡保障更出色的耐用度。
此外,虽然这一次在GTXTi中没有看到均热板,但iGame还是在MOS上方覆盖了散热模块,而超频的稳定与否很大程度都和MOS发热有直接关系,因此为MOS提供额外辅助散热能够有利于我们实现更高的超频频率。
在GTXTi中,NVIDIA使用了名为TU的GPU核心,而TU正是由TU阉割而来,光线追踪/DLSS核心被去掉之外,流处理器也有所缩减,但相应的显卡也更符合甜品级的定位,同时核心面积也从mm缩减到了mm,而对比上代GTX0来说制程和规格又有着十足的提升。
GTXTi使用了美光GDDR6显存,共六片组成6GB,至于之前宣称的GDDR5版本和5/4/3GB版本目前均没有消息投入生产,看来当时的流言可能已经被坐实为假了。
测试平台简介
虽然GTXTi的PCB允许显卡做成短卡版本,但依旧做成标准长度之后的优势就是散热鳍片的面积能够做到更大,图中可以看到iGameGTXTi采用了大面积的散热鳍片,并使用了镀镍双8mm热管以S型穿插在鳍片中间,并排交汇直触核心,可以达到优化导热面积,提升热传导效率的目的,当然具体性能我们会在烤机测试中体现。
为了保证显卡测试时其他硬件不会成为硬件瓶颈,因此笔者选择这套配置比较高端,处理器为Intel最强游戏级处理器i9-K,并且使用HyperX两条8GMHz内存组成双通道。
显卡选择部分为了更全面的比较测试结果,笔者使用了图灵架构的RTX及帕斯卡架构GTX和GTX0作为对比,另外由于GTXTi显卡并没有公版型号,因此笔者使用了来自NVIDIA核心AIC,也是大陆地区销量最大的国产品牌七彩虹GTXTiUltra显卡,测试分别超频和未超频部分,在常规测试时全部使用显卡的默频。
另外在GTXTi测试部分,笔者使用了NVIDIA的.91Beta版本,成绩不等同于正式版,其他显卡均使用NVIDIAGeForceExperience软件提供的最新版驱动。
基准性能测试,DX12大放异彩
在3DMark测试中,笔者共测试了FireStrikeExtreme、FireStrikeUltra以及针对游戏PC的DX12性能基准测试的TimeSpy三项,首先上FireStrike的测试成绩。
GTXTi的FireStrike测试成绩针对GTX0有一定提升,两项FireStrike测试分别领先了14%、4%,不过这个成绩显然没有达到我们的理想值,不过考虑到FSU测试项目针对4K分辨率,而GTXTi的目标并不包括4K,因此4K测试成绩仅拉开4%也在情理之中,但2K分辨率下的14%性能领先显得更有意义了,原本GTX0仅能在P下流畅进行游戏,现如今GTXTi提升了14%,那么在2K分辨率下自然有了一战之力。
我们再把对比范围扩大,针对帕斯卡次旗舰GTX而言,GTXTi在两项测试中分别落后了15%、31%,看得出在DX11中,GTX依然保有自己的霸主地位;对比RTX成绩分别落后19%、26%,没错,RTX在4K分辨率下测试成绩竟然反倒不如GTX,推测显存容量直接影响了4K分辨率的性能表现。
而在DX12的TimeSpy测试项目中,GTXTi终于迎来了自己的一波爆发,毕竟基于新架构研发而生,主要面向未来主流的DX12也是再正常不过的事情了。
在这项测试中,GTXTi直接领先GTX045%,将近一倍的性能提升!而在DX12中面对GTX也一样不虚,GTXTi成绩反超并领先了7%,而面对同样是图灵架构的大哥RTX成绩则落后了17%。
所以通过3DMark的测试,我们不难发现这是一张“未来可期”的显卡,虽然在DX11基准测试中GTXTi没有表现出足够亮眼的性能,但DX12中不但领先上代同级显卡近一倍,更越级反超了GTX,这也不禁让笔者更好奇这张卡在游戏中究竟能有怎样的表现了。
游戏性能测试,持平GTX
首先我们先测试一波DX12游戏,第一款游戏是《古墓丽影:暗影》,值得一提的是,这款游戏的前作是第一款支持DX12的大作游戏。此外笔者在游戏测试环节P、2K分辨率中全部使用最高特效,下文不再赘述。
在第一款参与测试的DX12游戏《古墓丽影:暗影》中,GTXTi在P、2K分辨率下分别领先GTX035%、33%,不过最为可贵的还是本来GTX0在P中仅勉强达到60帧,而GTXTi则直接将帧数拉升到了80,流畅运行完成不成问题;即便是2K分辨率下,GTXTi也超过了50帧,反观GTX0则完全没有游玩2K分辨率的可能。
而和GTX相比,两张显卡在不同分辨率下成绩表现几乎一模一样,不过对比RTX帧数依然有一定的差距。
《APEX英雄》可能是最近最火、最吸引人的免费竞技游戏了,重生工作室成功的将吃鸡、守望先锋等一众大作的优势结合于一身,成功打造出了爆款免费竞技网游,因此在本文,笔者也将这款游戏作为DX11游戏进行性能测试,具体测试方法为训练场固定位置跑图60s,并记录平均帧。
在《APEX英雄》中,GTXTi领先GTX0百分比分别为40%、50%;甚至在《古墓丽影:暗影》中相差无几的GTX也再次被甩开,看得出越新的游戏似乎对GTXTi支持度越高。
在被上部作品疯狂喂粑粑的玩家吐槽中,《孤岛惊魂:新曙光》终于发售了,游戏依然设定在蒙大拿希望郡中,玩家将面对核爆过后的全新世界,去体验看似不同又十分相似的“新”游戏。
在《孤岛惊魂:新曙光》中,GTXT交出的答卷依旧是令人满意的,全特效2K分辨率下平均帧依旧有68,甚至帧数已经非常接近大哥RTX了。
在《刺客信条:奥德赛》中,我们扮演了一名生在斯巴达但被抛弃的雇佣兵,玩家可选择加入以雅典为首的提洛同盟或以斯巴达为首的伯罗奔尼撒同盟,游戏沿袭了《刺客信条:起源》的多数优点并加以改进。
笔者之前在测试上部作品时就发现比起同类大作,游戏平均帧数总是莫名的低,而在本代作品中这个问题依旧没有得到任何改进,之前有玩家反映是D加密导致的游戏不断卡顿,而本作也毫无疑问的加入了D加密系统。
因此即便是RTX,全开特效后P平均帧也没有达到60,但GTXTi的成绩表现和GTX非常接近,到这里我们大致可以推断出两张卡几乎就是相差无几的性能了。
虽然将大逃杀玩法发扬光大的《绝地求生:大逃杀》一直饱受外挂困扰,玩家人数也一直在流失,但在《堡垒之夜》和《APEX英雄》到来之前,依旧没有一款游戏能够撼动《绝地求生》在大逃杀类游戏的霸主地位,更何况“吃鸡”一词甚至从游戏圈火到了互联网的每个角落。
早在游戏刚发售时,《绝地求生:大逃杀》优化奇烂无比,即便是GTX也难以流畅运行,如今大逃杀过了红海时期,蓝洞也确实在NVIDIA的帮助下沉淀了下来,如今我们看到即便是GTX0也能在2K下保持60帧的平均水平了,而对比起GTX0,GTXTi成绩领先了26%、23%;另外和GTX相比,两款显卡帧数依旧持平。
不夸张的说,年《巫师3》的出现直接提高了RPG游戏的玩法和深度,而这款游戏所取得的成就在近几年内也很难有同类游戏打破,哪怕拿到年的今天,这款游戏的玩法和画面也丝毫没有过时的感觉。
在老游戏《巫师3》测试中,GTXTi成绩再次逼近RTX,同时两个分辨率分别领先GTX036%、55%,而对比GTX则成绩依旧保持在同一水平线上。
综上,笔者再次列出一份百分比表格,以GTX0为%标准,GTXTi成绩平均领先%,而GTX平均领先为%,确实可以说明两张显卡的性能差距非常之小,而GTXTi对比RTX则有约17%的性能差距,通过这份百分比表格基本也能印证上面的基准测试表格,这也就说明这一次的测试并没有出现太大的误差。
性能提升10%,超频及温度测试
前面我们介绍过七彩虹的官方超频、灯控软件iGameZoneII,笔者也用这款软件小试牛刀,对GTXTi尝试了一下超频操作,在核心频率+MHz,显存频率+MHz时正常通过3DMarkTimeSpy测试,此时显卡分数为分,而在超频之前GTXTiTimeSpy的显卡分数为,分数提升了10.6%,性能提升非常可观,这还是笔者没有精细调节的结果,如果各位时间充裕,愿意耐心点慢慢调试,或许能获得更出色的性能提升。
接下来的烤机测试,笔者依旧使用了Furmark甜甜圈烤机软件,虽然这款软件有负载不够的问题,但也能衡量出一张显卡在游戏中和日常生活中的大致温度表现了,在经过10分钟的烤机测试后,可以看到GPU最高核心温度为62℃,而且此时显卡转速仅53%,噪音几乎不可闻,这也证明了iGame作为一家老牌厂商在显卡散热上确实有着成熟的解决方案。
3DM游戏硬件频道总结
结合基准测试和游戏测试,汇总所有结果,笔者完成了上面这张综合成绩表格。
可以发现GTXTi是RTX在阉割掉20%的性能之后的后继者,而其性能对比上一代的甜品级显卡性能提升了33%,这也符合NVIDIA每代性能提升30%-35%的性能区间,因此或许GTXTi才是真正的图灵架构甜品级别显卡。
比过性能我们再来算算经济账,目前RTX国内售价元,笔者这张GTXTi国内售价元,两者价格相差31%,性能相差20%,因此不考虑光追和DLSS,RTX的性价比确实是不如GTXTi的;而对比GTX0首发时的元,两者价格相差仅10%,但性能却足足有33%的差距,因此无论和同为图灵架构的RTX显卡相比还是和同为甜品级的帕斯卡GTX显卡相比,GTXTi的性价比都是足够出色的,因此如果年没有大量光追+DLSS游戏上线,那么NVIDIA的走量款显卡必定是这张GTXTi了。
那么在性能一致且大家都没有光追的情况下,目前我们究竟要不要回头选择GTX呢?通过规格分析GTX确实是多了2GB显存,这也是历代60级别显卡的短板。
但根据我们这一次进行的基准测试也不难发现,其实我们在P和2K分辨率下进行日常游戏、工作,2GB的显存差距并没有得到直接的体现,不过放到4K分辨率下,显存带来的性能差距立马就会得到体现(参考FireStrikeUltra测试结果),那么回过头来想,我们究竟会用这张甜品级显卡去体验4K游戏吗,答案显然是否定的,而且目前GTX在电商平台的售价普遍持平RTX,因此分析下来GTX的价格依旧无法对GTXTi构成实质性的威胁。
而回过头来看AMD,目前AMD推出了高端向的RadeonVII,不过这张显卡面向的对手是NVIDIARTX,而再次一级的VEGA56/64对手也是RTX级别的,再往下就只有RX/了,也就是说在-元价位,AMD依然没有一张足够“甜品”的甜品级显卡出现,在NVIDIA已经先行出牌的情况下,我们也只能看AMD下半年究竟能否拿出那张我们只闻其声不见其人的GCN末代皇帝NAVI10/11了。