为什么AMD显卡矿卡多?(矿卡为什么都是AMD的)
作者:ACFUN_AK
额……老铁们,我图吧老捡垃圾的了。最近咱借着呼吁龙芯圈和其他国产芯片停战的春风结交了不少大佬,获得了很多关注,也算是让咱的摆烂人生突然就有了一点点意义。然后咱就在刷隔壁图吧老哥的动态时发现一些有趣的事情。
首先我们得向各位承认一个错误,就是之前在前作为什么我不建议各位入手AMD RX580矿卡? 中认为A卡的能耗比太拉功耗调度有问题,这其实是因为咱没见过AMD在RX480时代下公版卡的表现,而看过视频(矿场老兵 AMD Radeon RX480 8G公版上手实测 BV1Ev4y1y79V)之后我们发现公版RX480bios其实是可以把功耗控制在110W以下的,所以相对GTX960可能还真存在能效优势,比1060的120W功耗也没有更高,虽然公版bios可能卡功耗墙降频缩肛,但是却可以把AMD GCN4.0的能耗控制在比较正常的水平,110W的显卡完全可以用单6PIN电源就能拉得动,这样就让这个显卡的功耗和能效比看起来比较正常了。虽然三星的14nm FinFET依然很拉打不过TSMC 16nm但是我们现在可以认为A卡能效差的印象应该来源于RX580马甲的强行超频。现在的一众RX470 480 570刷580 BIOS其实属于已经放弃了最佳能效频率为了堆性能强行超频的阶段了。不过虽然说了这些咱依然不建议各位捡垃圾上A卡,毕竟即使是隔壁图吧大佬出了视频之后也难免会有小白去相信JS买什么“一手自用非矿”然后回头就翻车点不亮花屏或者运行不稳之类的。
我们上期说了即使是购买矿卡也不建议上AMD的GCN4.0 RX580矿卡尤其是翻新刷BIOS白牌魔改矿渣的原因,这期我们展开说下A卡默认矿原因。
其实说起来A卡默认矿这个原因也简单,一句话就能概括就是AMD虽然GCN架构老祖传用了很多年但是这个架构相比N卡不停改进的架构更适合用来挖矿,但是玩游戏却未见得表现比同时期的N卡更好,所以当年在数次矿潮的时候A卡都能表现出极大的价格浮动。
如果各位看过测评视频和架构分享就可以知道AMD显卡其实是小核心,这点和我们之前说的CPU同理,无论ATOM核心还是继承改进VIA的国产兆芯核心其实都是小核心,正常来说小核心应该更注重能效比,而小核心提升整体性能更需要堆规模而不是考虑拉主频或者提同频性能,所以我们之前说其实兆芯的套路是正确的,提升能效比快速把核心规模数量堆起来,这样就能做到对于小核心来说实现最佳的提升整体性能,而英特尔在进入10nm之后玩起了大小核路线给原有的ATOM小核心加了料加长流水线提了频率实际上对于能效比是没啥帮助的,所以他们的纯小核心产品即使堆了8核的规格也很难再与以前的ATOM核心竞争能效了。显卡是对于并行运算有较高要求的特异化的芯片,堆核比较考验指令调度能力。大规模核心可能会出现效率降低的情况,以前的vliw和后来的GCN都或多或少存在这个问题。不过小核心的优势是很大的,vliw那个年头A卡的能效比可以吊锤N卡,各位垃圾佬可能还记得9800GT和GTS250的时代,N卡的HDMI还是哑巴的时候A卡已经集成了声卡了,而且各种场合的应用都不比N卡差,只不过vliw到了hd6000系列就不再使用了,后来的GCN的故事我们就比较熟悉了,祖传架构,多年不换,然而为何成为矿狗认证挖矿神器我们还是需要简单说下原因。
这里我们需要讲解一个概念,就是游戏卡和运算卡。所谓纯游戏卡就是阉割了游戏之外需求的晶体管,代价就是专业领域还要再做专业芯片。比如现代的N卡在12nm的伏达架构和图灵架构就完全是两个路子,比如Tesla V100和RTX2080 Ti:
这两个卡虽然看起来都是12nm的旗舰产品,然而如今在炼丹的应用上前者可以吊打后者。之前我们最早就开始试用的,到今天已经大规模应用的VITS语音合成,其实我们比较熟悉的原神AI语音模型就是用TESLA V100训练的。可以看到两张卡无论从架构还是显存上都是完全不同的套路,专业运算卡的流处理器数量更多频率更低,而显存使用的是高带宽低延迟的HBM2,功耗低,带宽大,而图灵游戏卡还在用GDDR6没X,显存容量(11G)也相比专业卡低得多,差距显而易见。
顺带说下,HBM2延迟100ns左右,LPDDR GDDR通常在150左右,比起DDR4的30—80ns还是很高的,不过显卡通常对吞吐量敏感,延迟影响不大,HBM最大的提升还是高带宽。
根据丽台官方的信息来说就是GeForce产品对于计算精度要求比较低,也许对于普通用户来说,即使发现一些数据下次也会忽略不计,比如显存错误,而专业计算卡比如Tesla V100对数据准确性和及时错误数据修正能力都非常依赖。
对于消费级用户来说GPU的浮点计算能力可以忽略不计,因为日常应用基本涉及不到,所以追求性价比的消费级用户,不会为高双精度浮点运算能力买单。而对于专业领域来说,准确性是计算结果的重要指标,双精度浮点运算能力直接影响计算的准确性和时效性。
虽然现在来看游戏卡和运算卡分家是现实,但是某种意义上过去专业运算卡和游戏卡却没有完全分离。比如很多垃圾佬折腾的运算卡改输出走集显或者双卡输出之类的其实本质上就是用运算卡玩游戏,P106不算,这是游戏卡核心砍的,一般现在常见的玩这个的都是在用TESLA P4 P40 M40之类的在玩,性能之类的吧也不能算差,就是日常使用还是有点别扭,比如最常见的问题需要改散热是因为专业卡所在的机房机架都有风道的,包括好一点的工作站机箱内部都有风扇可以实现对被动散热器的有效散热,对这点没有了解的可以看看垃圾佬以前开箱的DELL T3500的BTX板型就是这样的情况,CPU散热器完全没有风扇,但是不是被动散热机箱有风扇风道的。还有就是专业卡往往也没有视频信号输出和视频编解码器,这在玩游戏的时候或多或少也会存在性能损失以及录屏不便,包括简单视频处理转码重新编码之类的也比较困难。但是专业卡的性能在线依旧能用,显存大延迟低玩游戏也能用得上,成色一般也比较好毕竟机房和矿场还是略有差别,所以相比魔改CMP矿卡(CMP =Cryptocurrency Mining Processor,专业挖矿产品)还是有优势的。
而且虽然游戏卡和专业卡分家了,但是游戏卡挖矿也不是完全不能用,训练AI模型同理。所以我们认为矿难之后如雨后春笋般出现的AI完全是因为过去很长时间里现有的算力都流入到挖矿去了,而且就算AI模型是专业卡训练的训练出来也还是要经过显卡的运算才能应用的,所以该骂矿狗还是要骂的,毕竟那么多算力都被白白浪费参加庞氏骗局了,国家和世界得少多少优秀的AI模型啊,这些模型如果用于医疗自动驾驶工业控制等专业领域能解放多少生产力,结果这群矿狗在被质问的时候还振振有词说什么国家需要的时候会贡献算力的结果矿难之后个个都卖卡套现去了。
回到为什么A卡默认矿的问题
一般来说A卡其实面对B2C个人用户没那么美好,毕竟N卡在开普勒以后能耗比开始逆袭,Maxwell能耗比开挂一样,帕斯卡换16nm制程提频打磨麦克斯韦,后来的图灵也在一点点变好,但是从开普勒开始N卡也在逐渐抛弃游戏卡的专业运算性能开始走小核心精简核心的路线了。GK104 GK110的时代N卡的运算卡和游戏卡其实还没分那么开,而当时对标开普勒的GCN却一直兼顾游戏和运算用了很多年,RX480 RX580就是GCN4.0的产品嘛,相比前代的GCN1.0 1.1 1.2其实改进是有的但是不大,大同小异可以说是。
流处理器数量和架构决定了A卡的双精度浮点整体性能是吊锤同时期的N卡的。
Kepler 和 Maxwell 完全保留 Fermi 引入的 IEEE 754-2008 标准的单精度和双精度算术,但是相比前代每代都在砍双精度性能。这个双精度性能被砍了就是被砍了,相比限制哈希率那种可以破解的情况是无解的。所以之前图吧建议垃圾佬即使是捡垃圾也不要上CMP 40HX以后的矿卡就是因为这个原因,它双精度砍了。对于一般的游戏用户来说PCIe1.1×4 ×16是最大的限制,双精度其实还好,但是对于炼丹AI训练或应用就是灾难了,带宽小点都无所谓反正任务下发之后显卡自己会算,双精度砍了是真没法玩。
而A卡我们可以看到它的双精度性能相比N卡的优势相当大,到了Maxwell以后的时代GCN A卡的双精度比率可以达到N卡的二倍以上。
对于挖矿来说,AMD显卡仅仅通过BIOS区分档次,这就可以让矿狗很容易就能通过刷矿BIOS直接给显卡打鸡血。如果各位还记得P106的话就能知道N卡的阉割是硬件层面的,相比之下A卡的阉割算是软件层面的。A卡到了GCN4.0时代挖矿效率是比同时代的N卡要强的,据说挖矿算力甚至可以打1080,显卡价格方面也是因为580的游戏性能不如1080所以自然是价格也是更便宜,这样矿狗很容易就能发现这玩意挖矿性价比相当高,后期即使两三千块钱一张的时候也能卖出去就是因为这个原因,这玩意如果挖矿性能和天梯图上对标的GTX980一样那没人愿意要的。
毕竟衡量游戏显卡性能的标准单精度浮点不是唯一的,shader灵活度 ,单元复用率,并行吞吐能力,缓存体系、材质资源、输出后端都是关键的因素,GCN单个计算单元灵活度、独立性、架构并行处理能力和指令吞吐量比VLIW模式更高。所以面对矿潮有一种声音就是让游戏卡获得纯净的图形能力和通用计算特性,不要背上与游戏无关的晶体管负担。但是我还是想说要彻底解决虚拟币挖矿扰乱市场的问题还是要靠出重拳严打治理,从消费端解决问题,直接让挖矿以传销的等级分配打击力度抓住就判就可以做到灭绝挖矿行为了,顺带说下治疗嚼致癌物也是同理,直接按照禁毒的标准管理很快就能解决这种问题,不要说什么禁烟禁酒做不到这个就做不到,就算是清朝人想要做到也是能做到的何况现在。消灭挖矿的需求不要太容易,让挖矿的代价远大于所得就可以了。个人认为从GPU设计的角度消灭对显卡挖矿的需求还是做不到的,而且会损害用户的利益,不能因为大多数人买显卡是为了打游戏不是为了应用或者训练AI就把游戏卡的专业运算性能砍到什么都不剩,而A卡虽然专业运算性能在线但是由于没有足够的软件生态所以现在有非常高双精度性能大多数时间却只能作为游戏卡使用也算是比较矛盾的情况了,不知道未来会不会有改善,好像RDNA的双精度依然在1/16单精度的水平,这样的话A卡未来很大程度上还是有很高概率成为性价比矿卡被大量用于挖矿的。
至于AMD为什么这么做的原因各位可以看:
FM2平台绝唱,HSA异构计算APU最后的荣光,AMD A8-7680评测
AMD为什么执着于显卡的双精度性能,各种说法不一。一种比较合理的说法是AMD要做异构运算,显卡必须保留双精度浮点性能以便使用。个人认为从RDNA的双精度性能来看,AMD未来可能还会继续进行HSA异构计算的探究,所以需要留着显卡的双精度性能以便未来支援CPU异构计算使用。AMD从推土机时代开发的CPU产品很长时间之内并没有竞争力主要原因就是因为当时的推土机压路机打桩机挖掘机农机架构都是为了APU设计的,而APU的理念是CPU可以适当的精简浮点性能,而使用并行运算有庞大算力的GPU接管浮点运算,这也是当年AMD开发的一个主要思想,当时的AMD核心都是模块化设计物理缩线程,两个整数核心之间共享一个256位浮点单元,导致实际上宣传的4核8核根本就打不过英特尔,甚至打不过自己家以前的老K10.5架构。垃圾佬这里可以给各位看下象棋跑分,我们发现羿龙2六核(开核U)和推土机8核基本是一样的。
推土机的U垃圾佬因为不需要真·垃圾所以一直都没有,简单放个FX8300的跑分吧:
所以这东西频率这么高性能还这么感人都是多亏了砍浮点性能的设计,显卡呢?显卡救一下啊?然而当时的PCIe带宽根本没法支持CPU把浮点运算交给GPU,所以最后我们发现FM3+的八核停留在了32nm时代。而APU这边更惨,因为当时的工艺GPU面积很大,CPU部分没法再做成8模块了,最高2M4T,爱用不用,再加上已经砍了浮点性能,HSA异构计算久久不能实装,所以很长时间以来AMD的全核性能一直是瘸腿的,同频性能甚至打不过K10.5的老FM1。
至于后来APU到了FM2+终于实装了HSA异构运算之后,用户发现由于当时软件优化的问题,APU的使用体验并没有什么提升,AMD PC端的APU并没有PS4那样的反响,结果就是AMD不得不改变策略重新设计CPU核心也就有了后来的锐龙ZEN核心三年之期已到咔一下子就支棱起来直接反攻英特尔的事了。
从这个故事我们可以看出来一个问题就是设计理念可以很先进,但是还是要考虑历史进程。很多人说什么华为手机一直都在用公版的CPU GPU设计、国产CPU总是一直对既有的架构进行修修补补,不大改设计提升同频性能也就是IPC拿钱不办事算什么国产之类的,这里我简单说明一点就是AMD有前车之鉴在这了已经,如果不搞HSA APU的话AMD完全可以继续对现有的K10.5全力进行改进,配合GCN显卡进行迭代完全可以在市场上打出一片天,也不至于后来割须弃袍丢盔卸甲被对面一套组合拳差点打死,显卡就不说了CPU的服务器市场都丢了。国产芯片的现状其实和AMD类似,甚至从研发投入到整体体量上都还不如AMD,所以去整什么好高骛远的先进设计不如老老实实脚踏实地先把眼前的事干好,低功耗产品就做好能效比,高性能产品就努力提升性能,手机就好好做好信号就可以了,要什么低功耗产品有很高的同频性能,国产手机芯片一定要用自研CPU GPU,或者每代产品一定要比AMD和英特尔有还大的提升这叫不切实际。翻译成人话就是经济基础决定上层建筑,总玩灵肉分离不如脚踏实地,方向错误的时候越坚持越白给,以后只会万劫不复,比如苏联坚持要打赢冷战,结果最后穷兵黩武自己先寄了,英特尔在大小核魔改ATOM核心设计降低能效比提高单核性能主频放弃原有高能效设计,未来如果不做改善就是可能会退出低功耗能耗比市场。希望国产CPU不要受到外界的干扰动摇改变现在正确的路线。
那么捡垃圾买显卡怎么办?
从一般游戏用户的角度来说,虽然GCN 4.0上新技术不少,双精度也在线,但是对面更nm离谱,Nvidia在那几年中实现了从Kepler到Maxwell再到Pascal架构的升级,性能及能效提升都相当不小,尤其是Maxwell这一代工艺没变的前提下极大的提升了能效比,直到今天GTX750 960之类的都是能用的水平,甚至能用来跑AI,而开普勒核心的卡已经不行了,GTX760 770 780都不行。
AMD这边把GCN架构一路改进到了GCN 5.0 Vega时代,RX Vega 56及RX Vega 64显卡的性能还好,但是据说能效比依然不是很好,说是又在白给没有发挥出HBM2显存的优势。后面AMD折腾出了7nm Vega也没能改变市场形势,用上当时最顶级的工艺也改不了GCN架构在游戏市场的颓势,在光追、DLSS上跟后面的图灵N卡竞争也比较吃力。个人认为当时AMD应该是认清了形势专攻了GCN架构在专业运算上的能力,全系上HBM显存就是能看出来有挺明显的意图,然而还是没法和英伟达的生态竞争最后才在两边都失败了。
所以以垃圾佬的角度建议各位就是虽然感情上很不愿意选择和矿狗合作的N卡,但是P106和40HX在未来很长时间将会陪伴垃圾佬走过青春岁月,毕竟现在的AI还是需要支持CUDA的。AMD虽然理念先进做法进步(开源crossfire,FSR,开发HSA最后在ARM移动端大量应用,到老也没出CMP XTB专用矿卡制造电子垃圾)但是在未来的很长时间里要走的路还有很长,要想同时应对英特尔和英伟达以AMD现在的研发投入还是比不过的,所以只能希望AMD这次选对路线和策略,毕竟这个世界上同时具有CPU GPU 芯片组开发能力的科技公司就那么几家,要同时玩好CPU和GPU还是比较困难的,英特尔做不到,英伟达也做不到,AMD现在能做到这样已经相当难了。顺带说下,我们很高兴在如今的形势下国内还有同时具有CPU GPU 芯片组研发设计能力的企业,总之无论哪家我们都希望未来会越来越好。
本文写作仓促,如有勘误,请在评论区指出。
谢谢朋友们!
相关文章
- 营收200亿,股价上涨7%,今天的百度Q2财报会上,李彦宏居然笑场了(百度q1财报2021)
- 百度股票在近期盈利后是买入吗?(百度公司的股票价格)
- 中国股市:2021年最高价至今跌幅最大的十只股票(名单)(2020跌幅最大的十只股票)
- 世界上十支股价最高的股票(全球最高股票价格排行2019)
- 不涉及“室温超导”!强势涨停股紧急澄清(室温超导有什么意义)
- 美科学家宣布突破室温超导技术,超导概念爆发,永鼎股份等涨停(室温超导是什么意思)
- “室温超导”概念刷屏 概念公司回应:目前技术上不可行(室温超导体成功的意义是什么)
- 如果只能买一个美容仪,你会怎么选,有什么好的美容仪值得推荐呢?(美容仪哪款好用还便宜)
- 十二星座各会在什么情况下彻底放下前任(12星座彻底放弃一个人的表现)
- 为什么“倒春寒”现象,会让“病更重”了呢?(倒春寒主要形成原因)
发表评论
评论列表
- 这篇文章还没有收到评论,赶紧来抢沙发吧~