日前,ARM发布了自己的下一代核心Cortex-A72,A72将会直接取代A57,定位高端市场。同时ARM还发布了CoreLink CCI-500,这是一块负责互联的模块,在GPU上,ARM的下一代是Mali-T880,据说性能可以提升最多达到80%。 无疑,Cortex-A72搭载CoreLink CCI-500,配合Mali-T880的GPU,将是ARM的下一代处理器,这个性能“新怪兽”究竟有多强呢? Cortex-A72性能已达到PC级CPU ARM从A15之后,执行大小核的架构,所谓的big.LITTLE,在低负载用小核心,高负载用大核心,平衡性能与功耗的矛盾。 而这一次,ARM只发布了一个大核心A72,与其配套的小核心依然是上一代的A53,没有进一步发展,虽然ARM此前已经宣称,A53将顺序执行架构做到了极致。但是我们不认为就没有可升级的余地。ARM不更新的原因,可能是在小核心上,A53的性能已经够了,进一步升级无意义。 在这个A72的大核心上,ARM表示,Cortex-A72是其性能最出色、最先进的处理器,构建在Cortex-A57的基础之上,性能可达Cortex-A15 3.5倍。不过,从架构图和规格表上看,A72和A57并没有本质的不同,仍旧最多四核心,一级二级的缓存容量都没变,只是做了一些细节调整,比较明显的变化是砍去了NEON SIMD引擎中的加密扩展功能,总线接口扩展到128bit。 所以,A72的性能提升可能来自于微架构的改进,譬如分支预测的效率等等。 在发布会的PPT上,ARM当然不能低调,在手机的功耗限制下,性能比A15处理器提升3.5倍,在同样的工作负载下,功耗降低75%。搭配大小核心方案,功耗还能降低40%-60%看上去非常美好。 不过,我们要知道,按照ARM这种性能算法,A57比A15也有1.9倍的性能提升。那是建立在20nm对28nm工艺的基础之上的。同样,A72这个所谓3.5倍的性能提升,也是建立在16nmfinFET对28nm的工艺优势上。 实际上,ARM的A57在同频下相对于A15只有25%-30%的提升。1.9GHZ的A15跑specint2000,大约是1100分,1.7GHZ的A57跑specint2000是1250分。 按照ARM的比例,3.5倍的A72相比1.9倍的A57只提升了1.84倍,估计同频A72相对于A57大约也是25%左右的提升。也就是1.7Ghz的A72跑Specint2000大约在1550分。 这个分数和苹果的A8处理器差不多,而A8是1.4GHZ,ARM这个下一代的A72核心,同频性能很可能还不如苹果的A8。 不过A8用在手机上只是双核心,而A72起步就是四核心,在频率上,A72号称能达到2.5GHZ,所以总体性能A72的处理器还是有优势的。不过等A72在2016年上市的时候,苹果A10可能都在路上了。 放到PC上去比较,A72大约还在酷睿2的等级,这个性能很不错,但是不能与主流的Intel i7去比较,移动距离桌面还有很远的距离。 多核心效率和内存性能大幅提升 CoreLink CCI-500最大的变化就是增加了一个“探听过滤器”(Snoop Filter),从而使探听控制不再局限于单个簇内部的CPU之间,可以扩展到整个处理器的所有核心。 过去,ARM虽然支持多核心,但实际上是四个核心一个簇,簇内部是有侦听的,可以解决缓存一致性的问题,而簇之间是没有的,所以从四核心到八核心会有一定的性能下降。 而ARM提倡的大小核恰恰是八核心的,这次增加“探听过滤器”可以提升多核心的性能。 额外的开销少了,内存的性能也跟着提升,ARM宣称CoreLink CCI-500可以提升30%的内存性能。 在内存带宽上,CoreLink CCI-500提升到了四通道128-bit内存位宽。这让采用ARM公版设计的厂商可以支持更宽的内存带宽,进而支持更高分辨率的显示设备。 而过去,只有高通的处理器内存带宽比较高,因为高通不使用ARM的一致性互联架构,而是自己搞一套。而高通处理器的体验也一直比较好。 在核心支持上,最多支持的CPU簇也从2个增加到4个,每个簇可以支持四个处理器,这样算最多可以支持16个处理器,可以用于一些高性能领域。手机上因为功耗原因估计还会是8核心(大小四核心)作为主流。 对消费者来说,最实惠就是“探听过滤器”带来的效能提升和四通道128-bit内存位宽带来的体验提升。 号称性能提升80%的Mali-T880实际如何? 其实Mali-T880所属的Mali-T800系列在2014年10月就发布了,当时的型号是T820、T830、T860三款,支持4K等一些新特性,Mali-T880不过是一个加强版。 ARM当时宣称,相比于目前的高端主力Mali-T760(也是16个核心),T860的性能可以提升最多80%,同时在同等负载下,功耗可降低40% 现在说的Mali-T880,也是性能可以提升最多80%,同时在同等负载下,功耗可降低40%,可见完全是一路货色。从具体参数上来看,Mali-T880最高主频可以去到850MHz,而现有的28nm HPM工艺的Mali-T760则只有650MHz;三角形输出率方面,Mali-T880能够达到1700Mtri/s,是Mali-T760 1300Mtri/s的1.3倍多;像素填充率方面,Mali-T880可以达到13.6Gpix/s,而Mali-T760为10.4Gpix/s。 这个数据看上去非常高,但这是按照16个核心计算的,实际因为功耗问题,用不了那么多,性能也没有那么高。 从目前移动设备的性能看,最强的是nVIDIA,其次是苹果的用的Powervr,ARM的Mali理论性能很高,但是真正能用到移动设备上跑分并不高。 所以,对这个秒天秒地的Mali-T880不必抱太大期望,Tegra的X1估计还会是未来很长一段时间的王者。 从这次ARM的新产品来看,强化了单个强核心的性能,弱核心没有进展,在互联上强调了多核心的协调,增加了内存带宽,增加了多核心的支持,在GPU做了例行的小升级。 对智能手机有意义的还是单核心性能和内存带宽,可以提升速度,增加高分辨率屏幕的流畅性,提升体验。实际上,ARM这次很有点学苹果和高通的意思。 目前,海思、联发科、瑞芯微等都已经购买了Cortex-A72的授权,预计2016年我们就能看到相关产品。怪兽即将来袭。 本文为百略网作者maomaobear原创 |
© 2008-2024 移动叔叔. 版权所有,专业的网络售后平台 ( 闽ICP备18006692号-3 )
商务合作|Email:service@mobileuncle.com|手机版|移动叔叔
GMT+8, 2024-11-13 10:23 , Processed in 0.165280 second(s), 13 queries , Gzip On, Memcache On.