机器观察室:华为麒麟960性能综合分析

IT168评测随着智能手机承载的功能越来越多，处理器变得越来越重要。10 6月17日，华为在上海召开发布会，正式发布最新一代SoC:麒麟960。作为国产移动处理器中唯一商用的SoC，每一代麒麟芯片的发展都备受关注。发布会结束后，我们也简单介绍了一下麒麟960的最新特性。这一次，麒麟960在性能、拍照、安全、连接等方面都有所提升。今天的机器观察室，我们就来解读一下这款在网上被称为首健骁龙820的国产处理器，看看麒麟960到底是一款怎样的产品。

对于一部智能手机的SoC来说，不仅仅局限于CPU，还包括调制解调器、ISP、GPU、内存等组件的组合。在这一代麒麟960上，通过架构图(下图)可以看到麒麟960在CPU架构、GPU型号、调制解调器、ISP、内存规格等方面都有所提升(黄色部分)。相比之前，麒麟960已经逐渐填补了之前被诟病的短板，在几个关键部件上达到了业界大规模商用处理器的旗舰标准，在ISP和安全芯片上拥有自主研发成果的优势。另外，大家可能也注意到了，麒麟960采用A73架构，在业界顶级处理器都已经采用自研微架构的时候，华为麒麟依然坚持ARM公共架构的升级。而最新的A73架构实力如何？我们继续往下看。

全新的A73架构

▲麒麟960架构图

在移动SoC领域，目前骁龙820、苹果A10 Fusion等旗舰芯片都采用了自研微架构，而麒麟一直沿用ARM公共架构。麒麟960采用ARM最新A73架构，16nm FinFEF+工艺。众所周知，更先进的架构和先进的技术可以在提高处理器性能的同时兼顾功耗的控制。在去年的麒麟950上，华为大胆选择了16nm FinFEF+工艺，成为首款采用16nm工艺的商用SoC。在今年的评选中，华为并没有贸然选择10nm，依然延续了16nm的工艺。对此，华为表示，在目前商用量产的范围内，16nm仍然可以保证A73架构的功耗，横向来看，相对于工艺和架构，架构的改进更为重要，而10nm目前节点的工艺量产并不成熟，所以麒麟最终选择了16nm。

架构方面，麒麟960遵循ARM公版架构升级方案，选择A73架构。对此，华为表示，术业有专攻，自研架构对麒麟来说目前并不是最好的结果，更何况CPU的指令集和架构都是ARM发明的，所以如果没有实质性的改进，自研和公测架构并没有太大区别。相比竞品，麒麟追求的是综合性能的提升。

在官方介绍中，Cortex-A73依然采用全尺寸ARMv8-A架构，最高可达2.8GHz，可以使用10nm、14/16nm的工艺。根据ARM官方介绍，A73使用10nm的工艺时，与上一代16nm相比，A73是ARMv8-A架构中最小的处理器，每核面积0.65mm，继续支持big。小建筑。

另外，A73和A72在架构上也有很大的不同。A73采用双发射L/S单元，发射宽度比A72的三发射小。但由于A73的全处理器11核流水线的深度比A72的15核流水线更精简，所以发射宽度对A73的性能没有决定性影响。但是A73的一级缓存从48kB提升到64kB，A72的二级缓存从2MB提升到8MB，并且一级缓存和二级缓存都配备了独立的预读器，使得A73可以获得接近理论的最大带宽值。得益于各种优化，A73的极致性能相比A72有所提升，并且支持UF 2.1的内存规格，这也让麒麟960在数据读写方面有所提升。在麒麟960的闪存读写测试中，连续读写和随机读写的性能比使用A72的麒麟950高出数倍。

目前智能手机高度集成化，内部空间几乎是寸土寸金。尤其是对于主板来说，极其复杂的电气结构使得手机处理器的选择心有余而力不足。A73被称为目前处理器中最小的高端核，每个核的面积在0.65mm以下，比A72上1.1.5mm2的面积小了43%。根据ARM的资料，A73采用10nm FinFET工艺，配备2.8GHz四核，核心面积仅为5mm2。一般来说，手机处理器的制造成本与面积大小成正比。面积越大，成本越高，而处理器面积越小，成本越低。

另外，从架构图中我们可以看到，A72发布的CCI 500最终用于DIC中断控制区。在之前麒麟950的介绍中，我们也有介绍过这个。其实CoreLink CCI-500最大的变化就是增加了一个Snoop Filter，让Snoop控制不再局限于单个集群内的CPU，允许所有CPU内核同时调度，这样处理器在执行缓存查询时的工作量会减少，效率会更高。相信大家都听说过所谓的“一个核心有难，其他人看着”。但相比麒麟950中的CCi 400，并不支持足够的内存互联，带宽总线也有限(CCi 400最高支持12.8G/s，CCi 500理论上可以达到25.6G/s)。所以相比950等竞品，麒麟960在内存借出评分上提升了近1倍。

当G71遇上Vulkan

麒麟960采用ARM最新一代GPU:Mali g 71，采用Bifrost架构。与之前的midgrad架构相比，Bifrost最大的创新在于指令子句Shader的使用。官方对执行单元进行了G71的重新设计，将指令集分组到预设的程序块中，使指令集可以无中断地自动执行。可以保证子执行前所有外部依赖都准备好，临时计算的结果不需要访问寄存器组，减轻寄存器堆的压力，显著降低功耗；通过简化执行单元的控制逻辑，也减少了GPU的面积。此外，Bifrost架构还采用了基于四边形的矢量化技术。相比之前的SIMD向量化技术，quad向量化技术一次只能执行一个线程，最多支持四个线程，而* * *独享控制逻辑，利用率接近100%。

其他方面，Mali G71的主频为850MHz。官方成绩显示，基于16nm工艺，Mali G71的像素填充率为27.2Gpix/s，三角形填充率为850Mtri/s(基于32核)，是T880的两倍，但三角形生成率仅为。对于功耗和芯片面积的控制，这款麒麟960采用了Mali G71 MP8(当然不可能用32核)。并为我们展示了麒麟960的跑分测试性能。在曼哈顿的1080P屏下测试中，麒麟960的性能甚至提升了2倍。

另外，Mali G71支持OpenGL、Vulkan接口标准等API。长期以来，大部分3D游戏都是通过OpenGL标准进行交互的，但自从上世纪90年代诞生以来，OpenGL现在在廉颇看来已经老掉牙，而且市面上的多核处理器利用效率低，图形处理效率低，无法充分释放GPU的威力，感觉就像一辆大马拉小车。所以在麒麟960上，率先全面支持新一代图形API规范:Vulkan。与OpenGL相比，Vulkan提高了多线程性能，渲染性能更快，摆脱了OpenGL依赖CPU运算的方式，使GPU和CPU在同一个内存中同时读写，充分发挥多核处理器的并行计算能力。

第三代双摄像头ISP:

随着手机摄影需求越来越大，图形数据后期计算的地位几乎等同于镜头本身的质量。因为对于现在的智能手机来说，相机镜头模组和机身厚度的矛盾，注定了它在画质上无法和单反相比，更多的是从算法上弥补硬件上的固有差距。华为能做的就是自主开发ISP。所以麒麟960采用华为自主研发的PrimISP 2.0，内置SoC。内置HD高清硬件深度图形处理器，超分辨率技术，并支持4K硬件视频稳定。特别是在双摄像头方面，升级为第三代双摄像头技术，模拟人眼3D对焦的深度感知，支持黑白双摄像头实时融合处理，可以捕捉更多细节，暗光下可以降低噪点。与上一代PrimISP相比，2.0增加了对图像深度计算、超分辨率和视频稳定的支持。

在华为一直坚持的双摄像头方面，麒麟960模拟人眼的生物特性，带来了第三代双摄像头技术。在人眼中，主要由杆状细胞和锥状细胞组成。锥形细胞区分物体的颜色，杆状细胞带来物体的细节。单眼约有654.38+0.2亿个视杆细胞和600-700万个视锥细胞。所以在平时人的感知过程中，物体细节的改善比色彩的改善更敏感。所以华为在双摄技术上一直坚持“黑白+彩色”的路线，和高通所谓的“视线清晰”方向一致。但不同的是，Clear Sight是基于双ISP(黑白+彩色)图像融合，麒麟和高通在这方面还是有一定差距的。

获得行业领先的调制解调器

通信一直是华为最引以为傲的竞争力，但是麒麟950出人意料的只支持CAT6规格，而今年年初的竞品已经实现了CAT12规格，CDMA外接基带一直为人诟病。因此在麒麟960上集成了全新的自研全模调制解调器，最终在CDMA专利上取得突破。麒麟960全面支持GSM/UMTS/CDMA/TD-SCDMA/TD-LTE目前最常用的六模330MHz-3.8GHz全频段，麒麟960成为麒麟系列首款支持全网通的芯片。双卡双待方面，麒麟960支持4G+2G、4G+3G、4G+CDMA等多种网络制式下的双卡组合，也可以支持部分国家已经取消2G网络的情况。

网络连接方面，麒麟960支持4CA或2CA+4*4 MIMO，峰值下载速度达到600Mbps。通信规范升级为Cat12/Cat13，为殷悦2.0带来了全新的VoLTE语音技术，包括高清语音和VoWifi(微信语音通话)，频谱范围扩大了13。麒麟960的智能语音增强技术SPLC，可以对用户的语音进行动态智能补偿，去除50%的噪音和语音不连续，减少卡顿感，提升语音通话体验。从理论性能上来说，已经达到了行业顶尖水平。

更智能的协处理器:

从整个设计思路可以看出，麒麟960非常注重性能和功耗，但是对于现在的智能手机来说，在电池技术还没有突破的情况下，使用功耗更小的协处理器来救国，是一种曲线策略。麒麟之前体验过i3和i5的应用。在麒麟960上，i6进一步优化，赋予i6协处理器更多任务。进一步减轻CPU的负担。

在麒麟960上，i6配合A73和A53共享资源，在手机休眠时独立接管轻量级任务，但只消耗1%的功耗。与i5相比，典型PDR服务的功耗降低了75%，计步器服务的功耗降低了40%。i6的融合操作包括高精度围栏、上下文感知、低功耗GPS定位、低功耗多基站定位、低功耗导航和AOD (Always On Screen)功能。这一改变也将在未来通过运行一些基于LBS的AR应用(Pokeman Go)来降低70%的功耗。

强大的安全性:

随着智能手机承载的功能越来越多，信息安全和金融安全变得越来越重要。因此，央行和银联也对移动终端金融的安全解决方案提出了监管要求:1000元支付需要单因素验证(静态密码或生物识别)，10000元支付需要两个因素(静态密码和指纹识别)，50000万元支付需要三个以上因素(数字证书或电子签名、静态密码和生物识别)。

麒麟提出的inSE方案率先获得银行和银联的双芯片安全认证，是全球首款实现金融和安全的芯片。得益于华为在通信方面的多年深耕，麒麟960从芯片底层积极防御伪基站。在2G/3G网络环境下，手机进入基站范围时，对基站的型号进行认证，拒绝与伪基站通信，从根本上解决了伪基站的风险，保护了用户的连接安全。

而且麒麟960将安全芯片与SoC集成在一起。inSE安全解决方案相比其他安全解决方案，将处理器、安全芯片、内存融合在一起，使得安全芯片不可替代，从根本上保证了手机的安全性。麒麟960支持CRT-RSA、RSA、DES/3DES、AES加解密算法，安全性高。

总结:在这次沟通会上，华为给麒麟960定的主题是“创新拒绝迷失”。其实创新这个词从15开始就被反复提及，在手机已经严重同质化的今天就更加难得了。关于麒麟960这款产品，相信通过前面的分析，我已经有了一个大概的印象:虽然在一些发散的功能上，麒麟和成熟的高通还有一些差距，但是一些关键部件的性能指标已经赶上来了，麒麟960没有一个部分成为明显的短板，而且在平衡的基础上，能够充分发挥其与终端紧密结合的优势，并根据用户的实际需求进一步完善。创新不可能一蹴而就，需要持之以恒。麒麟960已经证明了它可以站在第一梯队的高度，我们也期待华为麒麟未来能给我们带来更多惊喜的产品。