欢迎光临
我们一直在努力

偏要和你比跑分 NVIDIA 264核Tegra X1移动处理器力压苹果A8X

著名芯片设计制造厂商NVIDIA在CES2015展会开幕之前对外发布了一款最新的移动处理器——NVIDIA Tegra X1,这个性能变态的怪兽级处理器被奉为目前最强的ARM处理器,处理性能高达 1 Teraflop (万亿次浮点运算),如此强大的性能开启了诸多应用的大门,甚至是那些前所未有的图形应用以及复杂的深度学习和计算机视觉应用。

Tegra X1-0

 

        Tegra X1整合了四颗Cortex-A57核心和四颗Cortex-A53核心,和骁龙810以及三星Exynos 7系列相同。而GPU部分则采用了Maxwell(麦克斯威尔)架构,共计256个流处理器,都已经赶上桌面级独立显卡了。Tegra X1还采用了20nm工艺制造,在性能变态的情况下尽可能控制了功耗。FP16单精度下的计算能力高达1TFlops,堪比15年前的超级计算机“ASCI Red”。据悉,目前Tegra X1已经准备进入投产阶段,估计等个半年左右就有搭载此处理器的产品横空出世啦。该处理器支持60FPS 4K视频硬件解码,格式支持H.265、H.264、VP9,并支持13亿像素摄像头输出,并原生支持FP16。也是第一个有能力媲美超级计算机和游戏主机的移动处理器。

下面来看看Tegra X1的性能究竟如何呢?外媒Anandtech已经对其GPU性能做出了初步测试,结果惊人,当然中枪者依然是苹果目前最高端的移动处理器A8X。

BaseMark X测试中,Tegra X1的成绩为56.9FPS,作为对比,苹果A8X为40.2FPS,而Tegra K1则是36.3FPS。

3DMark 1.2版Unlimited模式中,Tegra X1的成绩为58448,作为对比,苹果A8X为31781,而Tegra K1则是36688。

GFXBench 3.0 Manhattan 1080p (Offscreen)测试中,Tegra X1的成绩为63.6FPS,作为对比,苹果A8X为32.6FPS,而Tegra K1则是31.7FPS。

目前来说性能如何的变态,而Tegra X1的功耗并没有高的吓人。Anandtech初步的功耗测试显示,Tegra X1的GPU部分功耗大约只有1.51W的样子,而苹果A8X的GPU部分功耗则达到了2.67W。

“完爆”、“碾压”!这两个词是众多媒体对Tegra X1跑分数值超越苹果A8X的形容。


Tegra X1-2

最后再啰嗦一堆你我都看不太懂的对Tegra X1架构分析:

【GPU:强大的麦克斯韦】

首先,NVIDIA是一家GPU公司,因此无论在桌面还是移动市场上,都对GPU异常重视。去年的Tegra K1首次引入了与桌面平级的开普勒架构,192个流处理器带来了惊人性能。今年的Tegra X1则进一步升级为麦克斯韦架构,流处理器也增至256个。

换句话说,去年用的是一组阵列(SMX),今年则是两组(SMM)!随之而来的是,纹理单元、ROP单元也都大大增强了,均有16个,尤其后者翻了两番,对于驱动4K 60Hz显示有很大好处。

从初步测试结果看,Tegra X1 GPU性能依然彪悍,可以轻松搞定苹果A8X里八核的PowerVR GXA6850。

【Tegra X1用的是第二代麦克斯韦架构】

新架构的诸多图形技术也被带了过来,包括更高效的CUDA核心、更简练的SMM阵列、第三代Delta色彩压缩、保守光栅化算法、体积区块资源(DX11.2)、多帧抗锯齿(MFAA)等等。
更重要的是内存带宽,这一直是限制移动SoC的瓶颈,传统方法就是增加位宽,但会大大提高复杂度和成本。 Tegra X1还是停留在64-bit位宽,但是大大增强了内存压缩,包括刚才说的第三代Delta色彩压缩,以及新的端到端压缩。再辅以新的LPDDR4(频率可达1600MHz),内存带宽基本不是问题。值得一提的就是半精度FP16的支持,NVIDIA称之为“双倍速FP16”(Double Speed FP16)。和开普勒一样,麦克斯韦架构也只有专门的单精度FP32、双精度FP64 CUDA核心,并没有给FP16分配独立资源,只是在操作方式上做了改变。
Tegra K1 FP16操作会被给予和FP32相同的待遇,每一个都交给FP32 CUDA核心处理。Tegra X1上如果条件允许,则会将两个FP16合并成一个Vec2,交给单独一个FP32 CUDA核心去处理。

Tegra X1 A57核心搭配了2MB共享二级缓存,每个核心还有48KB一级指令缓存、32KB一级数据缓存,A53核心则共享512KB二级缓存,同时每个核心有32KB一级指令缓存、32KB一级数据缓存。NVIDIA并没有使用ARM big.LITTLE双架构体系、CCI-400互连总线,而是自己设计了互连总线,还让全部八个核心可以同时运行,系统和应用可以随意调用。而且,该系统是缓存一致性的,所以不会像类似方案那样损失功耗和性能。NVIDIA宣称,Tegra X1的能耗比与三星Exynos 7410是齐平的,同等功耗下性能高出40%,同等性能下功耗少50%。——两家都是20nm。

Tegra X1-1

 

Tegra X1处理器将被应用于新近发布的NVIDIA DRIVE汽车电脑中。DRIVE PX是一款汽车自动驾驶计算平台,可处理来自12 个车载摄像头的视频,以便实现环绕视觉 (Surround-Vision) 和自动代客泊车 (Auto-Valet) 等功能。环绕视觉可带来无缝的 360 度汽车周围视野,而后者则能够实现真正的自动泊车。DRIVE CX是一款完整的座舱平台,旨在成就先进的图形功能,满足日益增多的屏幕所需。这些屏幕被用于数字仪表组、信息娱乐、平视显示器、虚拟后视镜以及后排娱乐等等。

分享到:更多 ()

评论 4

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
  1. #2

    找这篇文章很久了,技术帖,顶。感谢博主无私分享!大家支持起来

    优壹佰3年前 (2015-01-06)回复
    • 不要以为我不知道你是来发外链的,软件批量发表,以为我不知道么?

      丨丶灬折腾ゝ3年前 (2015-01-06)回复
      • 简直机智

        老雷2年前 (2015-02-24)回复
  2. #1

    英伟达的GPU,高通的CPU,再配上MTK的低功耗,我觉得这样才是最好的处理器

    安兔兔3年前 (2015-01-06)回复