从统一渲染诞生说起 AMD如何面对显卡岔路口

时间：11-08-29 16:49　来源：天极网　作者：`天极网` 我要评论 相关内容

　　2006年7月份被AMD收购，ATI主要忙收购之后的事宜，研发精力大打折扣，反倒被没有统一渲染架构设计经验的NVIDIA在同年7月份抢先发布G80核心的GeForce 8800 GTX显卡，掀开了桌面统一渲染GPU架构的序幕。

　　在实现统一渲染单元的过程中，NVIDIA将传统GPU架构中VS和PS中的4D矢量 ALU重新设计为功能更全的1D标量ALU，每一个ALU都有自己的专属指令发射器，所有运算全部转化为1D标量运算，可在一个周期内完成乘加操作。这种1D标量的ALU被NVIDIA称为流处理器(Stream Processors，SP)。

　　这种1D标量式的流处理器架构称为多指令多数据流架构(MIMD)，完全区别于传统GPU的SIMD架构。MIMD架构最大好处是灵活、NVIDIA异步架构将核心频率和流处理器频率分离，流处理频率进行了大幅提升，达到两倍于核心频率的水平，同时大幅增加流处理器数量的方法很好的解决了执行效率的问题。不过MIMD架构设计的复杂度和所占用的晶体管数都要远高于SIMD架构。

　　直到G80架构出现半年之后的2007年5月15日，AMD/ATI才正式发布了基于统一渲染架构桌面GPU产品：R600/Radeon HD 2900 XT,R600依然采用SIMD的架构设计思路，沿用Xenos使用的“4D+1D”VLIW5架构设计。

　　R600沿用了Xenos的“4D+1D”VLIW5架构。每个ALU可以执行任意的1D+1D+1D+1D+1D或1D+4D或2D+3D指令运算，Co-isuue(矢量和标量并行执行)技术在这里更加灵活多变，ATI将这些ALU称作流处理器单元(Stream Processing Units，SPU，区别于SP)，每一个SPU中都有5个ALU。

　　由于每个流处理器单元每个周期只能执行一条指令(这也是传统SIMD架构的弊端)，但是每个每个流处理器中却拥有5个ALU，如果遇到类似1D标量类似的短指令，执行效率只有1/5，其余4个ALU都将闲置。为了尽可能的提高效率，AMD引入了VLIW5体系(Very Long Instruction Word，超长指令集)的设计，可以将多个短指令合并为一组长的指令交给流处理器单元去执行，比如5条1D指令或者1条3D指令和两条1D指令可以合并为一组5D VLIW指令。SIMD架构用较少的晶体管数实现了更多的流处理器数量和更高的理论运算能力，不过在执行效率相对低下。

　　从R600时代开始，AMD就沿用了“4D+1D”VLIW5架构设计不变，充分借助SIMD架构占用晶体管少的优势，从提升制程及晶体管数量的方法压制竞争对手NVIDIA，从R600的80nm制程到RV870时代的40nm制程，AMD对芯片制程升级一直保持着相当积极的态度，通过与台积电(TSMC)的紧密合作，AMD总是第一时间推出最新制程的芯片产品。但除此之外我们真的很难看到其他改变，也许AMD同样沿用了处理器产品线的策略“以不变来应付万变”，用最低的研发成本来对抗竞争对手的新品。

首页