您的位置：首页 > 新闻 > 高新技术 > 新闻详情

铺平未来之路：AMD显卡架构转换深度解密

时间：2010-12-16 13:31:09

来源：驱动之家
作者：batyeah
编辑：ChunTian

2007年，ATI发布了R600架构的Radeon HD 2000系列，也是自己在PC领域首次引入统一着色架构，而且又一次使用了VLIW5。尽管这是DX10产品，但仍能很好地处理DX9顶点着色。GPGPU通用计算普及之前，这种架构适应得很好。

接下来进入2008年。显卡厂商在规划产品的时候一般都要考虑到两年之后乃至更久的情况，所以Cayman Radeon HD 6900系列的设计那时候就已经着手了。当时GPGPU通用计算才刚刚起步，NVIDIA开始追逐的那个市场最多价值几百万美元，DX10游戏也还没有成型，但是AMD预测认为，通用计算将在两年后(也就是现在)变得非常重要，DX9也会基本让路给DX10/11，所以就必须提前重新评估VLIW5设计的优劣。

果不其然，GPGPU通用计算已经开始大行其道，Windows 7、DX10/11也正在将DX9挤下历史舞台。根据AMD的内部数据，VLIW5架构的五个处理槽中平均只能用到3.4个，也就是在游戏里会有一个半白白浪费了。显然，DX9下非常理想的VLIW5设计已经过时，它太宽了，必须缩短流处理器单元(SPU)，重新设计里边的流处理器(SP)布局。

AMD的显卡核心架构非常依赖指令级并行运算(ILP)，也就是将指令放在单独一个线程内，和其他可以并行的线程没有任何关联。VLIW5下最理想的情况就是五个指令能够在每个时钟周期里、每个SPU上一起调度执行，但这种概率非常低。按说平均使用3.4个已经不错了，但换算下来还是不足80％，结果就是从工作负载种提取ILP非常困难，导致最好、最坏应用环境相差太多。

与之形成鲜明对比的是线程级并行计算(TLP)，那些没有任何关联的线程也可以同时执行。这正是NVIDIA在高端核心上所依赖的设计理念，GF100/GF110都是借助TLP达到高效率的标量架构。