云淡风清 发表于 2003-3-9 13:19:39

help

处理器是否有向量处理器和标量处理器之分,若有它们各自的定义是什么,各有什么优点和不足。 :D

〖凌晨三点〗 发表于 2003-3-9 14:10:08

如果不指定形状,则所定义的处理器排列在概念上被认为是标量处理器。标量处理器排列对于指明某种标量数据应被保存在一起而且无须与分布数据发生强相互影响是很有用的。依据实现的结构,分配到这样一个处理器排列上的数据可以保留在一个单一的“控制”或“主”处理器中(如果机器中有这种处理器),或者保留在一个任意选定的处理器中,或者也可以重复存放在所有处理器中。对于具有一组计算处理器和一个单独标量主计算机的目标结构,一种自然的实现方式是将每一个标量处理器排列都映射到主处理器上。对于具有一组计算处理器但没有一个单独标量主计算机的目标结构,映射到标量处理器排列上的数据可以被映射到一些任意选定的计算处理器中或重复映射到所有计算处理器中。

具体而言,在处理器与主存间需要文换大量数据的应用中,向量机可以获得绝佳的效果。这种效果在很大程度上得益于向量处理器独特的架构。

在单个处理器峰值性能方面,向量机是标量机的4—5倍,但这一差距正在逐渐缩小。如果标量机在微处理器构成中增加处理器数量,那么其处理器的峰值性能可以达到与向量机相同的水平。但是,标量机的体系结构存在着天生的缺陷,其处理器与存储器之间数据传输带宽严重不足。例如,NEC的向量型计算机SX—6的每个处理器的带宽为32GB/s,而标量机中最先进的IBM Power4的举个处理器元件(每个元件中嵌入了2个演算器)的带宽为6.9GB/s,即向量机的带宽几乎是标量机的8倍。由于带宽在演算性能方面发挥着极其重要的作用,如果带宽较小,处理器必须等待数据的到来,将计算结果传输至存储器时也会出现相同的情况。

演算的数据量越大,向量机与标量机之间演算效率的差距就会越大。因此,有人认为只要加大带宽,就可以提高标量机的性能。但是由于处理器架构方面的原因,标量机的带宽不可能被扩大到与向量机相同的水平。另一方面,标量处理器的I/O控制能力有限,物理上也很难增加处理器的引脚数量,其数据I/O结构部分也不可能获得太大的扩展。当然,还可以通过提高处理器整体的处理能力来提高I/O控制速度,并通过改进封装技术来增加处理器的引脚数量。由于上述技术性原因,在科学计算中,处理的数据量越大向量型计算机的优势越明显。
页: [1]
查看完整版本: help