芯片与封装的考虑
热量与耗电量
虽然TLP优化的设计应该更省电,但是,这并不意味着总耗电量或者散热量会低于当前的设计。事实上,从增加功率预算中得到的性能好处应该是很高的,因为TLP设计不会提高时钟速度这样激进的功能,并且因为芯片功率对速度延迟不太敏感。相比之下,采用“肥”CPU设计,功率预算提高100%却只能提高10%至30%的性能。
像IBM和Sun那样的公司可能会选择每个主板使用一个处理器,这是一种高度集成的高性能设计。仅仅使用一个处理器会使冷却更简单,并且更容易支持高功率预算。而且,冷却一个耗电量为150瓦以上的芯片是很不容易的。
然而,设计的一个方面变得更简单了。采用单内核设计,芯片上最热的部分一般是浮点运算部分。一个多内核芯片不是有一个单个的大的发热点,而是在整个处理器上散布着几个热点。多内核芯片可能有更多的逻辑电路和更少的缓存(这种缓存耗电量不大),因此,实际使用的电源在芯片上分布的更均匀。冷却也就更加容易了。
由于TLP优化的设计会有更小和更简单的芯片,推测芯片上管道的长度很短是很自然的。一个CPU的内核越小越简单,一定的时钟速度的数据管道长度就越短。然而,以同样的时钟速度使用一个比较长的管道能够使CPU内核以较低的电压运行,或者使用更省电的晶体管,减少耗电量。每个内核的耗电量越低,一个芯片上能够集成的内核数量就越多。
每个芯片上的内核
大型的芯片制作起来更困难、成本更高。大型芯片也更难设计。另一方面,大型芯片也具有最高的性能。大型芯片还意味着可以使用更多的CPU内核,而且一般来说耗电量也更大。虽然没有绝对的限制,但是,面积超过450平方毫米的处理器芯片是很少见的。这就为处理器技术能够在一个芯片上集成的内核数量提供了一个上限。但是,有没有最佳点呢?
比较两个系统,一台是配置两个双内核处理器的服务器,另一台是配置4个内核的处理器的服务器。这两台服务器配置的芯片都采用了相同的内核设计、同样容量的缓存和I/O带宽、并且以同样的时钟速度运行。结果显示,配置4个内核的处理器的服务器比配置两个双内核处理器的服务器速度更快,而且耗电量还稍微小一些。这是因为一个芯片上的两个CPU内核之间的连接速度更快,更省电。
然而,4个内核的芯片比两个内核的芯片造价更高。不过,配置一个处理器插座的主板比配置两个处理器插座的主板要便宜,这个价格差距弥补了生产成本的差距。这两种配置对于内存系统和I/O系统也有不同的意义。选择是很多的。


