您的位置:首页 > 其它

NUMA互联技术白皮书(一)

2013-05-14 16:14 239 查看
1.Numascale公司的互联技术

Numascale的 Numa互联技术使得计算机系统供应商可以用集群水平的成本来构建可扩展的服务器,而功能却达到企业大型机的水平。此技术将所有的处理器,内存和IO资源,在一个完全虚拟化的环境中统一进行管理,管理的操作系统可以是Windows,Linux,Solaris或其它Unix的衍生系统。

基于Numa互联的系统,通过使用共享内存或消息传递,有效地支持所有流行的高级编程模型。系统的大小还可以扩展到4k的节点,其中每个节点可以包含多个处理器。内存大小受限于Opteron处理器的48位物理地址范围,从而导致整体系统的主内存为256 TB。

Numa互联的核心是NUMA芯片;芯片上组合了高速一致性缓存的共享内存控制逻辑和7路交换及。从而减少了一个单独的,中心交换机,提高了线性容量,降低了成本。

目前,多核处理器芯片成为主流,使得更多的应用程来利用并行处理。Numa芯片利用多核,使应用程序能够在无需额外编程的情况下,无缝地对集群进行扩展。系统中,所有的任务都可以访问所有的内存和IO资源。这是其对用户的最大的价值。

除了高端企业服务器外,没有其他互连技术可以提供这种能力。

现在,所有的高速互连使用相同类型的物理接口,从而导致几乎相同的峰值带宽,其差别只是传输的延迟,功能的多少和软件兼容性。而NUMA互联区别于其他互联的地方是,通过提供统一的访问系统中的所有资源,并利用缓存技术,获得非常低的延迟。

主要性能:●可扩展的,针对皓龙处理器,基于目录的高速缓存,共享内存互连
●通过HTX接口,转接模块或直接焊接到主板上
●每个节点可远程配置
●48位物理地址空间
●系统中可高达4096个节点
●1微秒的MPI延迟(ping-pong/2)
●在NUMA芯片上,具有针对2维或3维拓扑的分布式交换架构

2. Numascale公司的NUMA互联对多核处理器的能力扩展

半导体技术已经达到了这样一个水平,由于功耗与相应的散热和热的处理问题,处理器频率不能再明显增加。从历史上看,处理器的频率与晶体管密度大致相当,所有应用程序,无需额外编程工作,就能够达到性能的改进。现在的处理器芯片,并不是在一个封装上配备多个处理器,若要利用其新增的能力,需要具备并行处理软件。这对独立的和分隔的任务而言,显然是相当简单的,但若使单个任务加快,要复杂得多。

若使单一任务加快,其复杂性与需要做此任务的资源的逻辑距离有很大关系,能够共享的资源越少,其复杂性越大。
多核处理器共享主内存和某些高速缓存,即它们被归类为对称多处理器(SMP)。现代的处理器芯片配备了一些用于连接到其他处理器的信号和逻辑,这些信号和逻辑仍保持相同的逻辑共享内存。现实中,在单一的主板中,两到四个处理器插槽的开销不是增加了性能,而是减少了性能。

目前,超出单路/双路SMP主板规模的系统通过某种形式的网络连接可以实现,例如,使用以太网或更高速互联,像InfiniBand的互连;这样,在不同节点上运行的程序,需要通过明确的消息来进行通信。在这个模型中,超出小数量处理器规模的程序需要以一个更复杂的方式重写,其中的数据不能再被所有进程共享,但需要在不同的处理器内存中被显式地分解和传输。

NUMA互联采用了可扩展的方法来共享所有内存,并基于分布式目录来存储共享内存的位置。这意味着程序范围可以在编程原则没有任何变化的情况下,超越单主板的限制。系统中,运行在任何处理器下的任何进程可以使用内存的任何部分,无论其物理位置是否在相同的主板上。如需进一步沟通,或对产品感兴趣,可发邮件至product_gao@163.com
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  服务器 SMP NUMA