用蛀洞路由器ST_C104构造全互连多机并行系统
发布时间:2008/5/27 0:00:00 访问次数:554
用蛀洞路由器st_c104构造全互连多机并行系统
摘 要: 采用蛀洞路由机制是新型多计算机并行系统的重要特征,介绍用蛀洞路由器st_c104构造全互连多机并行系统的方法并给出构造实例,证明它具有并行效率高、通信速度快、拓扑结构可变、扩展性强等特点。
关键词: 多计算机 并行 蛀洞路由 st_c104
近年来,在高性能并行计算机系统中,分布存储型的多计算机系统的研究与应用得到快速发展。mpp(massively parallel processors)系统属于一种松散耦合的计算机系统,它一般由数十台至百台以上计算机结点和高速互连网络组成,由于没有共享内存,各结点之间通过互连网以消息传递的方式相互通信,各结点间既相互独立又可相互交流、共享信息,它非常适合目前各行各业方兴未艾的网络发展的需要。新型的由硬件支持的路由技术特别是蛀洞路由器的出现,使多计算机系统的网络互连变得更加灵活方便,更为重要的是大大减小了通信时延,使远程通信时延和本地通信时延一样,即通信时延与两个结点之间的距离无关,从而大大提高了多计算机并行系统的通信效率。
本文介绍采用蛀洞路由器st_c104构造全互连多机并行系统的方法,我们将该技术应用于“长缨-iii分布式并行仿真计算机系统” 的研制中,取得了良好的效果。
1 st_c104的结构与特点
st_c104是sgs_thomson公司于1996年推出的32×32高速异步网络开关,是专门为多cpu间互连而设计的系列产品之一,其结构如图1所示。
st_c104具有如下主要特点:
·支持蛀洞路由方式,且可传递任意长度的信息包(packet);
·时延小,不大于1μs;
·通信速率为32×100mb/s,通信带宽达300mb/s;
·支持虚拟通道和自适应寻径;
·具有硬件出错处理机制(fault tolerant network);
·提供2对控制链clink,用于初始化及出错处理;
·提供32对数据链dlink,用于数据传递及校验。一个c104最多可直接连接32个满足link协议的cpu(如t9000等),也可通过与高速链路适配器st_c101相配合,实现与任意型号cpu的连接;
·在线编程,可动态改变网络拓扑结构;
·可无限级连。
2 基于st_c104的多计算机系统
对于一般的cpu,因为外部数据线多为并行总线,且时序、协议各不相同,因此与c104连接时需要利用c101进行链路适配,如图2中小框所示,而对于具有link协议的cpu,可直接与c104相连,不需加c101。一个c104最多可连接32个cpu,如果不需要那么多的cpu,或希望提高链路通信带宽,则可减少cpu数量,而将c104的多个链路分配给同一个cpu,如图2中#30节点,它占用了3根link,双向带宽达600mb/s。
图2中各个cpu的地位是完全相同的,每个cpu既可做为主控结点,也可做为从结点。将一个或多个任务按一定策略划分后分配到各个结点,所有结点可同时进行工作,各结点之间通过c104为媒介进行实时通信,因此该多机系统是全互连的、并行的。
一般将由一个c104相互连接的结点合称为一个机群,如图2中的全部1~30个cpu结点机即构成了一个机群。
3 st_c104的级连与扩展
c104采用蛀洞路由方式寻径,通信时延小,且与结点间距离无关,因此理论上c104可无限级连构成一个任意大的mpp系统。但实际上任何系统级连的数量与其性能都不可能永远线性地增加,而是有一个平台,在此之后,系统性能增长缓慢。事实上,在现实应用中对系统规模一般也是有限的,图3是用6个(可继续扩展)c104构成的平面拓扑结构的多机系统。
图中将c104相连的实线表示数据链,虚线表示控制链,
用蛀洞路由器st_c104构造全互连多机并行系统
摘 要: 采用蛀洞路由机制是新型多计算机并行系统的重要特征,介绍用蛀洞路由器st_c104构造全互连多机并行系统的方法并给出构造实例,证明它具有并行效率高、通信速度快、拓扑结构可变、扩展性强等特点。
关键词: 多计算机 并行 蛀洞路由 st_c104
近年来,在高性能并行计算机系统中,分布存储型的多计算机系统的研究与应用得到快速发展。mpp(massively parallel processors)系统属于一种松散耦合的计算机系统,它一般由数十台至百台以上计算机结点和高速互连网络组成,由于没有共享内存,各结点之间通过互连网以消息传递的方式相互通信,各结点间既相互独立又可相互交流、共享信息,它非常适合目前各行各业方兴未艾的网络发展的需要。新型的由硬件支持的路由技术特别是蛀洞路由器的出现,使多计算机系统的网络互连变得更加灵活方便,更为重要的是大大减小了通信时延,使远程通信时延和本地通信时延一样,即通信时延与两个结点之间的距离无关,从而大大提高了多计算机并行系统的通信效率。
本文介绍采用蛀洞路由器st_c104构造全互连多机并行系统的方法,我们将该技术应用于“长缨-iii分布式并行仿真计算机系统” 的研制中,取得了良好的效果。
1 st_c104的结构与特点
st_c104是sgs_thomson公司于1996年推出的32×32高速异步网络开关,是专门为多cpu间互连而设计的系列产品之一,其结构如图1所示。
st_c104具有如下主要特点:
·支持蛀洞路由方式,且可传递任意长度的信息包(packet);
·时延小,不大于1μs;
·通信速率为32×100mb/s,通信带宽达300mb/s;
·支持虚拟通道和自适应寻径;
·具有硬件出错处理机制(fault tolerant network);
·提供2对控制链clink,用于初始化及出错处理;
·提供32对数据链dlink,用于数据传递及校验。一个c104最多可直接连接32个满足link协议的cpu(如t9000等),也可通过与高速链路适配器st_c101相配合,实现与任意型号cpu的连接;
·在线编程,可动态改变网络拓扑结构;
·可无限级连。
2 基于st_c104的多计算机系统
对于一般的cpu,因为外部数据线多为并行总线,且时序、协议各不相同,因此与c104连接时需要利用c101进行链路适配,如图2中小框所示,而对于具有link协议的cpu,可直接与c104相连,不需加c101。一个c104最多可连接32个cpu,如果不需要那么多的cpu,或希望提高链路通信带宽,则可减少cpu数量,而将c104的多个链路分配给同一个cpu,如图2中#30节点,它占用了3根link,双向带宽达600mb/s。
图2中各个cpu的地位是完全相同的,每个cpu既可做为主控结点,也可做为从结点。将一个或多个任务按一定策略划分后分配到各个结点,所有结点可同时进行工作,各结点之间通过c104为媒介进行实时通信,因此该多机系统是全互连的、并行的。
一般将由一个c104相互连接的结点合称为一个机群,如图2中的全部1~30个cpu结点机即构成了一个机群。
3 st_c104的级连与扩展
c104采用蛀洞路由方式寻径,通信时延小,且与结点间距离无关,因此理论上c104可无限级连构成一个任意大的mpp系统。但实际上任何系统级连的数量与其性能都不可能永远线性地增加,而是有一个平台,在此之后,系统性能增长缓慢。事实上,在现实应用中对系统规模一般也是有限的,图3是用6个(可继续扩展)c104构成的平面拓扑结构的多机系统。
图中将c104相连的实线表示数据链,虚线表示控制链,