细胞阵列计算系统以及其中的通信方法
【技术领域】
[0001] 本发明设及计算机及计算机应用技术领域,特别设及一种细胞阵列计算系统W及 其中的通信方法。
【背景技术】
[0002] 通常来说,一台计算机主要包括S个核屯、部分:中央处理器(CPU, Central Processing Unit)、内存和存储。
[0003] 经过一些世界顶级公司的不懈努力,CPU已经演变成极度复杂的半导体忍片。顶 级的CPU内核内部的MOS管数目可W超过一亿个。目前的产业趋势是受制于功耗,CPU的 运行频率已经很难再提高。已经极度复杂的现代CPU,运行效率同样很难再提高。新的CPU 产品,越来越多地朝多核方向演进。
[0004] 在内存方面,目前居于统治地位的是动态随机存取存储器值RAM,Dynamic Random Access Memory)技术。DRAM可W快速随机读写,但却不能在断电的情况下保持内容。实际 上,即使在通电的情况下,它也会由于内部用于储存信息的电容器的漏电而丢失信息,必须 周期性地自刷新。 阳0化]在存储方面,NAND闪存技术正在逐步取代传统硬盘。闪存所依赖的浮置栅极 (floating gate)技术,虽然能够在断电的情况下保持内容,但写入(将'1'改写为'0') 的速度很慢,擦除(将'0'改写为'r)的速度更慢,无法像DRAM那样用于对计算的直接支 持。它被制作成块设备化lock device),必须整块一起擦除,一个块化lock)包含很多页 (page),擦除后每页可W进行写入操作。NAND的另外一个问题是具有有限的寿命。
[0006] DRAM和NAND闪存,W及CPU的逻辑电路,虽然都是基于CMOS半导体工艺生产的, 但运=者的工艺彼此并不兼容。于是,计算机的=个核屯、部分无法在一个忍片上共存,运深 刻地影响了现代计算机的架构。
[0007] 现有技术中的计算机架构如图1所示,图1中示出多个CPU内核,分别为CPU1、 CPU2XPU3、……、CP化,每个CPU内核一般具有相应的一级缓存化ICache),根据需要还可 W进一步为每个CPU内核配备相应的二级缓存化2Cache)、=级缓存化3Cache)。DRAM与 各个CPU内核之间通过双倍速率值DR,Double Data Rate)接口进行通信,硬盘(皿,Hard Disk)或固态硬盘(SSD,Solid State Drives)与各个CPU内核之间则通过外围设备接口 进行通信。
[0008] -方面,CPU在向多核的方向发展,另一方面内存和存储都在另外的忍片里。多 核CPU吞吐信息量成比例增加,与内存、存储的通信就越来越成为系统性能的瓶颈。为了 缓解通信瓶颈,CPU不得不采用越来越大的多级缓存。缓存是把内存中的内容复制,通常是 用成本比DRAM高得多但速度更快的静态随机存取存储器(SRAM, static Random Access Memory)设计的。运样的架构,费效比非常的差。半导体忍片的成本由其娃片的面积决定, 而传统计算机架构带来的性能提升与其娃片面积的增加远远不成比例。
【发明内容】
[0009] 本发明要解决的问题是现有技术中的计算机架构因 CPU与内存、存储之间存在的 通信瓶颈而影响计算机整体性能的提升,并使费效比较差。
[0010] 为解决上述问题,本发明技术方案提供一种细胞阵列计算系统,包括:主控CPU、 细胞阵列和细胞阵列总线;所述细胞阵列是由一个W上兼具计算和存储功能的细胞组成的 二维阵列,其中每一个细胞包括微处理器(MPU,Micro Processing化it)和非易失(NV, Not Volatile)随机存储器;所述非易失随机存储器用于所述微处理器计算时所设及数据 的随机存取,还用于存储软件的指令代码和需要永久保存的数据;每一个细胞储存各自在 所述细胞阵列中的位置作为身份识别号(ID,identification) W供细胞中的软件或硬件 读取;所述主控CPU通过所述细胞阵列总线与所述细胞阵列中的每一个细胞进行通信;所 述细胞阵列中的相邻细胞之间有通信接口,能相互发送数据;所述细胞阵列中的任意两个 细胞之间能进行通信,参与细胞间通信的细胞包含起点细胞、终点细胞和中转细胞,所述起 点细胞为向所述终点细胞发出数据的细胞,所述终点细胞为最终接收所述起点细胞所发数 据的细胞,所述中转细胞为沿细胞间通信路径依次相邻且通过所述通信接口中转所述起点 细胞所发数据的细胞,所述细胞间通信路径是由所述起点细胞、中转细胞和终点细胞所构 成的数据收发路径;所述细胞阵列中还设有至少一个专职输出细胞,所述专职输出细胞作 为所述终点细胞接收并存储其他细胞给所述主控CPU的输出数据,并W中断信号通知所述 主控CPU读取所述输出数据。
[0011] 可选的,所述专职输出细胞的非易失随机存储器中设有先入先出队列(FIFO, First I吨Ut First Ou化Ut),其他细胞给所述主控CPU的所有输出数据存储在所述先入先 出队列中。
[0012] 可选的,所述细胞阵列中的细胞还包括与所述微处理器相连的网络控制器,所述 网络控制器用于在细胞间通信时对发出的数据、中转的数据或者最终接收的数据进行收发 控制,还用于向所述微处理器发送中断信号。
[0013] 可选的,所述细胞阵列中的细胞还包括与所述网络控制器相连的一组或一组W上 先入先出队列,各组先入先出队列分别对应一个与本细胞相邻的细胞,每一组先入先出队 列包括输入先入先出队列和输出先入先出队列,所述输入先入先出队列用于存储输入本细 胞进行中转的数据或最终接收的数据,所述输出先入先出队列用于存储从本细胞输出的需 进行中转的数据或本细胞向其他细胞发出的数据。
[0014] 可选的,所述主控CPU通过所述细胞阵列总线与所述细胞阵列中的每一个细胞进 行的通信包括W下情况中的至少一种:
[0015] 按地址读写所述细胞阵列中任一细胞的非易失随机存储器;
[0016] 将数据广播到所述细胞阵列中目标区域内每一个细胞的非易失随机存储器,并写 入所述目标区域内每一个细胞的非易失随机存储器中相同的相对地址;
[0017] 给所述细胞阵列中任一细胞的微处理器发送指令、发送数据或读取状态;
[0018] 给所述目标区域内所有细胞的微处理器广播指令。
[0019] 可选的,所述细胞阵列中的细胞还包括总线控制器和细胞内部总线,所述总线控 制器与所述细胞阵列总线、微处理器W及细胞内部总线相连,所述总线控制器用于识别所 述主控CPU与本细胞之间进行的通信,连接所述微处理器W传递所述主控CPU发送的指令 或数据、状态读取,或者通过所述细胞内部总线连接所述非易失随机存储器进行数据的读 写操作。
[0020] 可选的,所述微处理器中集成有浮点计算处理器(FPU,Float Point化it)和图像 处理器中的至少一种。
[002U 可选的,所述非易失随机存储器为磁性随机存储器(MRAM,Magnetic Random Access Memory)。
[0022] 可选的,所述主控CPU与所述细胞阵列和所述细胞阵列总线集成于一个忍片中。
[0023] 可选的,所述主控CPU作为独立的忍片,通过标准的内存接口与由所述细胞阵列 和所述细胞阵列总线组成的忍片进行通信。
[0024] 为解决上述问题,本发明技术方案还提供一种上述细胞阵列计算系统中的通信方 法,包括:所述专职输出细胞接收并存储其他细胞给所述主控CPU的输出数据之后,向所述 主控CPU发出通知读取的中断信号;所述主控CPU在接收到所述通知读取的中断信号后,从 所述专职输出细胞中读取所述输出数据;
[0025] 所述其他细胞通过如下方式将所述输出数据发送至所述专职输出细胞:所述其他 细胞中的任一细胞作为起点细胞,将所述输出数据按选定的发送方向发送至相邻的细胞; 当所述细胞阵列中的任一细胞接收到相邻细胞发送的所述输出数据时,若判断出所述输出 数据中所标明的终点细胞的ID与本细胞的ID -致,则将所述输出数据存入本细胞的非易 失随机存储器,否则本细胞作为中转细胞,在选定发送方向后将所述输出数据中转给与本 细胞相邻的细胞。 阳026] 可选的,所述起点细胞或中转细胞通过如下方式选定所述发送方向:若所述起点 细胞或中转细胞与所述专职输出细胞之间能形成一条直线的通信路径,则所述发送方向为 由所述起点细胞或中转细胞沿所述直线向所述专职输出细胞的方向,否则所述发送方向为 由所述起点细胞或中转细胞向待选相邻细胞的方向,所述待选相邻细胞为与所述起点细胞 或中转细胞相邻的细胞之中靠近所述专职输出细胞的细胞。
[0027] 此外,本发明技术方案还提供一种应用上述细胞阵列计算系统进行数据比对的方 法,包括:所述主控CPU选择所述细胞阵列中全部或一个目标区域内的细胞后,把比对程序 广播到每个细胞的非易失随机存储器中;所述主控CPU把所选择的每个细胞负责比对的样 品分别写入到各细胞的约定地址中;所述主控CPU广播指令给所选择细胞的微处理器,使 各个微处理器完成初始化后等待输入待比对的数据;所述主控CPU把待比对的数据广播给 所选择细胞的微处理器;所选择细胞的微处理器运行所述比对程序,对接收到的待比对的 数据与本细胞负责比对的样品进行比较,若获得两者一致的比较结果,则使用上述细胞阵 列计算系统中的通信方法,将所述比较结果作为输出数据发送至所述专职输出细胞W供所 述主控CPU读取。
[0028] 与现有技术相比,本发明的技术方案至少具有W下优点:
[0029] 通过将一个W上兼具独立计算和存储功能的单元(称为"细胞")组成二维阵列 (称为"细胞阵列"),其中每一个细胞包括微处理器和非易失随机存储器,所述非易失随机 存储器既能支持所述微处理器进行计算时所设及数据的随机存取,也能支持存储软件的指 令代码和需要永久保存的数据,使内存、存储、计算=个功能集成到每个细胞中,并使各细 胞之间形成密集的通讯网络,一方面,主控CPU能通过细胞阵列总线与细胞阵列中的每一 个细胞进行通信,另一方面,细胞阵列中的相邻细胞之间也能相互发送数据,由此能通过数 据广播/群发和内部网络,克服现有计算机架构因 CPU与内存、存储之间存在的通信瓶颈, 从而提升计算系统的整体性能,并能使费效比较佳。
[0030] 通过细胞阵列中相邻细胞之间的通信接口,实现相邻细胞之间对于数据的多次中 转,使细胞阵列中的任意两个细胞之间不依靠主控CPU便能进行通信,提高了细胞间通信 的效率,也降低了主控CPU的处理负担,从而能