原创:Blue Gene/C处理器猜想

来源:百度文库 编辑:超级军网 时间:2024/05/02 00:32:16


不知不觉,BGQ已经发布上市快两年了;依照正常的换代步伐;明年年底之前革命性的Blue Gene/C就会来到我们的身边(直到BGQ为止,Blue Gene series实际上一直没有跳出BGL的大框架;当然BGQ算是换了个内核,片内互联也有明显的Multi-Core>Many-Core过渡特征);那么不大致猜测下它的规格好了


1、可以肯定的是,BGC将在片内互联机构上大量应用Cyclops-64项目的技术成果,比如基于SRAM与eDRAM混合的系统可见的多层局部存储(注意不是Cache,倒是和Cell的LS比较接近一些;其中的半数被配置为对应内核的分块缓存,半数被汇聚为所有内核共享的高速缓存----不同于Cell,BGC在局部存储上可能同样是分层的,但寄存器可以直接读写任意层次的局部缓存)、超大规模Crossbar(Cyclops-64的Crossbar包括:源控制单元,目标控制单元,96到1多路选择器,数据FIFO和局部寄存器)、PIM(processor in memory) 操作(通过直接操作多层局部存储器实现,据此猜测,多层局部存储被引入的意义可能在于20/80定律,亦即较有可能被频繁操作的数据将优先装入近场局部存储器)……等等
http://lt.cjdby.net/thread-615633-1-1.html
2、考虑到继续扩大核心数量可能极大增加片内通讯和一致性开支,BGC在Cyclops-64基础上进一步增加核心数量的可能性较小,因此其内核部分可能来自POWER A2的平滑升级(最有可能被调整的多线程策略,IBM有可能引入类似于SUN的CMT技术,形成某种SMT+CMT混合的并发/同步多线程处理,每核心线程数同步线程数因此可能达到8,当然并发数依旧是4)
3、计算内核数可能为64,每核心对应0.5M SRAM和2-4M eDRAM(2M可能性居多)的局部存储器,并且保留扩展至128-256核的架构伸缩性;考虑到制程技术的进步,BGC恐怕不会配置如Cyclops-64一样多的16个备份核心,倒是PowerA2 16计算+1管理(可重配置为计算)+1备份的基本配置被线性放大的可能性大一些
4、正式引入3D堆叠DRAM设计,考虑到BGC在内核上和POWER A2的区别不会很大,为控制成本和技术难度(避免使用过多层的TSV封装),堆叠的DRAM数量应当不会超过64GB(保持POWER A2每核心1GB内存水准)
…………
暂时就想到这些,权作抛砖引玉吧

不知不觉,BGQ已经发布上市快两年了;依照正常的换代步伐;明年年底之前革命性的Blue Gene/C就会来到我们的身边(直到BGQ为止,Blue Gene series实际上一直没有跳出BGL的大框架;当然BGQ算是换了个内核,片内互联也有明显的Multi-Core>Many-Core过渡特征);那么不大致猜测下它的规格好了


1、可以肯定的是,BGC将在片内互联机构上大量应用Cyclops-64项目的技术成果,比如基于SRAM与eDRAM混合的系统可见的多层局部存储(注意不是Cache,倒是和Cell的LS比较接近一些;其中的半数被配置为对应内核的分块缓存,半数被汇聚为所有内核共享的高速缓存----不同于Cell,BGC在局部存储上可能同样是分层的,但寄存器可以直接读写任意层次的局部缓存)、超大规模Crossbar(Cyclops-64的Crossbar包括:源控制单元,目标控制单元,96到1多路选择器,数据FIFO和局部寄存器)、PIM(processor in memory) 操作(通过直接操作多层局部存储器实现,据此猜测,多层局部存储被引入的意义可能在于20/80定律,亦即较有可能被频繁操作的数据将优先装入近场局部存储器)……等等
http://lt.cjdby.net/thread-615633-1-1.html
2、考虑到继续扩大核心数量可能极大增加片内通讯和一致性开支,BGC在Cyclops-64基础上进一步增加核心数量的可能性较小,因此其内核部分可能来自POWER A2的平滑升级(最有可能被调整的多线程策略,IBM有可能引入类似于SUN的CMT技术,形成某种SMT+CMT混合的并发/同步多线程处理,每核心线程数同步线程数因此可能达到8,当然并发数依旧是4)
3、计算内核数可能为64,每核心对应0.5M SRAM和2-4M eDRAM(2M可能性居多)的局部存储器,并且保留扩展至128-256核的架构伸缩性;考虑到制程技术的进步,BGC恐怕不会配置如Cyclops-64一样多的16个备份核心,倒是PowerA2 16计算+1管理(可重配置为计算)+1备份的基本配置被线性放大的可能性大一些
4、正式引入3D堆叠DRAM设计,考虑到BGC在内核上和POWER A2的区别不会很大,为控制成本和技术难度(避免使用过多层的TSV封装),堆叠的DRAM数量应当不会超过64GB(保持POWER A2每核心1GB内存水准)
…………
暂时就想到这些,权作抛砖引玉吧
不明觉历