龙芯高速信号传输技术综述

来源:百度文库 编辑:超级军网 时间:2024/04/27 04:54:28
摘要:随着处理器向多核结构发展,芯片间的高速通信问题已经成为限制处理器性能的瓶颈,如何提高处理
器间的总线带宽成为当前研究的重要课题。本文通过对微处理器中PCI前端总线发展历史的综述,说明高速
传输总线研究的日新月异、飞速发展和Hypertransport作为龙芯处理器总线标准的研究与开发。  

关键词: 高速总线;PCI;Hypertransport;

1     研究片间高速传输技术的意义

      随着龙芯处理器设计技术向多核方向发展,技术瓶颈正逐渐从片内转移到片外,从芯片
转移到系统或者芯片和系统的结合部。高速信号传输技术将是龙芯的下一个重要技术瓶颈。
由于龙芯3 号片内将集成几十个龙芯2 号处理器核,而芯片的引脚是有限的,高性能的多核
处理器通常同外部系统有高带宽的数据吞吐量,如不能高速、高带宽地同外部系统进行数据
交互,则整个系统的性能大大降低。龙芯 3 号将会成为“嘴小肚子大”、“茶壶里煮饺子”式
的怪物。因此,如何提高处理器间的总线带宽已经成为当前研究的重要课题。

2      高速总线的发展历史

      目前用于计算机的总线标准种类繁多,大致可以分为以下几类:

                       1       2
     前端总线:PCI  、FSB (Intel)、  HyperTransport         (AMD );

                        3                                   4
      内存总线:DDR I、DDRII、DDRIII、FBDIMM  ;

                       5         6
     硬盘总线:IDE  、SATA  ;

     显示总线:PCI、PCI-EXPRESS;

     外设总线:USB1.0、USB2.0、IEEE1394。

     其中与微处理器密切相关的总线代表是前端总线,其带宽往往是衡量处理器性能的重要
指标之一。下面将分别阐述其中的代表PCI 总线和HyperTransport 总线。

PCI   总线

     对于整个电脑架构来说,早期的PCI  (文献[1][2]) 总线速率只有 133MB/s,带宽早已不
堪负荷,处处堵塞。在经历了长达十年的修修补补,PCI                  总线已经无法满足电脑性能提升的

1  Peripheral Component Interconnect,互连外围设备
2 Front Side Bus,前置总线,即外部总线
3  Double Date Rate,上下行双数据率
4  FB-DIMM(Fully Buffered-DIMM,全缓冲内存模组)是Intel 在DDR2、DDR3 的基础上发展出来的一种新型
内存模组与互联架构,既可以搭配现在的DDR2  内存芯片,也可以搭配未来的DDR3  内存芯片。DIMM, Dual
Inline Memory Module,双列直插内存模块
5  Integrated Development Environment,集成开发环境
6  Serial ATA,串行ATA (Advanced Technology Attachment,高技术配置),1990 年美国标准协会ANSI 的CAM
(Common Access Method)委员会制定的内置硬盘的接口标准。
要求,必须由带宽更大、适应性更广、发展潜力更深的新一代总线取而代之,这就是PCI Express
总线。

     2002 年7 月23  日,PCI-SIG       正式公布了PCI Express 1.0 版规范,此外,PCI-SIG 最近还
推出了最新的PCI   Express   1.1 版规范,该规范可向下兼容现有的 1.0a 标准,但对Base   Card
Electromechanical 和Mini Card Electromechanical 等子规范作了大量的更新,以提供更为先进
的功能特性。目前1.1 版已经经过各方面多次的兼容性测试,2.0 版也已公布,并开始了兼容
性测试。  PCI Express 2.0 版具有 5Gbps 的超高速率,性能比PCI Express 1.0 版和 1.1 版规范
都高出 1 倍。
     这个新标准将全面取代现行的PCI 和AGP7 ,最终实现总线标准的统一。它的主要优势就
是数据传输速率高,目前最高可达到 10GB/s 以上,而且还有相当大的发展潜力。PCI Express
也有多种规格,从PCI Express 1X 到PCI Express 16X,能满足现在和将来一定时间内出现的
低速设备和高速设备的需求;能支持PCI Express 的主要是英特尔的i915 和i925 系列芯片组。
当然要实现全面取代PCI 和 AGP 也需要一个相当长的过程,就像当初 PCI 取代 ISA8一样,

都会有个过渡的过程。

     PCI   Express  (以下简称PCI-E )采用了目前业内流行的点对点串行连接,比起PCI  以及
更早期的计算机总线的共享并行架构,它的每个设备都有自己的专用连接,不需要向整个总
线请求带宽,而且可以把数据传输率提到一个很高的水平,达到 PCI  以及更早期的计算机总
线的共享并行架构所不能提供的高带宽。相对于传统 PCI 总线在单一时间周期内只能实现单
向传输来说,PCI-E 的双单工连接能提供更高的传输速率和质量。

     PCI-E 的接口根据总线位宽不同而有所差异,包括X1、X4、X8  以及X16,X2 模式将用
于内部接口而非插槽模式。PCI-E 规格可以从 1 条通道连接扩展到32 条通道连接,有非常强
的伸缩性,以满足不同系统设备对数据传输带宽不同的需求;此外,较短的PCI-E 卡可以插
入较长的 PCI-E  插槽中使用,同时,PCI-E  接口还能够支持热拔插,这些都是不小的飞跃。
PCI-E X1 的250MB/s 传输速度已经可以满足主流声效芯片、网卡芯片和存储设备对数据传输
带宽的需求,但是还远远无法满足图形芯片对数据传输带宽的需求。 因此,用于取代 AGP
接口的 PCI-E 接口位宽为X16,能够提供5GB/s 的带宽,即便有编码上的损耗仍能够提供约
为4GB/s 左右的实际带宽,远远超过AGP 8X 的2.1GB/s 的带宽。

     尽管PCI-E 技术规格允许实现X1           (250MB/s)、X2、X4、X8、X12、X16 和X32 通道规
格,但是依目前形式来看,PCI-E X1 和PCI-E X16  已成为PCI-E 主流规格,同时很多芯片组
厂商在南桥芯片当中添加对PCI-E X1 的支持,在北桥芯片当中添加对PCI-E X16 的支持。除
提供极高数据传输带宽之外,PCI-E  因为采用串行数据包方式传递数据,所以 PCI-E  接口每
个针脚可以获得比传统 I/O 标准更大的带宽,这样就可以降低 PCI-E 设备生产成本和体积;
另外,PCI-E 也支持高阶电源管理,支持数据同步传输,为优先传输数据进行带宽优化。

     PCI Express   总线架构的适用范围非常广,覆盖了如桌面电脑、笔记本电脑、企业级别的
应用、通讯和工作自动化等诸多方面。对桌面电脑来说,它不仅使带宽增加,同时还极大地
提高了系统性能。前面我们说到,现时的PCI            总线无法适应流媒体和即时通讯的需要,而PCI
Express   则能够很好地解决这个问题。此外,它还能够支持更多的 I/O                设备,并且完全不需
要担心不同的设备会占用中断的问题。更为重要的是,PCI Express                 的引入,令游戏和多媒体
爱好者欣喜若狂。由于它具备海量的带宽,在很长时间内将基本上可以满足图形处理器发展

7  Accelerated Graphics Port,图形加速接口
8 Industry Standard Architecture,工业标准架构
的需要,使显示效果大为改进,使真正采用电影化引擎的游戏,将在很短的时间内出现;对
移动计算平台来说,PCI Express       还支持更好的电源管理功能,这对便携式计算平台非常重要。
再加上Intel 引入了全新的主板和电源规范,系统设计商们也能够更加灵活,设计出革新的产
品,使移动更加简便,性能更加强大,计算更加巧妙;对于企业级别的应用,性能和带宽将
比台式电脑得到进一步地提升。随之而来的是,可靠性、适用性、灵活性也同时得到了很大
的改善。而且,PCI Express       就像USB     一样,支持热插拔和热交换,因此它能够保持服务器
和工作站无间断地运作,避免了由于升级或者更换硬件停机而带来的损失。在通讯领域,PCI
Express 具有很好的兼容性,可以建立标准化的平台,提高服务质量,并使配置更加灵活。总
的来说,PCI Express     为未来十年内的计算和通讯平台,提供了先进的功能。

HyperTransport 总线

     HyperTransport(文献[3])是 AMD 提出的企业标准,设计目的是用于高速芯片间的内部联
接。但随着AMD64 平台的成功,HyperTransport 总线的影响力也随之扩大,并成为连接AMD64
处理器、北桥芯片和南桥芯片的系统中枢。在这样的架构中,PCI Express 总线反而不再承担
中坚角色,只是承担设备扩展的单一职能,HyperTransport 便理所当然成为AMD64 平台的系
统总线。

     尽管是 2004  年才开始得到广泛应用,但 HyperTransport  的历史却极为悠久。早在 1999
年,AMD 就着手进行设计,当时它被称为“LDT               (Lightning   Data   Transport )”,意思是传输
数据像闪电一样快速。2000 年 5 月,LDT 1.0 版发布,并被更名为HyperTransport。诚如前面
所言,AMD 开发HyperTransport 的主要意图是为当时还处于设计阶段的K8 处理器服务,比
如两枚 K8  处理器构建 SMP 系统、K8  与芯片组、芯片组的南桥与北桥等芯片间连接都需要
高速总线,HyperTransport 是针对这些特定的场合设计的。再者,它也可以作为路由器芯片与
交换机芯片、高性能服务器内部的互联总线,具有相当高的灵活性和可扩充性,这一点也为
后来的实际应用所证实。

     在基本工作原理上,HyperTransport 都是通过串行传输、高频率运作获得超高性能。而后
者其实是参照 HyperTransport  而设计。基本的 HyperTransport  总线为两条点对点的全双工数
据传输线路(一条为输入、一条为输出),它的物理频率只有400MHz,AMD 引入了DDR 双
向触发技术,因此其数据传输频率相当于 800MHz。如果同时使用八对这样的串行传输线路
(也就是八位),HyperTransport 的双向数据传输率可达到1.6GBps,而如果采用32 位设计,
HyperTransport 便能够提供 6.4GBps 的超高带宽。在2000 年,如此高速的总线超出了当时业
界的预期绝,体现了AMD 的远见。

     除了速度快之外,HyperTransport 还有一个独有的优势,它可以在串行传输模式下模拟并
行数据的传输效果。在当时,PC 都是采用 32 位 X86 架构,系统内部数据都是以 32 位作为
一个基本单位进行传输或处理;而改用串行总线后,接收方在接收数据时就得等32 位数据全
部到齐后才可进行转换和封包,这就给系统带来不必要的负担。HyperTransport 总线很好地解
决了这个问题,它采用一种特殊的分批方式,可以将32 位数据预先分批组装;如果采用的是
八位总线,那么32 位数据会被分成四个批次发送,然后自动合为一体。这样在系统看来,数
据都是以 32 位为单位传送的,能够直接调用,而不必像传统串行总线一样需要由系统干涉数
据组装工作。

     第一个采用 HyperTransport      总线的产品是 nVIDIA  在 2001  年推出的 nForce           芯片组。
nVIDIA  选择的是八位总线,南北桥带宽就达到 800MBps。在当时,同类芯片组的南北桥带
宽不过 266MBps ,nForce        的高指标显得超前。虽然 nForce          没有获得成功,但高性能的
HyperTransport 总线给外界留下深刻的印象。2002 年,nForce2 推出,这次nVIDIA 取得了成
功,HyperTransport     真正进入实用阶段。不过,HyperTransport          的真正辉煌还是在 AMD         的
Opteron  (酷龙)和Athlon  (速龙) 64 推出以后。这两款处理器都采用 32 位、800Mz 规格的
HyperTransport 总线与芯片组连接,总线带宽高达 6.4GBps。由于Opteron 和 Athlon   64 都直
接整合了内存控制器,HyperTransport 总线就只需要承担“显卡与CPU”以及“南桥I/O 设备
与CPU”之间的数据传输任务,6.4GBps 带宽绰绰有余。此外,AMD 为K8 平台设计的AMD8000
芯片组也采用 HyperTransport  技术,HyperTransport  贯穿 CPU、北桥和南桥,成为整套架构
的中枢神经。不过VIA 和 SiS 都拥有自己的南北桥总线技术,暂时未采用HyperTransport。

     2004  年 2   月,AMD  推出 HyperTransport   2.0,它的主要变化就是数据传输频率提升到
1GHz,32 位总线的带宽达到 8GBps。AMD 将它用于 Opteron 以及高端型号的Athlon 64 FX、
Athlon   64 处理器中,对该平台的所有芯片组产品都提供支持。带宽提升主要是为满足 PCI
Express 总线的需求。我们知道,显卡的PCI             Express ×16 总线提供高达 8GBps 的带宽,而
之前 HyperTransport  总线只能提供 6.4GBps 带宽,两者无法匹配,将 HyperTransport 提升到
2.0 标准非常有必要。此时,AMD 的64 位平台已经具有相当出色的竞争力,无论在服务器市
场还是桌面市场,AMD 平台都大举流行,而HyperTransport 的影响力也日趋强大,在可见的
将来,HyperTransport 都将保持这样的发展势头。

PCI Express 和HyperTransport 总线的比较

     PCI Express 和HyperTransport 两种结构都是点到点通信结构,具有数据消息包传递协议,
并且都大大减少了I/O       模块的数目,并具有多种信号传输带宽选择。CDR Serial-Link 和 Source
Synchronization   是 PCI -E    和 HyperTransport    在物理层协议的主要差异。因此,相对而言
HyperTransport 的并行度高些,而PCI-E 则信号传输频率更高。

     PC 总线由ISA 到PCI 总线,再由PCI 进入PCI   Express 和HyperTransport 体系,计算机
在这三次大转折中也完成三次飞跃式的提升。与这个过程相对应,我们看到计算机的处理速
度、实现的功能和软件平台都在进行同样的进化。显然,没有总线技术的进步作为基础,计
算机的快速发展就无从谈起。今天,业界站在一个崭新的起点:PCI Express 和HyperTransport
开创了一个今天看来近乎完美的总线架构,未来十年的计算机都将奔腾在这样的基础之上。
而业界对高速总线的渴求也是无休无止,PCI Express 2.0 和HyperTransport 3.0 都将提上日程,
相信它们将会再次带来令人惊喜的效能提升。

PCI Express 与HyperTransport 各自发展趋势

     据In-Stat 报告说,三种新兴芯片互联技术:HyperTransport、PCI   Express 和RapidIO 正被
渐渐集成到半导体芯片和系统中,未来几年采用这些技术的出货量将增长。In-Stat  分析师克
瑞斯.基瑟尔(Chris Kissel)说:“每种互联技术都找到了蓬勃发展的应用。”“RapidIO 找到了家庭
互联用数字信号处理,HyperTransport 成为AMD 所有处理器的前端总线和处理器到处理器的
接口,PCI Express 是所有计算应用中的板级外设互联的新标准。”

3     我们为什么选用HperTransport

          龙芯处理器是采用MIPS 指令的处理器,如何解决多核处理器间的高速互连,采用哪
     一种高速传输协议是目前龙芯处理器研究需要攻克的难题之一。

          HyperTransport 是一种点到点的连接,而不是共享总线的拓扑结构,因此其延迟大大
     减少。高带宽、低延迟的优势使其可以更好地应用于处理器之间的互连。因此,它成为
     MIPS 处理器总线的最好替代者。

           目前,HyperTransport 主要承担“显卡与CPU”以及“南桥I/O 设备与CPU”之间的数据
     传输任务。也就是说,HyperTransport            的主要竞争对手是英特尔的 FSB2 ,与之相比,
     HyperTransport  的性价比优势是明显的,在提供同等带宽的情况下,HyperTransport  的管
     脚数目少得多,这非常有利于降低电路板上的布线复杂度。

          我们看到,HyperTransport 主要是应用于AMD  的芯片组中,而且,在HT 阵营中,
     越来越多的厂家已经推出基于AMD、K8 处理器的芯片组,像威盛公司的K8T890 芯片组,
     SIS 公司的SIS755 芯片组,NVDIA  的nForce3 250 系列,ATI 的Radeon Xpress 200 等。
     同时,在多处理器互连方面,AMD                   的处理器以及许多的 MIPS              处理器都采用
     HyperTransport 作为总线连接。同时,在上述众多桥片中还大多支持PCI Express 的插槽,
     能够很好地实现从HyperTransport 到PCI Express 的转换。

4      已经取得技术成果

          在工程领域,我们2006 年开始研究高速总线,已经取得了初步进展。在近两年的时
     间中先后加工了三个芯片,分别是2006 年采用0.18umCMOS 工艺流片I/O  电路,锁相环
     电路,测试结果表明锁相环的工作频率可以达到1.6GHz,周期到周期抖动小于30ps。I/O
     PAD  电路数据传输速率达到1.6Gb/s,板上传输距离超过20 厘米。

          2007 年 8 月份采用了ST micro 公司的65nm CMOS 工艺的设计技术,完成了HT1.0
     以及HT2.0 低版本的测试芯片的设计,锁相环时钟工作频率可以达到2GHz,目前芯片正
     处于封装测试阶段。在学术领域,我们也取得了一定的进展,并在国际会议以及学报级
     期刊上发表了六篇文章。

参考文献:  

       【1】   Jim   Choate   et   al.   MAC-PHY   Interface   Connector   for   the   TM   PCI   Express   Architecture.   Intel
               coporation.2005

       【2】   AdvancedSwitching   Special   Interest   Group.   PCI   Express   Advanced   Switching   Specication,   Draft
               1.0. www.asi-sig.org,Sept.2003

       【3】   Don Anderson, Jay Trodden. Hypertransport system architecture. Mindshare Inc. 2003

作者简介:   

张 锋:  博士,中国科学院计算技术研究所微处理器中心全定制组摘要:随着处理器向多核结构发展,芯片间的高速通信问题已经成为限制处理器性能的瓶颈,如何提高处理
器间的总线带宽成为当前研究的重要课题。本文通过对微处理器中PCI前端总线发展历史的综述,说明高速
传输总线研究的日新月异、飞速发展和Hypertransport作为龙芯处理器总线标准的研究与开发。  

关键词: 高速总线;PCI;Hypertransport;

1     研究片间高速传输技术的意义

      随着龙芯处理器设计技术向多核方向发展,技术瓶颈正逐渐从片内转移到片外,从芯片
转移到系统或者芯片和系统的结合部。高速信号传输技术将是龙芯的下一个重要技术瓶颈。
由于龙芯3 号片内将集成几十个龙芯2 号处理器核,而芯片的引脚是有限的,高性能的多核
处理器通常同外部系统有高带宽的数据吞吐量,如不能高速、高带宽地同外部系统进行数据
交互,则整个系统的性能大大降低。龙芯 3 号将会成为“嘴小肚子大”、“茶壶里煮饺子”式
的怪物。因此,如何提高处理器间的总线带宽已经成为当前研究的重要课题。

2      高速总线的发展历史

      目前用于计算机的总线标准种类繁多,大致可以分为以下几类:

                       1       2
     前端总线:PCI  、FSB (Intel)、  HyperTransport         (AMD );

                        3                                   4
      内存总线:DDR I、DDRII、DDRIII、FBDIMM  ;

                       5         6
     硬盘总线:IDE  、SATA  ;

     显示总线:PCI、PCI-EXPRESS;

     外设总线:USB1.0、USB2.0、IEEE1394。

     其中与微处理器密切相关的总线代表是前端总线,其带宽往往是衡量处理器性能的重要
指标之一。下面将分别阐述其中的代表PCI 总线和HyperTransport 总线。

PCI   总线

     对于整个电脑架构来说,早期的PCI  (文献[1][2]) 总线速率只有 133MB/s,带宽早已不
堪负荷,处处堵塞。在经历了长达十年的修修补补,PCI                  总线已经无法满足电脑性能提升的

1  Peripheral Component Interconnect,互连外围设备
2 Front Side Bus,前置总线,即外部总线
3  Double Date Rate,上下行双数据率
4  FB-DIMM(Fully Buffered-DIMM,全缓冲内存模组)是Intel 在DDR2、DDR3 的基础上发展出来的一种新型
内存模组与互联架构,既可以搭配现在的DDR2  内存芯片,也可以搭配未来的DDR3  内存芯片。DIMM, Dual
Inline Memory Module,双列直插内存模块
5  Integrated Development Environment,集成开发环境
6  Serial ATA,串行ATA (Advanced Technology Attachment,高技术配置),1990 年美国标准协会ANSI 的CAM
(Common Access Method)委员会制定的内置硬盘的接口标准。
要求,必须由带宽更大、适应性更广、发展潜力更深的新一代总线取而代之,这就是PCI Express
总线。

     2002 年7 月23  日,PCI-SIG       正式公布了PCI Express 1.0 版规范,此外,PCI-SIG 最近还
推出了最新的PCI   Express   1.1 版规范,该规范可向下兼容现有的 1.0a 标准,但对Base   Card
Electromechanical 和Mini Card Electromechanical 等子规范作了大量的更新,以提供更为先进
的功能特性。目前1.1 版已经经过各方面多次的兼容性测试,2.0 版也已公布,并开始了兼容
性测试。  PCI Express 2.0 版具有 5Gbps 的超高速率,性能比PCI Express 1.0 版和 1.1 版规范
都高出 1 倍。
     这个新标准将全面取代现行的PCI 和AGP7 ,最终实现总线标准的统一。它的主要优势就
是数据传输速率高,目前最高可达到 10GB/s 以上,而且还有相当大的发展潜力。PCI Express
也有多种规格,从PCI Express 1X 到PCI Express 16X,能满足现在和将来一定时间内出现的
低速设备和高速设备的需求;能支持PCI Express 的主要是英特尔的i915 和i925 系列芯片组。
当然要实现全面取代PCI 和 AGP 也需要一个相当长的过程,就像当初 PCI 取代 ISA8一样,

都会有个过渡的过程。

     PCI   Express  (以下简称PCI-E )采用了目前业内流行的点对点串行连接,比起PCI  以及
更早期的计算机总线的共享并行架构,它的每个设备都有自己的专用连接,不需要向整个总
线请求带宽,而且可以把数据传输率提到一个很高的水平,达到 PCI  以及更早期的计算机总
线的共享并行架构所不能提供的高带宽。相对于传统 PCI 总线在单一时间周期内只能实现单
向传输来说,PCI-E 的双单工连接能提供更高的传输速率和质量。

     PCI-E 的接口根据总线位宽不同而有所差异,包括X1、X4、X8  以及X16,X2 模式将用
于内部接口而非插槽模式。PCI-E 规格可以从 1 条通道连接扩展到32 条通道连接,有非常强
的伸缩性,以满足不同系统设备对数据传输带宽不同的需求;此外,较短的PCI-E 卡可以插
入较长的 PCI-E  插槽中使用,同时,PCI-E  接口还能够支持热拔插,这些都是不小的飞跃。
PCI-E X1 的250MB/s 传输速度已经可以满足主流声效芯片、网卡芯片和存储设备对数据传输
带宽的需求,但是还远远无法满足图形芯片对数据传输带宽的需求。 因此,用于取代 AGP
接口的 PCI-E 接口位宽为X16,能够提供5GB/s 的带宽,即便有编码上的损耗仍能够提供约
为4GB/s 左右的实际带宽,远远超过AGP 8X 的2.1GB/s 的带宽。

     尽管PCI-E 技术规格允许实现X1           (250MB/s)、X2、X4、X8、X12、X16 和X32 通道规
格,但是依目前形式来看,PCI-E X1 和PCI-E X16  已成为PCI-E 主流规格,同时很多芯片组
厂商在南桥芯片当中添加对PCI-E X1 的支持,在北桥芯片当中添加对PCI-E X16 的支持。除
提供极高数据传输带宽之外,PCI-E  因为采用串行数据包方式传递数据,所以 PCI-E  接口每
个针脚可以获得比传统 I/O 标准更大的带宽,这样就可以降低 PCI-E 设备生产成本和体积;
另外,PCI-E 也支持高阶电源管理,支持数据同步传输,为优先传输数据进行带宽优化。

     PCI Express   总线架构的适用范围非常广,覆盖了如桌面电脑、笔记本电脑、企业级别的
应用、通讯和工作自动化等诸多方面。对桌面电脑来说,它不仅使带宽增加,同时还极大地
提高了系统性能。前面我们说到,现时的PCI            总线无法适应流媒体和即时通讯的需要,而PCI
Express   则能够很好地解决这个问题。此外,它还能够支持更多的 I/O                设备,并且完全不需
要担心不同的设备会占用中断的问题。更为重要的是,PCI Express                 的引入,令游戏和多媒体
爱好者欣喜若狂。由于它具备海量的带宽,在很长时间内将基本上可以满足图形处理器发展

7  Accelerated Graphics Port,图形加速接口
8 Industry Standard Architecture,工业标准架构
的需要,使显示效果大为改进,使真正采用电影化引擎的游戏,将在很短的时间内出现;对
移动计算平台来说,PCI Express       还支持更好的电源管理功能,这对便携式计算平台非常重要。
再加上Intel 引入了全新的主板和电源规范,系统设计商们也能够更加灵活,设计出革新的产
品,使移动更加简便,性能更加强大,计算更加巧妙;对于企业级别的应用,性能和带宽将
比台式电脑得到进一步地提升。随之而来的是,可靠性、适用性、灵活性也同时得到了很大
的改善。而且,PCI Express       就像USB     一样,支持热插拔和热交换,因此它能够保持服务器
和工作站无间断地运作,避免了由于升级或者更换硬件停机而带来的损失。在通讯领域,PCI
Express 具有很好的兼容性,可以建立标准化的平台,提高服务质量,并使配置更加灵活。总
的来说,PCI Express     为未来十年内的计算和通讯平台,提供了先进的功能。

HyperTransport 总线

     HyperTransport(文献[3])是 AMD 提出的企业标准,设计目的是用于高速芯片间的内部联
接。但随着AMD64 平台的成功,HyperTransport 总线的影响力也随之扩大,并成为连接AMD64
处理器、北桥芯片和南桥芯片的系统中枢。在这样的架构中,PCI Express 总线反而不再承担
中坚角色,只是承担设备扩展的单一职能,HyperTransport 便理所当然成为AMD64 平台的系
统总线。

     尽管是 2004  年才开始得到广泛应用,但 HyperTransport  的历史却极为悠久。早在 1999
年,AMD 就着手进行设计,当时它被称为“LDT               (Lightning   Data   Transport )”,意思是传输
数据像闪电一样快速。2000 年 5 月,LDT 1.0 版发布,并被更名为HyperTransport。诚如前面
所言,AMD 开发HyperTransport 的主要意图是为当时还处于设计阶段的K8 处理器服务,比
如两枚 K8  处理器构建 SMP 系统、K8  与芯片组、芯片组的南桥与北桥等芯片间连接都需要
高速总线,HyperTransport 是针对这些特定的场合设计的。再者,它也可以作为路由器芯片与
交换机芯片、高性能服务器内部的互联总线,具有相当高的灵活性和可扩充性,这一点也为
后来的实际应用所证实。

     在基本工作原理上,HyperTransport 都是通过串行传输、高频率运作获得超高性能。而后
者其实是参照 HyperTransport  而设计。基本的 HyperTransport  总线为两条点对点的全双工数
据传输线路(一条为输入、一条为输出),它的物理频率只有400MHz,AMD 引入了DDR 双
向触发技术,因此其数据传输频率相当于 800MHz。如果同时使用八对这样的串行传输线路
(也就是八位),HyperTransport 的双向数据传输率可达到1.6GBps,而如果采用32 位设计,
HyperTransport 便能够提供 6.4GBps 的超高带宽。在2000 年,如此高速的总线超出了当时业
界的预期绝,体现了AMD 的远见。

     除了速度快之外,HyperTransport 还有一个独有的优势,它可以在串行传输模式下模拟并
行数据的传输效果。在当时,PC 都是采用 32 位 X86 架构,系统内部数据都是以 32 位作为
一个基本单位进行传输或处理;而改用串行总线后,接收方在接收数据时就得等32 位数据全
部到齐后才可进行转换和封包,这就给系统带来不必要的负担。HyperTransport 总线很好地解
决了这个问题,它采用一种特殊的分批方式,可以将32 位数据预先分批组装;如果采用的是
八位总线,那么32 位数据会被分成四个批次发送,然后自动合为一体。这样在系统看来,数
据都是以 32 位为单位传送的,能够直接调用,而不必像传统串行总线一样需要由系统干涉数
据组装工作。

     第一个采用 HyperTransport      总线的产品是 nVIDIA  在 2001  年推出的 nForce           芯片组。
nVIDIA  选择的是八位总线,南北桥带宽就达到 800MBps。在当时,同类芯片组的南北桥带
宽不过 266MBps ,nForce        的高指标显得超前。虽然 nForce          没有获得成功,但高性能的
HyperTransport 总线给外界留下深刻的印象。2002 年,nForce2 推出,这次nVIDIA 取得了成
功,HyperTransport     真正进入实用阶段。不过,HyperTransport          的真正辉煌还是在 AMD         的
Opteron  (酷龙)和Athlon  (速龙) 64 推出以后。这两款处理器都采用 32 位、800Mz 规格的
HyperTransport 总线与芯片组连接,总线带宽高达 6.4GBps。由于Opteron 和 Athlon   64 都直
接整合了内存控制器,HyperTransport 总线就只需要承担“显卡与CPU”以及“南桥I/O 设备
与CPU”之间的数据传输任务,6.4GBps 带宽绰绰有余。此外,AMD 为K8 平台设计的AMD8000
芯片组也采用 HyperTransport  技术,HyperTransport  贯穿 CPU、北桥和南桥,成为整套架构
的中枢神经。不过VIA 和 SiS 都拥有自己的南北桥总线技术,暂时未采用HyperTransport。

     2004  年 2   月,AMD  推出 HyperTransport   2.0,它的主要变化就是数据传输频率提升到
1GHz,32 位总线的带宽达到 8GBps。AMD 将它用于 Opteron 以及高端型号的Athlon 64 FX、
Athlon   64 处理器中,对该平台的所有芯片组产品都提供支持。带宽提升主要是为满足 PCI
Express 总线的需求。我们知道,显卡的PCI             Express ×16 总线提供高达 8GBps 的带宽,而
之前 HyperTransport  总线只能提供 6.4GBps 带宽,两者无法匹配,将 HyperTransport 提升到
2.0 标准非常有必要。此时,AMD 的64 位平台已经具有相当出色的竞争力,无论在服务器市
场还是桌面市场,AMD 平台都大举流行,而HyperTransport 的影响力也日趋强大,在可见的
将来,HyperTransport 都将保持这样的发展势头。

PCI Express 和HyperTransport 总线的比较

     PCI Express 和HyperTransport 两种结构都是点到点通信结构,具有数据消息包传递协议,
并且都大大减少了I/O       模块的数目,并具有多种信号传输带宽选择。CDR Serial-Link 和 Source
Synchronization   是 PCI -E    和 HyperTransport    在物理层协议的主要差异。因此,相对而言
HyperTransport 的并行度高些,而PCI-E 则信号传输频率更高。

     PC 总线由ISA 到PCI 总线,再由PCI 进入PCI   Express 和HyperTransport 体系,计算机
在这三次大转折中也完成三次飞跃式的提升。与这个过程相对应,我们看到计算机的处理速
度、实现的功能和软件平台都在进行同样的进化。显然,没有总线技术的进步作为基础,计
算机的快速发展就无从谈起。今天,业界站在一个崭新的起点:PCI Express 和HyperTransport
开创了一个今天看来近乎完美的总线架构,未来十年的计算机都将奔腾在这样的基础之上。
而业界对高速总线的渴求也是无休无止,PCI Express 2.0 和HyperTransport 3.0 都将提上日程,
相信它们将会再次带来令人惊喜的效能提升。

PCI Express 与HyperTransport 各自发展趋势

     据In-Stat 报告说,三种新兴芯片互联技术:HyperTransport、PCI   Express 和RapidIO 正被
渐渐集成到半导体芯片和系统中,未来几年采用这些技术的出货量将增长。In-Stat  分析师克
瑞斯.基瑟尔(Chris Kissel)说:“每种互联技术都找到了蓬勃发展的应用。”“RapidIO 找到了家庭
互联用数字信号处理,HyperTransport 成为AMD 所有处理器的前端总线和处理器到处理器的
接口,PCI Express 是所有计算应用中的板级外设互联的新标准。”

3     我们为什么选用HperTransport

          龙芯处理器是采用MIPS 指令的处理器,如何解决多核处理器间的高速互连,采用哪
     一种高速传输协议是目前龙芯处理器研究需要攻克的难题之一。

          HyperTransport 是一种点到点的连接,而不是共享总线的拓扑结构,因此其延迟大大
     减少。高带宽、低延迟的优势使其可以更好地应用于处理器之间的互连。因此,它成为
     MIPS 处理器总线的最好替代者。

           目前,HyperTransport 主要承担“显卡与CPU”以及“南桥I/O 设备与CPU”之间的数据
     传输任务。也就是说,HyperTransport            的主要竞争对手是英特尔的 FSB2 ,与之相比,
     HyperTransport  的性价比优势是明显的,在提供同等带宽的情况下,HyperTransport  的管
     脚数目少得多,这非常有利于降低电路板上的布线复杂度。

          我们看到,HyperTransport 主要是应用于AMD  的芯片组中,而且,在HT 阵营中,
     越来越多的厂家已经推出基于AMD、K8 处理器的芯片组,像威盛公司的K8T890 芯片组,
     SIS 公司的SIS755 芯片组,NVDIA  的nForce3 250 系列,ATI 的Radeon Xpress 200 等。
     同时,在多处理器互连方面,AMD                   的处理器以及许多的 MIPS              处理器都采用
     HyperTransport 作为总线连接。同时,在上述众多桥片中还大多支持PCI Express 的插槽,
     能够很好地实现从HyperTransport 到PCI Express 的转换。

4      已经取得技术成果

          在工程领域,我们2006 年开始研究高速总线,已经取得了初步进展。在近两年的时
     间中先后加工了三个芯片,分别是2006 年采用0.18umCMOS 工艺流片I/O  电路,锁相环
     电路,测试结果表明锁相环的工作频率可以达到1.6GHz,周期到周期抖动小于30ps。I/O
     PAD  电路数据传输速率达到1.6Gb/s,板上传输距离超过20 厘米。

          2007 年 8 月份采用了ST micro 公司的65nm CMOS 工艺的设计技术,完成了HT1.0
     以及HT2.0 低版本的测试芯片的设计,锁相环时钟工作频率可以达到2GHz,目前芯片正
     处于封装测试阶段。在学术领域,我们也取得了一定的进展,并在国际会议以及学报级
     期刊上发表了六篇文章。

参考文献:  

       【1】   Jim   Choate   et   al.   MAC-PHY   Interface   Connector   for   the   TM   PCI   Express   Architecture.   Intel
               coporation.2005

       【2】   AdvancedSwitching   Special   Interest   Group.   PCI   Express   Advanced   Switching   Specication,   Draft
               1.0. www.asi-sig.org,Sept.2003

       【3】   Don Anderson, Jay Trodden. Hypertransport system architecture. Mindshare Inc. 2003

作者简介:   

张 锋:  博士,中国科学院计算技术研究所微处理器中心全定制组
看来龙芯3和龙芯SOC采用HT作为前端总线已成定局!!!
原帖由 175799022 于 2008-10-12 17:11 发表
看来龙芯3和龙芯SOC采用HT作为前端总线已成定局!!!


没的选择吧

1,不可能自己搞
2,不可能用INTEL的技术
龙3也有PCI-E
1       2
     前端总线:PCI  、FSB (Intel)、  HyperTransport         (AMD );

其他的懒得看,看到这行就笑翻了
菜到家了
intel前面怎么也应该是AGTL、CSI之类的啊
]]
这是论文?
从几本普及读物里摘出来的东西......这家伙到底是干什么的?
原帖由 spinup 于 2008-10-12 18:40 发表
这是论文?
从几本普及读物里摘出来的东西......这家伙到底是干什么的?


就是啊,翻翻微型计算机或大众硬件之类的杂志就可以写出的东西...
废话
你想从论文里看到什么。关键是实现了几个基于HyperTransport 总线系统的芯片。不错,有点实际成果。
原帖由 始于绝望的希望 于 2008-10-13 12:00 发表


就是啊,翻翻微型计算机或大众硬件之类的杂志就可以写出的东西...


=======这只是其中的一部分!!!;P
龙芯对LIUNX2.67.27的支持已经完成!!!!

加入了动态变频等支持:victory: :victory:
原帖由 175799022 于 2008-10-14 02:19 发表
龙芯对LIUNX2.67.27的支持已经完成!!!!

加入了动态变频等支持:victory: :victory:


晕,侬家linux都出到2.67.27了??:L :L :L
是2.6.27
我见过是pdf文档,你哪儿找到的文字版。