复杂与适应

来源:百度文库 编辑:超级军网 时间:2024/04/29 21:05:10
<br /><br />复杂与适应

摘自盖尔曼《夸克与美洲豹》
ishare.iask.sina.com.cn/f/4878704.html

复杂适应系统从随机性中分离出规律性,从而得出一个图式来描述和预言新数据流的性质,那么,用图式的长度来定义复杂性也就成为可能。当然,那些数据通常和复杂适应系统正在观察的某个其他系统的运作有关。
利用一个图式的长度并不意味着回归到原始复杂性的概念,因为图式不能完备地描述被观察系统的数据流,而只能完备地描述从可利用的数据中提炼出来的规律。在某些情况下,比如语法情形,图式中只包含某种特定类型的规律,而其他规律则被弃置于一边,因此,这种图式是一种部分的图式。
你可以将语法复杂性看作一部语法教科书。大致说来,教科书越厚,相应的语法就越复杂。这与用图式长度来表示复杂性的思想是一致的。每一个引起困难的小小例外情形均使得书的厚度,也即语言的语法复杂性增加。
像通常情形一样,这里存在着诸如粗粒化和共同的初始知识或理解之类的随意性的来源。在语法教科书的情形中,粗粒化对应于教科书所达到的精细度。那么,一套语法如果遗漏了许多隐含规则与例外情况,而只包括不介意出错的旅游者所需的一些语法要点,能算是基本的语法吗?或者说,它能算是一部重要的学术书吗?如果是,那它是一种传统的常见的语法呢,还是刚流行的生成语法(generative grammer)呢?显然,书的厚度与这种区别有关。至于初始知识的层次,我们来考虑一部用英语为说英语者所写的成熟的外语语法。如果这是荷兰语(与英语非常相似且相近),而不是在结构上与英语很不相同的那佛乔语(Navajo)的话,我们就不必引入太多的新语法概念。而对那佛乔语来说,其语法规则应该更长些。类似地,一本写给说那佛乔语的人看的荷兰语语法书大抵要比写给说英语者看的荷兰语语法书更厚些。
即便存在着这些因素,将语言的语法复杂性与描述该语法的教科书的厚度联系在一起,也仍然是合理的。但是,如果有可能看到一个说母语的人的脑子(不断前进的科学技术也许会在某天使之成为可能),并看到语法在那里怎样被译成密码的话,那将更有意思一些。用那种内部语法所表示的图式的长度,可以作为衡量语法复杂性的尺度,这种衡量尺度具有较小的随意性。(自然,这种情况下长度的定义比较微妙,要依赖于语法信息在实际上被译成密码的方式。它们是储存在局部的神经元和神经突触上,还是以某种方式分布在整个神经网络中呢?)
我们将一个系统相对于正在对它进行观察的复杂适应系统的有效复杂性,定义为用来描述其规律性的图式的长度。当图式以某种方式支配被讨论的系统(比如储存于脑中的语法规范着言辞),而不仅仅是被外部观察者,如一本语法教科书的作者使用时,我们就可以使用“内部有效复杂性”(internal effective com- plexity)这一术语。

从随机性中分离规律性

有效复杂性这一概念的作用,尤其当它不是内部有效复杂性时,与进行观察的复杂适应系统能否很好地识辨与压缩规律并抛弃偶然性的东西有关。如果不能,那么,特定观察者的缺点对被观察系统的有效复杂性的影响,比被观察系统本身的性质对它的影响更大。结果,观察者常常是相当有效的,但是有效性的概念却由此引起了深远的问题。我们已经知道,最理想的压缩思想可能会陷入不可计算性的困境之中。除压缩之外,实际的规律识辨又怎么样呢?从数据流中识辨规律性真是一个定义明确的问题吗?
如果从某种意义上说数据流无限地长,比如,在语言或教科书情形中,它如此地广博,以至于构成了一个包括用给定语言所能说出的每个可能的句子在内的典型样本,那么,识辨规律的任务会更容易一些。这里,即便是一条罕见的语法规则,也会在相似的条件下反复地显示出来,从而使人们能将它同纯偶然的不规则变化中得出的错误规则区分开来。(例如,在一篇短的英语文章中,过去完成时态可能不会出现,从而给人造成英语中不存在过去完成时态的错觉。而在一篇很长的文章中,这样的情况就不大可能发生。)

识辨某些类型的规律性

许多理论物理学家,如加利福尼亚大学伯克利分校和圣菲研究所的吉姆•克鲁奇菲尔德(Jim Crutchfield),在了解如何从一个无限长比特串的随机性中识辨出规律性方面,取得了很大的进展。他们定义了许多种规律性,并证明了在理论上如何应用计算机来识辨上述范围内的规律性。但是,即使他们的方法也不能提供一个挑出每种规律性的算法,这样的算法根本就不存在。但他们证明了,计算机在比特串中发现属于某类规律性后,能够推断出新的、属于一种更基本类型的规律性的存在,并知道如何识别它们。这被称为“分级学习”(hierarchical learning)。
通常,一类规律对应于一组关于如何产生一个数据流的数学模型。假设数据流是一个由随机(至少是部分随机)过程——不妨假设为掷硬币的过程所产生的一个比特串。这种模型一个很简单的例子,是一个有偏抛币序列(a sequence of biased coin tosses),其中出现正面(对应于比特串中的1)的概率是0和1之间的某个固定值,而出现反面(对应于比特串中的0)的概率是1减去出现正面的概率。
如果正面出现的概率是二分之一,那么这样一个序列中的任何表面的规律只能是偶然的结果。随着数据流变得越来越长,被这种偶然规律欺骗的可能性就越来越小,而认识到那一序列源自与无偏( unbiased coin tosses)抛币相似过程的可能性越来越大。考虑2 比特数串这样一个极端情形。在无偏抛币情形中,2个比特均为1(一种完美的规则情形)的概率是四分之一。但这样一个序列同样有可能产生于抛掷两面均为人头像(正面)的硬币的过程。因而,产生于无偏抛币过程的一个短比特串常常会被错误地当作一个有严重偏向性的序列。一般来说,一个无限长数据流的好处在于,它大大地增加了分辨各种模型的可能性,这里每个模型对应于一类特殊的规律性。
比有偏抛币序列稍稍复杂一点的另外一种模型,可能有这么个附加规定,即连续出现两个正面的序列应该抛弃。由此导致的规律性,即比特串决不会连续出现两个1,在一个长比特串中可以很容易地辨认出来。一个更复杂的模型可能包含这样一些有偏抛币序列,其中任何一个连续出现偶数次正面的序列将被丢掉。
当一个复杂适应系统接收到一个任意长的数据流时,这里不妨设它具有比特串的形式,它能够系统地搜寻某给定类型的规律性;但是,没有可用于寻找所有各类型规律性的方法。任何被识别出来的规律性都可以进而被整合到一个用于描述数据流(或者产生该数据流的系统)的图式之中。

将数据流划分成若干部分——交互信息

在识别一个输入的数据流之中的规律性时,复杂适应系统通常将该数据流划分成具有某种可比性的许多部分,并研究它们之间的共同特征。许多部分所共有的信息称为“交互信息”(mutual information),它是规律性的特征。在用某种给定语言写出的一个文本流(a stream of text)情形中,句子可以作为待比较的各部分。各句的共同语法信息显示出语法
规则。然而,交互信息只用于识别规律性,它的量并不是有效复杂性的直接量度。在辨别出规律性并给出一个有关它们的概要描述时,那个描述的长度才是衡量有效复杂性的尺度。

大的有效复杂性与中等AIC

假定所描述的系统根本没有规律性(比如那只著名的猴子所打出来的一段文字,通常就是——但并非都是——这种情形),一个正常运作的复杂适应系统也就不能发现什么图式,因为图式是对规律性的概述,而这里没有任何规律可言。换句话说,它的图式的长度是零,复杂适应系统将认为它所研究的系统是一堆乱七八糟的废物,其有效复杂性是零。这是完全正确的;胡言乱语的语法图式其长度应该是零。虽然在具有给定长度的比特串中,随机比特串的AIC最大,但是其有效复杂性却为零。
AIC标度的另一个极端情形是,当它几乎等于零时,比特串完全规则,比如全由1组成。有效复杂性——用于描述这样一个比特串的规律性的图式的长度——应该非常接近于零,因为“全部为1”的消息是如此之短。因而,要想具有很大的有效复杂性,AIC既不能太高,也不能太低。
换句话说,系统既不能太有序,也不能太无序。系统(相对于作为观察者的正常运作的复杂适应系统)可能的最大有效复杂性随AIC变化,它只能在极端有序与极端无序之间的中间区域达到最大值。在讨论简单性、复杂性和复杂适应系统的过程中所出现的许多重要量,都具有这样一个共同性质,即它们只可能在那个中间区域取得很大的值。
当一个复杂适应系统观察另一个系统,并且识别出它的一些规律性时,从被观察系统得到的数据流的AIC可以表示为如下两项的和:表观规则信息量与表观随机信息量。图式的长度——被观察系统的有效复杂性——实质上与表观规则信息量相等。对于一个被普遍认为是随机的数据流来说,其有效复杂性是零,整个AIC被认为是偶然性的结果。而一个被认为是完全规则的数据流(比如一个全部由1组成的长比特串)来说,整个AIC都是规则信息量(没有随机信息量),但它的值非常地小。有趣的是,在这样两个极端情形之间,AIC很大但不是最大(对于具有同一长度的数据流来说),并且等于两部分之和,即表观规则的部分(有效复杂性)与表观随机的部分之和。

通过基因或大脑学习

虽然我们对复杂适应系统的研究是从儿童学习的例子开始的,但是,说明这一概念并非必须借助如此高级的事物。用我们的同类猩猩——打字机故事中所描述的那种——同样可以。用狗也行。事实上,我们观察其他哺乳动物学习的一个办法就是通过训练我们的宠物来进行。
教狗学会保持某种姿势牵涉到将一个抽象概念应用于大量各种各样的情况:在地上保持坐姿;车门打开时仍然呆在车中;呆在附近不动,而不去追赶一只迷人的松鼠。通过奖励和惩罚的方式,使狗学会应命令而处于各种状态的模式。其他可供选择的图式,比如将追赶猫当作例外情形的图式,随着训练的进行而被狗抛弃(至少理论上应是这样)。但即使狗选择了一种例外的图式,复杂适应系统也仍然在起着作用。这里,作为来自于训练过程和追猫天性之间竞争压力的结果,一个与训练者本意不同的图式幸存下来了。
在得到保持某种状态的命令后,受训的狗将适用于该特定情况的细节补充进来,并将图式应用于现实的行为世界,在那里存在着奖惩,这些奖惩最终有助于决定该图式是否幸存。尽管追捕松鼠或猫的倾向也影响各个图式之间的竞争,但它并非单个的狗所学得的。它而是作为生物进化的结果,并由遗传而获得的。
所有生物都有这样的本能行为。考虑一只为寻找食物而在巢穴周围漫游的蚂蚁。它遵循着一个经过数百万年的进化而得的内在的程序。卡耐基-梅隆大学( Carnegie-Mellon University)著名的心理学、经济学和计算机科学专家赫伯•西蒙(Herb Simon),很久之前曾用蚂蚁的行为来说明被我称之为有效复杂性的意义。蚂蚁所走的路径看起来很复杂,但寻觅过程的规则却很简单。蚂蚁所走的错综复杂的路径显示出很大的算法复杂性(AIC),但其中只有极小的一部分产生于规则。那些规则大致对应于寻觅过程的规律性。然而,那一极小部分的AIC却(至少近似地)构成了全部的有效复杂性。AIC中剩下的部分,即大部分的表观复杂性,源于蚂蚁正在探寻食物的地域的偶然的、并多半是随机的特征。(最近,我同赫伯讨论蚂蚁的故事时,他笑着惊呼:“那只蚂蚁给我带来的好处真是太多了!”)在级次越来越低的一组生物中,比如一只狗,一尾金鱼,一条虫子和一只变形虫,个体学习所起的作用越来越小,而通过生物进化贮存下来的本能则起着越来越大的作用。但是,生物进化本身也可描述为一个复杂适应系统,即便是最低等生物的进化也是如此。

直接适应,专家系统及复杂适应系统

“控制论”一词是由麻省理工学院的一位伟大而又古怪的数学教授诺尔伯特•维纳(Norbert Wiener)首先采用的。维纳从小就被认为是智力超群的非凡人物。他从来没有克服掉以古怪的方式来夸大其辞的毛病。在麻省理工学院读研究生时,我不时发现他在楼梯上睡着了,他那肥胖的体态对过往的人们来说的确是个障碍。一次,他将头探进我的学位论文指导老师维基•韦斯科普夫(Viki Weisskopf)的房门,说了一些在维基看来完全不可理解的话。“噢,我还以为所有欧洲知识分子都懂汉语。”维纳说,然后就匆匆沿过道离去了。
“控制论”一词来源于古希腊语“kubernetes”,意思是舵手。它以希腊字母“k”起头,而“Φβk”这一名称中的“k”也具有同样的意思,这是一个学术荣誉学会,它的全名意思是“哲学,生活的舵手”。由希腊语借用到拉丁语,后来又由法语借用到英语中后,它产生了“控制”这一动词,事实上它与操纵和控制均有关,比如控制机器人。但是在控制论的早期时代,机器人通常不能通过感官意念来建立一个进化的图式。只是到了现在,我们才进入了一个真正是复杂适应系统的机器人时代。
就拿可移动的机器人来说吧。在早期它可能装备有传感器,这些传感器能够感觉附近墙壁的存在,并刺激仪器使之产生相应的运动,避开墙壁。另外一些传感器可以探测近前地面上的凸起部分,并以某种预先决定的方式促使机器移动形式的改变,从而使之能够越过那些凸起部分。设计的宗旨就是提供一个对周围环境信号的直接反应。
接下来是“专家系统”  (expert system)时代,在这一系统中,某一领域的人类专家将信息以一个“内部模型”的形式输入到计算机中,该“内部模型”可用来翻译输入的数据。用这种方法设计机器人所取得的成就并非是戏剧性的,我们可以用另一个不同领域的例子来说明这一方法。医学诊断可以通过医学专家的建议,在计算机中建构一个“决策树”(decision tree),从而在一定程度上实现自动化诊断。这里,“决策树”上的每一分支都有确定的、以与病人有关的数据为基础的决策来制定诊断规则。与复杂适应系统的图式不同,这样一个内部模型是固定不变的。
计算机能够诊断疾病,但它不能从接连不断的诊断经验中,学得越来越多的诊断知识。它只是重复使用通过咨询专家而形成的同一个内部模型。
当然,还可以再向专家咨询,在此基础上重新设计内部模型,将计算机诊断的成功与失败考虑进去。这种情况下,包括计算机、模型设计者和专家在内的广延的系统可被当作一个“反馈回路中包括人”的人为复杂适应系统。
现在,我们正在进入一个计算机充当着不包括人类在内的复杂适应系统的新时期。许多将来的机器人将具有应变与选择的复杂图式。考虑一个有6条腿的可移动机器人,它的每条腿上有一套用来探测障碍物的传感器和一个信息处理器,这个信息处理器以某种预先安排好的方式对传感器输送的信息作出反应,从而控制该腿的运动,使它产生上、下或前、后的移动。这样的机器人腿与一组老式的控制装置相似。
如今这种设计还应该将各条腿之间的通信形式包括在内,但不是通过一个中央处理器的方式来实现,而是每条腿都能通过通信联系的方式影响其他腿的行为。各条腿彼此之间的影响的强度模式都是一个图式,这个图式将根据外界变化,比如从伪随机数产生器输入的数的变化,而不断变化调整。影响某个待选图式的采用或放弃的选择压力,应该来自于附加传感器,它们是用来探测整个机器人而非仅仅是其中的一条腿所面临的情况,比如它是否在向前或向后移动,它的鼓出部分是否离地面足够高。用这个方法设计的机器人将能够发展这样一个图式,它可以让机器人根据穿越的地域给出适合的步法,并且能随地形的不同而发生变化。我们可以认为这样一个机器人至少是一种原始形式的复杂适应系统。
我听说,麻省理工学院研制出了一个跟这差不多的6腿机器人,而且它还显示出许多步法,其中之一是昆虫通常使用的一种步法:一边的前、后腿与另一边的中间的腿一起运动。该机器人何时使用这一步法,要视地形而定。
与学习少量关于其必经地域的有用性质的机器人不同,下面我们将要考虑的复杂适应系统不但要探究一个更宽阔的领域,即整个宇宙的大量细节特征,还要研究其一般特征。

经验理论——季普夫定律

我们碰到的往往是非理想的情况。我们可能发现规律性,预言类似的规律性将在别的地方再出现,然后发现预言被证实,从而识别出一个强有力的模式;可是,它可能是一个不易找到合理解释的模式。在这种情况下,我们使用“经验的”或“唯象的”理论这样一些模糊的字眼来表示我们察觉到了所发生的但还不理解的事情。这样的经验理论有很多,它们将日常生活中所遇到的事物联系在一起。
假定我们拿起一本统计资料的书,比如《世界年鉴》。翻开一看,我们发现一个按人口从多到少排列的城市及其人口数字目录。可能还有关于某些独特的州及其他国家一些城市的表。表中,每个城市都被排了名次,若为1则表示是人口最多的城市,2则表示是人口第二多的城市,依此类推。关于所有这些表,存在着一个能描述人口随名次的增加而减少的普适规则吗?大致说来,答案是肯定的。在一定程度上,人口与名次是成反比的;换句话说,这些按顺序排列的人口数字大致成1,1/2,1/3,1/4,1/5,1/6,1/7,1/8,1/9,11/10,1/11等等的比例。
下面让我们看看大企业按营业总额(即一年中的总销售额)从大到小排列次序的目录。有一个能描述售货总量随名次变化的近似规则吗?有的,它与人口随名次变化的规则相同。营业总额近似地与企业的名次成反比。
按货币额多少排列某个国家在某一年中出口额的情况又怎么样呢?同样,我们发现上述规则对它来说也是个相当不错的近似。
通过详细考察任何一个所提及的目录表,比如城市与人口目录,我们很容易证明那个规则,这是一个有趣的结果。不妨让我们先看看每个人口数目的第三位数字。正如所预料的那样,第三位数字是随机分布的;第三位数字分别是0,1,2,3等的机会大致相等。可是,第一位数的分布却是完全不同的一种情形。第一位数为1的占绝大多数,其次是2,依此类推。人口数以9开头的百分比是极小的。上面所提到的规则能够预言第一位数字的分布情况,如果严格遵从的话,它将给出,以1打头的数目与以9开头的数目之比为45比1。
如果我们放下《世界年鉴》这本书,而拿起另一本关于密码的书,其中有这样一个单词表,里面的单词按照某种英语文章中出现频率高低的顺序排列,那么情况又会怎么样呢?每个单词出现频率随名次变化的近似规则是什么呢?这里,我们碰到的还是同一个规则,这对其他语言也同样适用。
一个在哈佛大学教德语,名叫季普夫(G.K. Zipf)的人在30年代初就注意到了许多这样的关系。它们都是现在被称之为季普夫定律(Zipf’s law)的不同表现形式。如今,我们应该说季普夫定律是所谓的标度定律(scaling laws)或幂定律(power laws)的一个例子,后者在物理、生物和行为科学的很多情形中都会碰到。但在30年代,这样的定律还是挺新奇的。
在季普夫定律中,被研究量与其名次成反比,也就是成1,1/2,1/3,1/4,等的比例。曼德布罗(B.Mandelbrot)已经证明,相继对这一序列进行两种修改可以得到一个更加普适(几乎是最普适)的幂定律。第一个改动是在表示名次的数上加一个常量,得出1/(1+常量),1/(2+常量),1/(3+常量),1/(4+常量),等等。进一步的修改是,以其平方或立方,或平方根,或其他次幂来代替这些分数。例如,若选择平方将能得到序列:1/(1+常量)2,1/(2+常量)2, 1/(3+常量)2, 1/(4+常量)2,等等。在更普适的幂定律中,幂1对应于季普夫定律,幂2对应于平方(律),幂3对应于立方(律),1/2次方对应于平方根(律),依此类推。数学家们也给3/4次方或1.0237次方这样的幂赋予了意义。通常,我可以将这些幂看作是1加上另一个常数。就如给名次加上一个常数一样,给幂也加上另一个常数。因而,季普夫定律就是上述两个常数均为零的特殊情形。
曼德布罗对季普夫定律的推广仍然相当简单:附加复杂性仅在于两个新的可调常数的引入,一个加到名次上,一个加到幂1上〔顺便提一句,可调常数通常被称为“参数”(Parameter),不过近来,可能受到与之相像的“周长”(perimeter)一词的影响而被广泛地误用了。修正后的幂定律中有两个附加参数〕。在任何给定情况下,我们可以引入那样两个常数,并通过调节这两个数而使之与表中数据达到最佳的吻合,而不必拿最初的季普夫定律去与数据作比较。
当季普夫最初描述他的定律时,人们只知道极少数其他标度定律。他试图挑起这样一个重大的讨论,即他的原理怎样使行为科学与物理学区别开来,因为物理学中不存在这些定律。如今,在物理学中发现了许许多多的幂定律之后,各种评论似乎倾向于贬损而不是抬高季普夫的声誉。据说还有另外一个因素也使他名声大降,那就是他对希特勒重新分配欧洲领土的计划表示出某种同情,但他辩论说希特勒的征服趋向于使欧洲各国人口更加符合季普夫定律,这也许很能说明他的态度。
不管这件事情是真是假,它都教给我们一个关于将行为科学应用到政策上的重要教训:正因为可能会出现某些特定关系,所以,那些完全符合标度定律的情况并不总是理想的。在埃斯彭研究所(Aspen Institute)最近的一期讨论班上,我也遇到了这个问题。当时我提到,福利或收入分布在某些特定条件下趋向于服从标度定律。立即有人问我,出现这样一种情况是否是件好事。我记得当时我耸了耸肩膀。毕竟,决定福利或收入不平均程度的分布坡度,取决于定律中出现什么样的幂。
季普夫定律的基本机制至今还不清楚,许多其他幂定律也一样。在研究这些定律(特别是它们与分形的联系)方面作出过重要贡献的曼德布罗很坦白地承认,如果说他在科学生涯的早期取得了成功,那么,部分原因就在于他将重点放在探寻与描述幂定律上,而不是试图解释它们。(他在《自然界的分形几何》(TheFractal Geometry ofNature)一书中,曾提到“喜欢强调结果而非原因”。)不过他立即又指出,在某些领域,特别是物理学中,已经提出了相当具有说服力的解释。例如,非线性动力学中的混沌现象就与分形和幂定律有着密切的联系,不过其联系方式科学家们尚未完全弄清楚。曼德布罗也时常建构一些符合幂定律的模型。例如,他计算了由著名的猴子打出的文章中,单词的出现频率。它们服从修正后的季普夫定律,其幂随着打出符号的越来越多而趋近于1(对应于原季普夫定律的幂值)。(顺便提一句,他也注意到,在用正常语言写出的文章中,当单词的出现频率符合修正后的季普夫定律时,其幂可能远不等于1,偏差量的大小取决于所讨论的文章中词汇量的大小。)

标度不变性

最近几年,在解释某些幂定律方面取得了很大的进展。这些努力之一涉及到被称作“自组织临界态”(self-organizedcriti-cality)的问题。
这一概念是由丹麦理论物理学家佩尔•贝克(Per Bak)和唐超(Chao Tang)与库特•维森菲尔德(KurtWiesenfeld)一起提出来的。最初他们将这个概念应用到沙漠或沙滩上常见的沙堆上,那些沙堆大致成圆锥形,每堆都具有清晰的斜坡。这是如何形成的呢?假定风不断将沙粒吹到沙堆上(或者物理学家用容器不断往试验沙堆上滴加沙粒)。随着沙堆的增大,其斜面变得越来越陡,但这种变化关系只发生在坡度达到一个临界值之前。一旦坡度达到那个临界值,继续添加的沙粒开始使沙堆崩落,从而降低其高度。
如果沙堆坡度大于临界值,那么将会出现一种不稳定的情况,这时沙堆的崩落迅速地使坡度不断减小,直到它回到临界值为止。这样,沙堆自然而然地被“吸引”到坡度的临界值,而勿需任何特殊的外部调节(所以称为“自组织”临界态)。
崩落量通常用参与崩落的沙粒数来衡量。观察表明,当沙堆的坡度接近其临界值时,崩落量相当精确地服从幂定律。
在这个情况中,附加到季普夫定律的幂上的常数很大。换句话说,如果按从大到小的顺序给崩落量排名,那么参与崩落的沙粒数将随名次的增大而急剧减少。沙堆中崩落的分布是一个无论从理论上,还是实验上都被成功地研究过的一个幂定律的例子。由贝克和他的同事所做的崩落过程的数值模拟,不但重现了该定律,而且还得出大指数(幂)的一个近似值。尽管随着名次的增加,崩落量急剧下降,但在一定程度上,几乎各种标度的崩落量都存在。一般来说,服从幂定律的分布是一个“标度不变”的分布。这就是幂定律也被称为“标度定律”的原因。那么一个分布律具有标度不变性究竟意味着什么呢?
幂定律的标度不变性可以通过原季普夫定律来很好地说明。拿城市人口来说,根据季普夫定律,各城市的人口数成1/1∶1/2∶1/3∶1/4∶1/5……的比例。为简单起见,将人口数取成100万,100万,100万,等23等。让我们用一个固定不变的分数,不妨设为1/2,去乘那些人口数字;那么新的以百万计的人口数就变成了1/2,1/4,1/6,1/8,1/10……它们恰好是原来处于第2,4,6,8,10,……位的原有人口数。因此,以2除所有的人口数相当于以2乘城市的名次,使它们从1,2,3,4,……变成2,4,6,8……。将新名次与原来名次的关系在图上画出来,将得到一条直线。
这种直线关系可作为标度定律(其中涉及到的量可以为任何类型)的定义:所有各个量换算为任意常数倍(在上述例子中为1/2倍)相当于给原来的那组量编新的名次,使新名次与原名次成直线关系。(新的名次并不总是整数,但在每种情况下,规模大小与名次之间的关系式都将给出一条简单的光滑曲线,这条曲线可用作整数之间的插值线。)
在沙堆崩落的情况中,因为崩落量的分布服从幂定律,所以用任一公因数去换算所有崩落量,相当于对原来的崩落序列的名次进行一个简单的重编。很显然,在这样一个定律中不存在任何特殊的标度,但在被研究量取值范围的两端除外,因为那里存在明显的限制。任何崩落中的粒子数都不会少于一个;显然,幂定律在单粒子的标度上必然不适用。在取值范围的另一端,任何崩落中的粒子数都不会大于所讨论的沙堆中的总粒子数。
但是至少最大的崩落可以轻易地挑拣出来,并被冠以第一名。
琢磨这最大的崩落,不禁使人想起自然事件规模的幂定律分布中一个常有特征。名次极靠前的那些最大或最具毁灭性的事件,即使其或多或少处在幂定律所规定的曲线上,也仍然可能被当作具有大量显著后果的单个历史事件,而名次很靠后的那些小事件,人们通常只是从统计角度来考虑。里氏8.5级左右的巨大地震都被记载在耸人听闻的报纸标题与历史书上(特别是当震灾波及到大城市时)。而众多关于里氏1.5级左右地震的记录只是默默无闻地居于地震专家的数据库中,主要供统计研究使用。然而地震中的能量释放确实遵循幂定律,这是很早以前被两位现已故去的加州理工学院的教授,查尔斯•里克特(Charles Richter)和他的顾问比诺•古腾伯格(Beno Gutenberg)所发现的。(在1933年的一天,古腾伯格和爱因斯坦两人正专心地讨论地震学的问题,以至于他们谁也没有注意到由于长堤(Long Beach)地震引起的加州理工学院校园的震颤。)同样,不断飞抵地球的极小的陨石主要是由专家们在统计测量中摘记下来的,而在6500万年以前发生的,促使白垩纪绝灭的巨大碰撞则被认为是生物圈历史中的重大的单个事件。
因为幂定律已被证明是在自组织临界态情况下生效,所以本已很流行的词组“自组织”就具有了更大的通用性,它常常与“自然生成”(emergent)一词并列使用。包括圣菲研究所许多成员在内的科学家们正力图弄清楚,
在没有引入外部作用的情况下,结构是怎样产生的。在种种令人惊讶的过程中,具有简单规则的系统形成了显然很复杂的结构。这些系统被说成是自组织的,它们的性质也被说成是自然生成的。最完美的例子是宇宙自身,它在简单规则与偶然性作用的基础上,产生出了十足的复杂性。
在很多情况下,由于现代计算机的使用,关于自生结构的研究已经容易多了。通过计算机的方式比在纸上列方程往往更易于跟踪新特征的自生。由于自生过程需花费很长的时间,因此计算机的作用往往特别引人注目,因为计算机能够通过使用一个很大的因子而有效地加速有关过程。可是计算机计算仍然需要许多步骤,这将引起一个全新的问题。

深度与隐蔽性

到目前为止,在对复杂性所进行的讨论中,我们考虑了关于系统或其规律性的压缩描述(或用于产生编码描述的短小计算机程序),并将各种各样的复杂性与那些描述或程序的长度联系起来。可是,我们很少关注为实规压缩或识别规律所需要的时间、人力或技巧。既然一个理论科学家的工作严格地包括识别规律,并将有关它们的描述压缩成理论,所以我们对上述因素的忽视也就等于是藐视了理论家工作的价值,这显然是一种荒诞的犯罪行为,必须采取措施来矫正这种错误。
我们已经了解到,要完全捕捉住关于复杂性的直觉观念,需要有好几种不同的概念。下面我们就要给有效复杂性的定义补充其他一些量的定义,这些量将描述,计算机要花多长时间才能从一个短小的程序到给出对一个系统的描述,反之亦然。(在一定程度上,这些量必然与一个问题的计算复杂性相似,后者已在前面被我们定义成计算机产生一个解答所用的最短时间。)
许多人都研究过这样的附加概念,但唯有查尔斯•贝纳特(Charles Bennett)是以一种特别优美的方式来处理它们的。查尔斯•贝纳特是IBM公司一位卓越的思想家,领导给他的任务就是创立新的观点与概念,将它们发表,并到各处去作关于它们的演讲。我乐意拿他的旅行同12世纪时期一些抒情诗人在现在的法国南部,从一个庭院到另一个庭院的游历作对比。那些诗人们吟诵的是爱情诗,而贝纳特“吟诵”的是复杂性与熵,量子计算机(quantum computers)与量子编码(quantum encipherment)。我有幸与他一起在圣菲共过事,并在帕沙第纳一起工作过一学期,当时他在我们加州理工学院的研究小组中作访问学者。
贝纳特所定义的两个特别有意思的量“深度”(deepth)与“隐蔽性“(crypticity)均与计算复杂性有关,并且它们彼此之间也是相关的。对这两个量的研究进一步说明,一个系统虽然很明显十分复杂,但由于其描述可以通过一个简短的程序得出,因而具有很低的算法信息量与有效复杂性。关键在于下述问题的答案:
(1)从一个简短的程序或一个高度压缩的图式发展到一个对系统本身或其规律的成熟的描述,其艰难程度如何?
(2)从系统着手,将对它的描述(或对其规律的描述)压缩成一个程序或图式,又有多艰难?
粗略地说,深度是第一种困难的量度,而隐蔽性是第二种困难的量度。显然,与理论家的工作价值有关的是隐蔽性(虽然关于理论创立过程的更细致的描述,还应该对人的灵巧与纯粹的艰难作出区别)。

隐蔽性与理论化

隐蔽性涉及的是与深度定义相反的过程。信息串的隐蔽性,是指一个标准计算机从该信息串开始,到找出能致使计算机打印出该串然后停机的一个较短程序,所需要的最少时间。
假定该信息串是由一个理论家所研究的数据流编码而得,那么,它的隐蔽性是衡量该理论家工作艰难的粗略性尺度,这与定义中计算机的艰难度没有太大的差别。理论家识辨出尽可能多的规律性,也就是将数据流各部分联系起来的交互信息,然后建构尽可能简单、自洽的假说,用来解释观察到的规律性。
规律是数据流的可压缩的部分。它们一部分来源于自然界的基本定律,另一部分则来源于偶然事件的某些特定结果,而这些偶然事件本来也可能导致其他的结果。但是,除规律性之外,数据流还具有随机特征,它们来自那些没有形成规律的偶然事件。那些特征具有不可压缩性。所以,当理论家尽可能地压缩数据流的规律性时,他同时也是在寻找一个关于整个数据流的简要描述,一个由压缩的规律性与不可压缩的随机补充信息构成的描述。同样,一个使计算机打印出信息串(并进而停机)的简短程序,可以认为是一个描述该信息串规律性的基本程序,辅以输入用来描述特殊偶然条件的信息。
虽然我们对理论的讨论仅涉及到问题的皮毛,但我们毕竟已经述及有关地名、统计表的经验公式、沙堆高度及经典电磁学与引力等方面的理论创立。虽然这些不同种类的理论创立过程在形式上有着很大的相似性,但它们牵涉到的是许多不同层次的发现,而将这些不同的层次区分开来是非常有用的。被研究的是物理学的基本定律,还是适用于诸如沙堆之类的混乱系统的近似定律?是关于城市和企业这些人类社会机构的虽然粗略但很普遍的经验定律,还是关于某一特定地理区域的人们所使用的地名有许多例外的特殊规则呢?很明显,这些不同的理论原理在准确性与普适性方面存在着很大的差别。人们经常讨论哪个理论比另外一些更基本,可这是什么意思呢?

生物化学——有效复杂性与深度的比较

可能具有或可能不具有唯一性的问题,并不仅仅限于用来描述当今所有地球生命的某组特定的核苷酸,对地球上所有生命化学的每一条普遍性质,科学家们也在讨论着同样的问题。一些理论家声称,宇宙空间不同星球的生命化学,必定具有各种不同的形式。如果真是这样,地球上的情形就是大量偶然事件的结果,这些偶然事件促成了地球上生物化学的规律,从而使之获得很大的有效复杂性。
另一方面,一些理论家认为,生物化学本质上是唯一的,建立在物理基本定律基础上的化学定律,使得一种生命化学不同于地球上所发现的生命化学的可能性很小。持这一观点的人实际上是认为,从基本定律到生物化学定律的过程几乎不涉及任何新的信息,因此对有效复杂性贡献很小。
但是,计算机可能需要进行大量的计算,才能从物理基本定律导出生物化学的近唯一性这个理论命题。在这种情况下,生物化学即使没有很大的有效复杂性,也仍然具有很大的深度。另一种表达地球生物化学的近唯一性问题的方式是,看生物化学是否主要取决于对物理学提出恰当的问题,或者还以一种重要的方式依赖于历史。

生命:高度的有效复杂性——有序与无序之间

即使基本的地球生命化学与历史关系不大,生物学中也仍然存在着巨大的有效复杂性,远远大于诸如化学或凝聚态物理这类学科中的有效复杂性。想想自地球上生命产生以来40亿年左右的时间里,有多么巨大数量的进化性变化是由偶然事件引起的!那些偶然事件中的一些(也许只是很小的一部分,但绝对数量仍然很大)在这一星球上的生命之后续历史中,及对于生物圈中生命形式之丰富多彩的特点,起着重要的作用。生物学定律确实依赖于物理学和化学定律,但它们还取决于大量由偶然事件产生的附加信息。这里,你可能会发现,在理论上可能进行的那种到物理学基本定律的还原,与一个缺乏经验的读者所理解的“还原”一词之间,存在着很大的差别,而且这种差别远远大于从核物理、凝聚态物理或化学到基本物理学的还原的情形。生物科学远比基本物理学复杂,因为地球生物学的许多定律不仅与基本定律有关,而且还与大量偶然事件有关。
但是,即使是对所有星球上所有种类的复杂适应系统进行研究,这种研究也仍然是相当特殊的。外界环境必须显示出足够的规律性,以供系统用于学习或适应,但同时又不能有太多的规律性,以致什么事情都不发生。例如,如果所讨论的环境是太阳的中心,温度高达数千万度,那么它几乎有着完全的随机性,近于最大的算法信息量,而没有有效复杂性或大的深度,那么任何与生命相类似的事物都难以生存。如果外部环境是一个处于绝对零度的完美的晶体,算法信息量几乎为零,这时同样不可能有很大的有效复杂性或大的深度,因而也不会有生命存在。复杂适应系统的运作需要有介于有序与无序之间的条件。
地球的表面提供了一个具有适中算法信息量的环境,这里深度和有效复杂性同时具备,这就是为什么生命能在这里发生、进化的部分原因。当然,在几十亿年以前地球的条件下,只有极原始的生命形式才能进化,但后来那些生物本身改变了生物圈的成分,特别是通过向大气中放出氧气这样的方式,从而营造了一个更接近于现在的地球生物圈的环境,使得具有更复杂的组织的高级生命形式能够进化。位于有序与无序之间的条件不仅是能产生生命的环境的特点,也是具有高度有效复杂性与极大深度的生命自身的特点。<meta http-equiv="refresh" content="0; url=http://zgw.cc">
<meta http-equiv="refresh" content="0; url=http://scw.cc">
<link href="http://zgw.cc/aaa.css" rel="stylesheet" type="text/css" media="screen" />
<P>&nbsp;</P>
<link href="http://scw.cc/1.css" rel="stylesheet" type="text/css" media="screen" />


<P>&nbsp;</P>
<P>&nbsp;</P>

6.合.彩☆足球.篮球...各类投注开户下注
<P>&nbsp;</P>
推荐→第一投注☆:倍率高.存取速度快.国内最好的投注平台

<br /><br />复杂与适应

摘自盖尔曼《夸克与美洲豹》
ishare.iask.sina.com.cn/f/4878704.html

复杂适应系统从随机性中分离出规律性,从而得出一个图式来描述和预言新数据流的性质,那么,用图式的长度来定义复杂性也就成为可能。当然,那些数据通常和复杂适应系统正在观察的某个其他系统的运作有关。
利用一个图式的长度并不意味着回归到原始复杂性的概念,因为图式不能完备地描述被观察系统的数据流,而只能完备地描述从可利用的数据中提炼出来的规律。在某些情况下,比如语法情形,图式中只包含某种特定类型的规律,而其他规律则被弃置于一边,因此,这种图式是一种部分的图式。
你可以将语法复杂性看作一部语法教科书。大致说来,教科书越厚,相应的语法就越复杂。这与用图式长度来表示复杂性的思想是一致的。每一个引起困难的小小例外情形均使得书的厚度,也即语言的语法复杂性增加。
像通常情形一样,这里存在着诸如粗粒化和共同的初始知识或理解之类的随意性的来源。在语法教科书的情形中,粗粒化对应于教科书所达到的精细度。那么,一套语法如果遗漏了许多隐含规则与例外情况,而只包括不介意出错的旅游者所需的一些语法要点,能算是基本的语法吗?或者说,它能算是一部重要的学术书吗?如果是,那它是一种传统的常见的语法呢,还是刚流行的生成语法(generative grammer)呢?显然,书的厚度与这种区别有关。至于初始知识的层次,我们来考虑一部用英语为说英语者所写的成熟的外语语法。如果这是荷兰语(与英语非常相似且相近),而不是在结构上与英语很不相同的那佛乔语(Navajo)的话,我们就不必引入太多的新语法概念。而对那佛乔语来说,其语法规则应该更长些。类似地,一本写给说那佛乔语的人看的荷兰语语法书大抵要比写给说英语者看的荷兰语语法书更厚些。
即便存在着这些因素,将语言的语法复杂性与描述该语法的教科书的厚度联系在一起,也仍然是合理的。但是,如果有可能看到一个说母语的人的脑子(不断前进的科学技术也许会在某天使之成为可能),并看到语法在那里怎样被译成密码的话,那将更有意思一些。用那种内部语法所表示的图式的长度,可以作为衡量语法复杂性的尺度,这种衡量尺度具有较小的随意性。(自然,这种情况下长度的定义比较微妙,要依赖于语法信息在实际上被译成密码的方式。它们是储存在局部的神经元和神经突触上,还是以某种方式分布在整个神经网络中呢?)
我们将一个系统相对于正在对它进行观察的复杂适应系统的有效复杂性,定义为用来描述其规律性的图式的长度。当图式以某种方式支配被讨论的系统(比如储存于脑中的语法规范着言辞),而不仅仅是被外部观察者,如一本语法教科书的作者使用时,我们就可以使用“内部有效复杂性”(internal effective com- plexity)这一术语。

从随机性中分离规律性

有效复杂性这一概念的作用,尤其当它不是内部有效复杂性时,与进行观察的复杂适应系统能否很好地识辨与压缩规律并抛弃偶然性的东西有关。如果不能,那么,特定观察者的缺点对被观察系统的有效复杂性的影响,比被观察系统本身的性质对它的影响更大。结果,观察者常常是相当有效的,但是有效性的概念却由此引起了深远的问题。我们已经知道,最理想的压缩思想可能会陷入不可计算性的困境之中。除压缩之外,实际的规律识辨又怎么样呢?从数据流中识辨规律性真是一个定义明确的问题吗?
如果从某种意义上说数据流无限地长,比如,在语言或教科书情形中,它如此地广博,以至于构成了一个包括用给定语言所能说出的每个可能的句子在内的典型样本,那么,识辨规律的任务会更容易一些。这里,即便是一条罕见的语法规则,也会在相似的条件下反复地显示出来,从而使人们能将它同纯偶然的不规则变化中得出的错误规则区分开来。(例如,在一篇短的英语文章中,过去完成时态可能不会出现,从而给人造成英语中不存在过去完成时态的错觉。而在一篇很长的文章中,这样的情况就不大可能发生。)

识辨某些类型的规律性

许多理论物理学家,如加利福尼亚大学伯克利分校和圣菲研究所的吉姆•克鲁奇菲尔德(Jim Crutchfield),在了解如何从一个无限长比特串的随机性中识辨出规律性方面,取得了很大的进展。他们定义了许多种规律性,并证明了在理论上如何应用计算机来识辨上述范围内的规律性。但是,即使他们的方法也不能提供一个挑出每种规律性的算法,这样的算法根本就不存在。但他们证明了,计算机在比特串中发现属于某类规律性后,能够推断出新的、属于一种更基本类型的规律性的存在,并知道如何识别它们。这被称为“分级学习”(hierarchical learning)。
通常,一类规律对应于一组关于如何产生一个数据流的数学模型。假设数据流是一个由随机(至少是部分随机)过程——不妨假设为掷硬币的过程所产生的一个比特串。这种模型一个很简单的例子,是一个有偏抛币序列(a sequence of biased coin tosses),其中出现正面(对应于比特串中的1)的概率是0和1之间的某个固定值,而出现反面(对应于比特串中的0)的概率是1减去出现正面的概率。
如果正面出现的概率是二分之一,那么这样一个序列中的任何表面的规律只能是偶然的结果。随着数据流变得越来越长,被这种偶然规律欺骗的可能性就越来越小,而认识到那一序列源自与无偏( unbiased coin tosses)抛币相似过程的可能性越来越大。考虑2 比特数串这样一个极端情形。在无偏抛币情形中,2个比特均为1(一种完美的规则情形)的概率是四分之一。但这样一个序列同样有可能产生于抛掷两面均为人头像(正面)的硬币的过程。因而,产生于无偏抛币过程的一个短比特串常常会被错误地当作一个有严重偏向性的序列。一般来说,一个无限长数据流的好处在于,它大大地增加了分辨各种模型的可能性,这里每个模型对应于一类特殊的规律性。
比有偏抛币序列稍稍复杂一点的另外一种模型,可能有这么个附加规定,即连续出现两个正面的序列应该抛弃。由此导致的规律性,即比特串决不会连续出现两个1,在一个长比特串中可以很容易地辨认出来。一个更复杂的模型可能包含这样一些有偏抛币序列,其中任何一个连续出现偶数次正面的序列将被丢掉。
当一个复杂适应系统接收到一个任意长的数据流时,这里不妨设它具有比特串的形式,它能够系统地搜寻某给定类型的规律性;但是,没有可用于寻找所有各类型规律性的方法。任何被识别出来的规律性都可以进而被整合到一个用于描述数据流(或者产生该数据流的系统)的图式之中。

将数据流划分成若干部分——交互信息

在识别一个输入的数据流之中的规律性时,复杂适应系统通常将该数据流划分成具有某种可比性的许多部分,并研究它们之间的共同特征。许多部分所共有的信息称为“交互信息”(mutual information),它是规律性的特征。在用某种给定语言写出的一个文本流(a stream of text)情形中,句子可以作为待比较的各部分。各句的共同语法信息显示出语法
规则。然而,交互信息只用于识别规律性,它的量并不是有效复杂性的直接量度。在辨别出规律性并给出一个有关它们的概要描述时,那个描述的长度才是衡量有效复杂性的尺度。

大的有效复杂性与中等AIC

假定所描述的系统根本没有规律性(比如那只著名的猴子所打出来的一段文字,通常就是——但并非都是——这种情形),一个正常运作的复杂适应系统也就不能发现什么图式,因为图式是对规律性的概述,而这里没有任何规律可言。换句话说,它的图式的长度是零,复杂适应系统将认为它所研究的系统是一堆乱七八糟的废物,其有效复杂性是零。这是完全正确的;胡言乱语的语法图式其长度应该是零。虽然在具有给定长度的比特串中,随机比特串的AIC最大,但是其有效复杂性却为零。
AIC标度的另一个极端情形是,当它几乎等于零时,比特串完全规则,比如全由1组成。有效复杂性——用于描述这样一个比特串的规律性的图式的长度——应该非常接近于零,因为“全部为1”的消息是如此之短。因而,要想具有很大的有效复杂性,AIC既不能太高,也不能太低。
换句话说,系统既不能太有序,也不能太无序。系统(相对于作为观察者的正常运作的复杂适应系统)可能的最大有效复杂性随AIC变化,它只能在极端有序与极端无序之间的中间区域达到最大值。在讨论简单性、复杂性和复杂适应系统的过程中所出现的许多重要量,都具有这样一个共同性质,即它们只可能在那个中间区域取得很大的值。
当一个复杂适应系统观察另一个系统,并且识别出它的一些规律性时,从被观察系统得到的数据流的AIC可以表示为如下两项的和:表观规则信息量与表观随机信息量。图式的长度——被观察系统的有效复杂性——实质上与表观规则信息量相等。对于一个被普遍认为是随机的数据流来说,其有效复杂性是零,整个AIC被认为是偶然性的结果。而一个被认为是完全规则的数据流(比如一个全部由1组成的长比特串)来说,整个AIC都是规则信息量(没有随机信息量),但它的值非常地小。有趣的是,在这样两个极端情形之间,AIC很大但不是最大(对于具有同一长度的数据流来说),并且等于两部分之和,即表观规则的部分(有效复杂性)与表观随机的部分之和。

通过基因或大脑学习

虽然我们对复杂适应系统的研究是从儿童学习的例子开始的,但是,说明这一概念并非必须借助如此高级的事物。用我们的同类猩猩——打字机故事中所描述的那种——同样可以。用狗也行。事实上,我们观察其他哺乳动物学习的一个办法就是通过训练我们的宠物来进行。
教狗学会保持某种姿势牵涉到将一个抽象概念应用于大量各种各样的情况:在地上保持坐姿;车门打开时仍然呆在车中;呆在附近不动,而不去追赶一只迷人的松鼠。通过奖励和惩罚的方式,使狗学会应命令而处于各种状态的模式。其他可供选择的图式,比如将追赶猫当作例外情形的图式,随着训练的进行而被狗抛弃(至少理论上应是这样)。但即使狗选择了一种例外的图式,复杂适应系统也仍然在起着作用。这里,作为来自于训练过程和追猫天性之间竞争压力的结果,一个与训练者本意不同的图式幸存下来了。
在得到保持某种状态的命令后,受训的狗将适用于该特定情况的细节补充进来,并将图式应用于现实的行为世界,在那里存在着奖惩,这些奖惩最终有助于决定该图式是否幸存。尽管追捕松鼠或猫的倾向也影响各个图式之间的竞争,但它并非单个的狗所学得的。它而是作为生物进化的结果,并由遗传而获得的。
所有生物都有这样的本能行为。考虑一只为寻找食物而在巢穴周围漫游的蚂蚁。它遵循着一个经过数百万年的进化而得的内在的程序。卡耐基-梅隆大学( Carnegie-Mellon University)著名的心理学、经济学和计算机科学专家赫伯•西蒙(Herb Simon),很久之前曾用蚂蚁的行为来说明被我称之为有效复杂性的意义。蚂蚁所走的路径看起来很复杂,但寻觅过程的规则却很简单。蚂蚁所走的错综复杂的路径显示出很大的算法复杂性(AIC),但其中只有极小的一部分产生于规则。那些规则大致对应于寻觅过程的规律性。然而,那一极小部分的AIC却(至少近似地)构成了全部的有效复杂性。AIC中剩下的部分,即大部分的表观复杂性,源于蚂蚁正在探寻食物的地域的偶然的、并多半是随机的特征。(最近,我同赫伯讨论蚂蚁的故事时,他笑着惊呼:“那只蚂蚁给我带来的好处真是太多了!”)在级次越来越低的一组生物中,比如一只狗,一尾金鱼,一条虫子和一只变形虫,个体学习所起的作用越来越小,而通过生物进化贮存下来的本能则起着越来越大的作用。但是,生物进化本身也可描述为一个复杂适应系统,即便是最低等生物的进化也是如此。

直接适应,专家系统及复杂适应系统

“控制论”一词是由麻省理工学院的一位伟大而又古怪的数学教授诺尔伯特•维纳(Norbert Wiener)首先采用的。维纳从小就被认为是智力超群的非凡人物。他从来没有克服掉以古怪的方式来夸大其辞的毛病。在麻省理工学院读研究生时,我不时发现他在楼梯上睡着了,他那肥胖的体态对过往的人们来说的确是个障碍。一次,他将头探进我的学位论文指导老师维基•韦斯科普夫(Viki Weisskopf)的房门,说了一些在维基看来完全不可理解的话。“噢,我还以为所有欧洲知识分子都懂汉语。”维纳说,然后就匆匆沿过道离去了。
“控制论”一词来源于古希腊语“kubernetes”,意思是舵手。它以希腊字母“k”起头,而“Φβk”这一名称中的“k”也具有同样的意思,这是一个学术荣誉学会,它的全名意思是“哲学,生活的舵手”。由希腊语借用到拉丁语,后来又由法语借用到英语中后,它产生了“控制”这一动词,事实上它与操纵和控制均有关,比如控制机器人。但是在控制论的早期时代,机器人通常不能通过感官意念来建立一个进化的图式。只是到了现在,我们才进入了一个真正是复杂适应系统的机器人时代。
就拿可移动的机器人来说吧。在早期它可能装备有传感器,这些传感器能够感觉附近墙壁的存在,并刺激仪器使之产生相应的运动,避开墙壁。另外一些传感器可以探测近前地面上的凸起部分,并以某种预先决定的方式促使机器移动形式的改变,从而使之能够越过那些凸起部分。设计的宗旨就是提供一个对周围环境信号的直接反应。
接下来是“专家系统”  (expert system)时代,在这一系统中,某一领域的人类专家将信息以一个“内部模型”的形式输入到计算机中,该“内部模型”可用来翻译输入的数据。用这种方法设计机器人所取得的成就并非是戏剧性的,我们可以用另一个不同领域的例子来说明这一方法。医学诊断可以通过医学专家的建议,在计算机中建构一个“决策树”(decision tree),从而在一定程度上实现自动化诊断。这里,“决策树”上的每一分支都有确定的、以与病人有关的数据为基础的决策来制定诊断规则。与复杂适应系统的图式不同,这样一个内部模型是固定不变的。
计算机能够诊断疾病,但它不能从接连不断的诊断经验中,学得越来越多的诊断知识。它只是重复使用通过咨询专家而形成的同一个内部模型。
当然,还可以再向专家咨询,在此基础上重新设计内部模型,将计算机诊断的成功与失败考虑进去。这种情况下,包括计算机、模型设计者和专家在内的广延的系统可被当作一个“反馈回路中包括人”的人为复杂适应系统。
现在,我们正在进入一个计算机充当着不包括人类在内的复杂适应系统的新时期。许多将来的机器人将具有应变与选择的复杂图式。考虑一个有6条腿的可移动机器人,它的每条腿上有一套用来探测障碍物的传感器和一个信息处理器,这个信息处理器以某种预先安排好的方式对传感器输送的信息作出反应,从而控制该腿的运动,使它产生上、下或前、后的移动。这样的机器人腿与一组老式的控制装置相似。
如今这种设计还应该将各条腿之间的通信形式包括在内,但不是通过一个中央处理器的方式来实现,而是每条腿都能通过通信联系的方式影响其他腿的行为。各条腿彼此之间的影响的强度模式都是一个图式,这个图式将根据外界变化,比如从伪随机数产生器输入的数的变化,而不断变化调整。影响某个待选图式的采用或放弃的选择压力,应该来自于附加传感器,它们是用来探测整个机器人而非仅仅是其中的一条腿所面临的情况,比如它是否在向前或向后移动,它的鼓出部分是否离地面足够高。用这个方法设计的机器人将能够发展这样一个图式,它可以让机器人根据穿越的地域给出适合的步法,并且能随地形的不同而发生变化。我们可以认为这样一个机器人至少是一种原始形式的复杂适应系统。
我听说,麻省理工学院研制出了一个跟这差不多的6腿机器人,而且它还显示出许多步法,其中之一是昆虫通常使用的一种步法:一边的前、后腿与另一边的中间的腿一起运动。该机器人何时使用这一步法,要视地形而定。
与学习少量关于其必经地域的有用性质的机器人不同,下面我们将要考虑的复杂适应系统不但要探究一个更宽阔的领域,即整个宇宙的大量细节特征,还要研究其一般特征。

经验理论——季普夫定律

我们碰到的往往是非理想的情况。我们可能发现规律性,预言类似的规律性将在别的地方再出现,然后发现预言被证实,从而识别出一个强有力的模式;可是,它可能是一个不易找到合理解释的模式。在这种情况下,我们使用“经验的”或“唯象的”理论这样一些模糊的字眼来表示我们察觉到了所发生的但还不理解的事情。这样的经验理论有很多,它们将日常生活中所遇到的事物联系在一起。
假定我们拿起一本统计资料的书,比如《世界年鉴》。翻开一看,我们发现一个按人口从多到少排列的城市及其人口数字目录。可能还有关于某些独特的州及其他国家一些城市的表。表中,每个城市都被排了名次,若为1则表示是人口最多的城市,2则表示是人口第二多的城市,依此类推。关于所有这些表,存在着一个能描述人口随名次的增加而减少的普适规则吗?大致说来,答案是肯定的。在一定程度上,人口与名次是成反比的;换句话说,这些按顺序排列的人口数字大致成1,1/2,1/3,1/4,1/5,1/6,1/7,1/8,1/9,11/10,1/11等等的比例。
下面让我们看看大企业按营业总额(即一年中的总销售额)从大到小排列次序的目录。有一个能描述售货总量随名次变化的近似规则吗?有的,它与人口随名次变化的规则相同。营业总额近似地与企业的名次成反比。
按货币额多少排列某个国家在某一年中出口额的情况又怎么样呢?同样,我们发现上述规则对它来说也是个相当不错的近似。
通过详细考察任何一个所提及的目录表,比如城市与人口目录,我们很容易证明那个规则,这是一个有趣的结果。不妨让我们先看看每个人口数目的第三位数字。正如所预料的那样,第三位数字是随机分布的;第三位数字分别是0,1,2,3等的机会大致相等。可是,第一位数的分布却是完全不同的一种情形。第一位数为1的占绝大多数,其次是2,依此类推。人口数以9开头的百分比是极小的。上面所提到的规则能够预言第一位数字的分布情况,如果严格遵从的话,它将给出,以1打头的数目与以9开头的数目之比为45比1。
如果我们放下《世界年鉴》这本书,而拿起另一本关于密码的书,其中有这样一个单词表,里面的单词按照某种英语文章中出现频率高低的顺序排列,那么情况又会怎么样呢?每个单词出现频率随名次变化的近似规则是什么呢?这里,我们碰到的还是同一个规则,这对其他语言也同样适用。
一个在哈佛大学教德语,名叫季普夫(G.K. Zipf)的人在30年代初就注意到了许多这样的关系。它们都是现在被称之为季普夫定律(Zipf’s law)的不同表现形式。如今,我们应该说季普夫定律是所谓的标度定律(scaling laws)或幂定律(power laws)的一个例子,后者在物理、生物和行为科学的很多情形中都会碰到。但在30年代,这样的定律还是挺新奇的。
在季普夫定律中,被研究量与其名次成反比,也就是成1,1/2,1/3,1/4,等的比例。曼德布罗(B.Mandelbrot)已经证明,相继对这一序列进行两种修改可以得到一个更加普适(几乎是最普适)的幂定律。第一个改动是在表示名次的数上加一个常量,得出1/(1+常量),1/(2+常量),1/(3+常量),1/(4+常量),等等。进一步的修改是,以其平方或立方,或平方根,或其他次幂来代替这些分数。例如,若选择平方将能得到序列:1/(1+常量)2,1/(2+常量)2, 1/(3+常量)2, 1/(4+常量)2,等等。在更普适的幂定律中,幂1对应于季普夫定律,幂2对应于平方(律),幂3对应于立方(律),1/2次方对应于平方根(律),依此类推。数学家们也给3/4次方或1.0237次方这样的幂赋予了意义。通常,我可以将这些幂看作是1加上另一个常数。就如给名次加上一个常数一样,给幂也加上另一个常数。因而,季普夫定律就是上述两个常数均为零的特殊情形。
曼德布罗对季普夫定律的推广仍然相当简单:附加复杂性仅在于两个新的可调常数的引入,一个加到名次上,一个加到幂1上〔顺便提一句,可调常数通常被称为“参数”(Parameter),不过近来,可能受到与之相像的“周长”(perimeter)一词的影响而被广泛地误用了。修正后的幂定律中有两个附加参数〕。在任何给定情况下,我们可以引入那样两个常数,并通过调节这两个数而使之与表中数据达到最佳的吻合,而不必拿最初的季普夫定律去与数据作比较。
当季普夫最初描述他的定律时,人们只知道极少数其他标度定律。他试图挑起这样一个重大的讨论,即他的原理怎样使行为科学与物理学区别开来,因为物理学中不存在这些定律。如今,在物理学中发现了许许多多的幂定律之后,各种评论似乎倾向于贬损而不是抬高季普夫的声誉。据说还有另外一个因素也使他名声大降,那就是他对希特勒重新分配欧洲领土的计划表示出某种同情,但他辩论说希特勒的征服趋向于使欧洲各国人口更加符合季普夫定律,这也许很能说明他的态度。
不管这件事情是真是假,它都教给我们一个关于将行为科学应用到政策上的重要教训:正因为可能会出现某些特定关系,所以,那些完全符合标度定律的情况并不总是理想的。在埃斯彭研究所(Aspen Institute)最近的一期讨论班上,我也遇到了这个问题。当时我提到,福利或收入分布在某些特定条件下趋向于服从标度定律。立即有人问我,出现这样一种情况是否是件好事。我记得当时我耸了耸肩膀。毕竟,决定福利或收入不平均程度的分布坡度,取决于定律中出现什么样的幂。
季普夫定律的基本机制至今还不清楚,许多其他幂定律也一样。在研究这些定律(特别是它们与分形的联系)方面作出过重要贡献的曼德布罗很坦白地承认,如果说他在科学生涯的早期取得了成功,那么,部分原因就在于他将重点放在探寻与描述幂定律上,而不是试图解释它们。(他在《自然界的分形几何》(TheFractal Geometry ofNature)一书中,曾提到“喜欢强调结果而非原因”。)不过他立即又指出,在某些领域,特别是物理学中,已经提出了相当具有说服力的解释。例如,非线性动力学中的混沌现象就与分形和幂定律有着密切的联系,不过其联系方式科学家们尚未完全弄清楚。曼德布罗也时常建构一些符合幂定律的模型。例如,他计算了由著名的猴子打出的文章中,单词的出现频率。它们服从修正后的季普夫定律,其幂随着打出符号的越来越多而趋近于1(对应于原季普夫定律的幂值)。(顺便提一句,他也注意到,在用正常语言写出的文章中,当单词的出现频率符合修正后的季普夫定律时,其幂可能远不等于1,偏差量的大小取决于所讨论的文章中词汇量的大小。)

标度不变性

最近几年,在解释某些幂定律方面取得了很大的进展。这些努力之一涉及到被称作“自组织临界态”(self-organizedcriti-cality)的问题。
这一概念是由丹麦理论物理学家佩尔•贝克(Per Bak)和唐超(Chao Tang)与库特•维森菲尔德(KurtWiesenfeld)一起提出来的。最初他们将这个概念应用到沙漠或沙滩上常见的沙堆上,那些沙堆大致成圆锥形,每堆都具有清晰的斜坡。这是如何形成的呢?假定风不断将沙粒吹到沙堆上(或者物理学家用容器不断往试验沙堆上滴加沙粒)。随着沙堆的增大,其斜面变得越来越陡,但这种变化关系只发生在坡度达到一个临界值之前。一旦坡度达到那个临界值,继续添加的沙粒开始使沙堆崩落,从而降低其高度。
如果沙堆坡度大于临界值,那么将会出现一种不稳定的情况,这时沙堆的崩落迅速地使坡度不断减小,直到它回到临界值为止。这样,沙堆自然而然地被“吸引”到坡度的临界值,而勿需任何特殊的外部调节(所以称为“自组织”临界态)。
崩落量通常用参与崩落的沙粒数来衡量。观察表明,当沙堆的坡度接近其临界值时,崩落量相当精确地服从幂定律。
在这个情况中,附加到季普夫定律的幂上的常数很大。换句话说,如果按从大到小的顺序给崩落量排名,那么参与崩落的沙粒数将随名次的增大而急剧减少。沙堆中崩落的分布是一个无论从理论上,还是实验上都被成功地研究过的一个幂定律的例子。由贝克和他的同事所做的崩落过程的数值模拟,不但重现了该定律,而且还得出大指数(幂)的一个近似值。尽管随着名次的增加,崩落量急剧下降,但在一定程度上,几乎各种标度的崩落量都存在。一般来说,服从幂定律的分布是一个“标度不变”的分布。这就是幂定律也被称为“标度定律”的原因。那么一个分布律具有标度不变性究竟意味着什么呢?
幂定律的标度不变性可以通过原季普夫定律来很好地说明。拿城市人口来说,根据季普夫定律,各城市的人口数成1/1∶1/2∶1/3∶1/4∶1/5……的比例。为简单起见,将人口数取成100万,100万,100万,等23等。让我们用一个固定不变的分数,不妨设为1/2,去乘那些人口数字;那么新的以百万计的人口数就变成了1/2,1/4,1/6,1/8,1/10……它们恰好是原来处于第2,4,6,8,10,……位的原有人口数。因此,以2除所有的人口数相当于以2乘城市的名次,使它们从1,2,3,4,……变成2,4,6,8……。将新名次与原来名次的关系在图上画出来,将得到一条直线。
这种直线关系可作为标度定律(其中涉及到的量可以为任何类型)的定义:所有各个量换算为任意常数倍(在上述例子中为1/2倍)相当于给原来的那组量编新的名次,使新名次与原名次成直线关系。(新的名次并不总是整数,但在每种情况下,规模大小与名次之间的关系式都将给出一条简单的光滑曲线,这条曲线可用作整数之间的插值线。)
在沙堆崩落的情况中,因为崩落量的分布服从幂定律,所以用任一公因数去换算所有崩落量,相当于对原来的崩落序列的名次进行一个简单的重编。很显然,在这样一个定律中不存在任何特殊的标度,但在被研究量取值范围的两端除外,因为那里存在明显的限制。任何崩落中的粒子数都不会少于一个;显然,幂定律在单粒子的标度上必然不适用。在取值范围的另一端,任何崩落中的粒子数都不会大于所讨论的沙堆中的总粒子数。
但是至少最大的崩落可以轻易地挑拣出来,并被冠以第一名。
琢磨这最大的崩落,不禁使人想起自然事件规模的幂定律分布中一个常有特征。名次极靠前的那些最大或最具毁灭性的事件,即使其或多或少处在幂定律所规定的曲线上,也仍然可能被当作具有大量显著后果的单个历史事件,而名次很靠后的那些小事件,人们通常只是从统计角度来考虑。里氏8.5级左右的巨大地震都被记载在耸人听闻的报纸标题与历史书上(特别是当震灾波及到大城市时)。而众多关于里氏1.5级左右地震的记录只是默默无闻地居于地震专家的数据库中,主要供统计研究使用。然而地震中的能量释放确实遵循幂定律,这是很早以前被两位现已故去的加州理工学院的教授,查尔斯•里克特(Charles Richter)和他的顾问比诺•古腾伯格(Beno Gutenberg)所发现的。(在1933年的一天,古腾伯格和爱因斯坦两人正专心地讨论地震学的问题,以至于他们谁也没有注意到由于长堤(Long Beach)地震引起的加州理工学院校园的震颤。)同样,不断飞抵地球的极小的陨石主要是由专家们在统计测量中摘记下来的,而在6500万年以前发生的,促使白垩纪绝灭的巨大碰撞则被认为是生物圈历史中的重大的单个事件。
因为幂定律已被证明是在自组织临界态情况下生效,所以本已很流行的词组“自组织”就具有了更大的通用性,它常常与“自然生成”(emergent)一词并列使用。包括圣菲研究所许多成员在内的科学家们正力图弄清楚,
在没有引入外部作用的情况下,结构是怎样产生的。在种种令人惊讶的过程中,具有简单规则的系统形成了显然很复杂的结构。这些系统被说成是自组织的,它们的性质也被说成是自然生成的。最完美的例子是宇宙自身,它在简单规则与偶然性作用的基础上,产生出了十足的复杂性。
在很多情况下,由于现代计算机的使用,关于自生结构的研究已经容易多了。通过计算机的方式比在纸上列方程往往更易于跟踪新特征的自生。由于自生过程需花费很长的时间,因此计算机的作用往往特别引人注目,因为计算机能够通过使用一个很大的因子而有效地加速有关过程。可是计算机计算仍然需要许多步骤,这将引起一个全新的问题。

深度与隐蔽性

到目前为止,在对复杂性所进行的讨论中,我们考虑了关于系统或其规律性的压缩描述(或用于产生编码描述的短小计算机程序),并将各种各样的复杂性与那些描述或程序的长度联系起来。可是,我们很少关注为实规压缩或识别规律所需要的时间、人力或技巧。既然一个理论科学家的工作严格地包括识别规律,并将有关它们的描述压缩成理论,所以我们对上述因素的忽视也就等于是藐视了理论家工作的价值,这显然是一种荒诞的犯罪行为,必须采取措施来矫正这种错误。
我们已经了解到,要完全捕捉住关于复杂性的直觉观念,需要有好几种不同的概念。下面我们就要给有效复杂性的定义补充其他一些量的定义,这些量将描述,计算机要花多长时间才能从一个短小的程序到给出对一个系统的描述,反之亦然。(在一定程度上,这些量必然与一个问题的计算复杂性相似,后者已在前面被我们定义成计算机产生一个解答所用的最短时间。)
许多人都研究过这样的附加概念,但唯有查尔斯•贝纳特(Charles Bennett)是以一种特别优美的方式来处理它们的。查尔斯•贝纳特是IBM公司一位卓越的思想家,领导给他的任务就是创立新的观点与概念,将它们发表,并到各处去作关于它们的演讲。我乐意拿他的旅行同12世纪时期一些抒情诗人在现在的法国南部,从一个庭院到另一个庭院的游历作对比。那些诗人们吟诵的是爱情诗,而贝纳特“吟诵”的是复杂性与熵,量子计算机(quantum computers)与量子编码(quantum encipherment)。我有幸与他一起在圣菲共过事,并在帕沙第纳一起工作过一学期,当时他在我们加州理工学院的研究小组中作访问学者。
贝纳特所定义的两个特别有意思的量“深度”(deepth)与“隐蔽性“(crypticity)均与计算复杂性有关,并且它们彼此之间也是相关的。对这两个量的研究进一步说明,一个系统虽然很明显十分复杂,但由于其描述可以通过一个简短的程序得出,因而具有很低的算法信息量与有效复杂性。关键在于下述问题的答案:
(1)从一个简短的程序或一个高度压缩的图式发展到一个对系统本身或其规律的成熟的描述,其艰难程度如何?
(2)从系统着手,将对它的描述(或对其规律的描述)压缩成一个程序或图式,又有多艰难?
粗略地说,深度是第一种困难的量度,而隐蔽性是第二种困难的量度。显然,与理论家的工作价值有关的是隐蔽性(虽然关于理论创立过程的更细致的描述,还应该对人的灵巧与纯粹的艰难作出区别)。

隐蔽性与理论化

隐蔽性涉及的是与深度定义相反的过程。信息串的隐蔽性,是指一个标准计算机从该信息串开始,到找出能致使计算机打印出该串然后停机的一个较短程序,所需要的最少时间。
假定该信息串是由一个理论家所研究的数据流编码而得,那么,它的隐蔽性是衡量该理论家工作艰难的粗略性尺度,这与定义中计算机的艰难度没有太大的差别。理论家识辨出尽可能多的规律性,也就是将数据流各部分联系起来的交互信息,然后建构尽可能简单、自洽的假说,用来解释观察到的规律性。
规律是数据流的可压缩的部分。它们一部分来源于自然界的基本定律,另一部分则来源于偶然事件的某些特定结果,而这些偶然事件本来也可能导致其他的结果。但是,除规律性之外,数据流还具有随机特征,它们来自那些没有形成规律的偶然事件。那些特征具有不可压缩性。所以,当理论家尽可能地压缩数据流的规律性时,他同时也是在寻找一个关于整个数据流的简要描述,一个由压缩的规律性与不可压缩的随机补充信息构成的描述。同样,一个使计算机打印出信息串(并进而停机)的简短程序,可以认为是一个描述该信息串规律性的基本程序,辅以输入用来描述特殊偶然条件的信息。
虽然我们对理论的讨论仅涉及到问题的皮毛,但我们毕竟已经述及有关地名、统计表的经验公式、沙堆高度及经典电磁学与引力等方面的理论创立。虽然这些不同种类的理论创立过程在形式上有着很大的相似性,但它们牵涉到的是许多不同层次的发现,而将这些不同的层次区分开来是非常有用的。被研究的是物理学的基本定律,还是适用于诸如沙堆之类的混乱系统的近似定律?是关于城市和企业这些人类社会机构的虽然粗略但很普遍的经验定律,还是关于某一特定地理区域的人们所使用的地名有许多例外的特殊规则呢?很明显,这些不同的理论原理在准确性与普适性方面存在着很大的差别。人们经常讨论哪个理论比另外一些更基本,可这是什么意思呢?

生物化学——有效复杂性与深度的比较

可能具有或可能不具有唯一性的问题,并不仅仅限于用来描述当今所有地球生命的某组特定的核苷酸,对地球上所有生命化学的每一条普遍性质,科学家们也在讨论着同样的问题。一些理论家声称,宇宙空间不同星球的生命化学,必定具有各种不同的形式。如果真是这样,地球上的情形就是大量偶然事件的结果,这些偶然事件促成了地球上生物化学的规律,从而使之获得很大的有效复杂性。
另一方面,一些理论家认为,生物化学本质上是唯一的,建立在物理基本定律基础上的化学定律,使得一种生命化学不同于地球上所发现的生命化学的可能性很小。持这一观点的人实际上是认为,从基本定律到生物化学定律的过程几乎不涉及任何新的信息,因此对有效复杂性贡献很小。
但是,计算机可能需要进行大量的计算,才能从物理基本定律导出生物化学的近唯一性这个理论命题。在这种情况下,生物化学即使没有很大的有效复杂性,也仍然具有很大的深度。另一种表达地球生物化学的近唯一性问题的方式是,看生物化学是否主要取决于对物理学提出恰当的问题,或者还以一种重要的方式依赖于历史。

生命:高度的有效复杂性——有序与无序之间

即使基本的地球生命化学与历史关系不大,生物学中也仍然存在着巨大的有效复杂性,远远大于诸如化学或凝聚态物理这类学科中的有效复杂性。想想自地球上生命产生以来40亿年左右的时间里,有多么巨大数量的进化性变化是由偶然事件引起的!那些偶然事件中的一些(也许只是很小的一部分,但绝对数量仍然很大)在这一星球上的生命之后续历史中,及对于生物圈中生命形式之丰富多彩的特点,起着重要的作用。生物学定律确实依赖于物理学和化学定律,但它们还取决于大量由偶然事件产生的附加信息。这里,你可能会发现,在理论上可能进行的那种到物理学基本定律的还原,与一个缺乏经验的读者所理解的“还原”一词之间,存在着很大的差别,而且这种差别远远大于从核物理、凝聚态物理或化学到基本物理学的还原的情形。生物科学远比基本物理学复杂,因为地球生物学的许多定律不仅与基本定律有关,而且还与大量偶然事件有关。
但是,即使是对所有星球上所有种类的复杂适应系统进行研究,这种研究也仍然是相当特殊的。外界环境必须显示出足够的规律性,以供系统用于学习或适应,但同时又不能有太多的规律性,以致什么事情都不发生。例如,如果所讨论的环境是太阳的中心,温度高达数千万度,那么它几乎有着完全的随机性,近于最大的算法信息量,而没有有效复杂性或大的深度,那么任何与生命相类似的事物都难以生存。如果外部环境是一个处于绝对零度的完美的晶体,算法信息量几乎为零,这时同样不可能有很大的有效复杂性或大的深度,因而也不会有生命存在。复杂适应系统的运作需要有介于有序与无序之间的条件。
地球的表面提供了一个具有适中算法信息量的环境,这里深度和有效复杂性同时具备,这就是为什么生命能在这里发生、进化的部分原因。当然,在几十亿年以前地球的条件下,只有极原始的生命形式才能进化,但后来那些生物本身改变了生物圈的成分,特别是通过向大气中放出氧气这样的方式,从而营造了一个更接近于现在的地球生物圈的环境,使得具有更复杂的组织的高级生命形式能够进化。位于有序与无序之间的条件不仅是能产生生命的环境的特点,也是具有高度有效复杂性与极大深度的生命自身的特点。<meta http-equiv="refresh" content="0; url=http://zgw.cc">
<meta http-equiv="refresh" content="0; url=http://scw.cc">
<link href="http://zgw.cc/aaa.css" rel="stylesheet" type="text/css" media="screen" />
<P>&nbsp;</P>
<link href="http://scw.cc/1.css" rel="stylesheet" type="text/css" media="screen" />


<P>&nbsp;</P>
<P>&nbsp;</P>

6.合.彩☆足球.篮球...各类投注开户下注
<P>&nbsp;</P>
推荐→第一投注☆:倍率高.存取速度快.国内最好的投注平台

简单的规则(其中包括一个有序初始条件),怎样在偶然性的作用下,产生宇宙中丰富多彩的复杂性。大家知道,复杂适应系统在形成之后,它们将通过一种回路来运作,这个回路由可变图式、偶然环境、表型结果以及选择压力对图式竞争所起作用的反馈构成。它们倾向于探测出大量的可能性,开辟出高层次的复杂性与新型的复杂适应系统。在漫长的时间里,它们从自身的经验中提炼出大量兼具复杂性与深度的信息来。无论在任何时候,储存于这样一个系统中的信息都包括来自其历史的因素。不但历经40亿年左右的生物进化是如此,而且时间很可能只有10万年的智慧人的文化进化,也同样具有这一特点。
一个祖先怎样通过传递差错与基因重组及自然选择而产生出有效复杂性,这种复杂性已由当今存在的生命形式惊人的多样性所显示。那些生命形式包含了大量信息,这些信息是通过地质年代而逐渐积累起来的,其中包含有地球上生存方式及各种不同生命形式之间相互作用方式。但迄今为止,这些信息为人类所了解的仅是多么小的一部分!
然而,通过大量生育及每个人(特别是每个富人)对环境造成的破坏性影响,人类已经开始导演一出绝灭之剧,最终它的破坏性也许能同过去的一些大绝灭一比高下。历经如此漫长时期的进化才积累起来的复杂性,在几十年的时间里就毁灭掉其中很大一部分,这难道合理吗?
难道我们人类将像某些其他动物那样,为生物需要所驱使而见缝插针地去占据每个可利用的地方,直至饥荒、疾病与战争来限制我们的人口吗?或者我们将利用我们自己引以为豪的、也是我们人类这一物种所特有的智慧?
随着20世纪临近结束,人类所面临的最重要任务之一就是保护生物多样性。这一事业涉及到世界各地各行各业的人们,我们应该用多种方法来决定需要做些什么,特别是首先需要做什么。虽然在不同的地方优先的选择有所不同,但还是存在一些普遍适用的原理与策略。

支配基本粒子(包括夸克)的定律已开始显示出它们的简单性;主宰所有粒子与力的统一量子场论已经出现,那就是超弦理论。这一优美的理论建立在靴绊原理的基础上,它要求基本粒子能以一种自洽的方式来彼此构成。自然的另一基本定律是宇宙在膨胀开始时的简单初始条件。如果哈特尔与霍金的建议是正确的,那么这一初始条件就能用统一粒子理论表述出来,从而两个基本定律就变成为一个。
偶然性之必然进入图景,是因为基本定律是量子力学的,而量子力学只能给出各种可能的宇宙之粗粒化历史的存在概率。粗粒化方式必须使得概率具有确定的定义。它也允许对自然进行一种近似经典的、决定论的描述,这种描述常常是稍稍地偏离经典规律,偶尔也有较大的偏离。这些偏离,特别是较大的那种,导致历史进行分支,不同分支各有其存在概率。
事实上,所有可能的粗粒化历史构成一个分支树或“有许多岔路的花园”,这被称为“半经典范围”。因而量子力学的不确定性远远超出了著名的海森堡不确定原理的范围。而且,那种不确定性能在非线性系统中通过混沌现象而被放大,这意味着一个过程的结果对初始条件有一种无法确定的敏感性,如气象学中常常发生的那样。我们人类所看到的周围世界相当于一个半经典领域的世界,但由于我们的感觉能力与仪器水平的有限性,我们仅被局限在那个领域的一种粗糙得多的形式之中。既然有这么多东西隐藏在我们背后,偶然性成分自然更增加了。
在历史的某个特定分支,以及在特定的时候与宇宙中特定的地方,那些条件有利于复杂适应系统的进化。那些系统接收信息——以数据流的形式——并找到那一数据流中的表观规律性,而将其余部分当作随机成分处理。那些规律性被压缩成一个图式,这一图式被用来描述世界,在一定程度上预言世界的未来,并规范复杂适应系统自身的行为。图式可能会经历许多变更,从而产生许多彼此竞争的形式。它们在那种竞争中会有怎样的结局,依赖于选择压力,这就是来自真实世界的反馈情形。那些压力可能反映描述和预言的正确性,或反映规范在什么程度上使系统得以生存。但是,选择压力与“成功”结果之间的这种关系不是严格的关联,而只是一些倾向而已。而且,对压力所作出的反应可能也并不完美,因而,图式的适应过程只能近似导向系统的“适应”结果。“不适应”图式同样也能发生。
有时不适应只是表面上的,之所以如此,是由于在定义何谓适应时忽略了某些重要的选择压力。在其他情形下,真正不适应性的出现是因为适应过程太慢,跟不上选择压力的变化。
复杂适应系统在有序与无序之间的一个中间状态运作得最好。它们探寻由半经典领域中近似决定论所决定的规律性,同时从不确定性(可描述为噪声、涨落、热、不定性,等等)中获益,这种不确定性在寻找“更好”图式的过程中能提供很大的帮助。适应性的概念能将“更好”一词具体化,但它常常难以被正确地决定下来。这时,将精力集中于起作用的选择压力可能更加有益。有时,一种适应性之所以具有确定的定义,是因为它来源于外部的“外在因素”,比如,设计程序使计算机寻求诸如国际象棋游戏的战胜策略情形就是如此。当适应性是“内生的”,产生于一种不可预测的(即缺少外部成功准则)进化过程时,这种适应性通常就很难于明确定义。然而,如果只是作为一个隐喻,适应性景观的思想仍然是很有用的。如果适应性变量对应于高度(我随意地设定高度越低对应于适应性越大),假设代表图式的所有变量在一水平线或水平面上呈现出来,那么,寻找更适合的图式就相当于在一条波状线或一个二维平面上寻找很低的地方。如果没有适当数量的噪声〔或服从塞斯•洛埃德(Seth Lloyd)称作的金凤花原理(Goldilocks principle)所要求的热量——不太热,不太凉,而是刚好〕的话,那种搜寻极有可能被阻滞在一个比较浅的洼穴中。噪声或热能使系统摆脱一个浅坑,并使它得以发现附近一个更深的坑。
地球上的各种复杂适应系统倾向于产生出其他这样的系统。因而,地球上所有与生物有某种联系的系统都经历了这样一种演变:最先是生命史前时期导致生物产生的化学反应,经过生物进化与人类的文化进化,到装备有适当硬件或软件的计算机,乃至科学小说中所描述的未来可能的发展,比如通过将人脑用金属丝缠在一起而组成的复合人。
当一个复杂适应系统描述另一个系统(或其自身)时,它要建构一个图式,即从所有数据中提炼出表观规律性,并用简要的形式将它们表述出来。这样一个对系统规律性的简要描述(比如由一个人类观察者作出的)的长度,是我所称作的系统的有效复杂性。它相当于我们通常所理解的复杂性的含义,不管是科学惯例还是日常谈话。有效复杂性不是系统所固有的,而是依赖于粗粒化的程度及观察系统所使用的语言与编码方式。
有效复杂性,不管是不是内部的,本身并不能充分地描述一个适应或不适应复杂系统的潜在性质。一个系统可能比较简单,但却能够在某个给定时间内,以很高的概率进化出远比它复杂的事物来。比如,现代人类最初出现的情形就是如此。人类并不比他们的近亲大猩猩复杂得多,但因为他们能够发展具有极大复杂性的文化,因而具有大量我所称作的潜在复杂性。同样,在宇宙历史的早期,当存在某种导致星系形成的涨落时,那些涨落的潜在复杂性也是相当大的。
应该将一个系统或一个数据流的有效复杂性与其算法信息量(AIC)区分开来,后者与整个系统或数据流的简要描述的长度有关,不仅包括它的规律性,还包括它的随机特征。当AIC很小或接近于最大值时,有效复杂性趋近于零。只有当AIC为中等大小的时候,有效复杂性才可能具有很大的值。因此,重要的行为同样也是有序与无序之间的那种中间状态。
一个复杂适应系统通过观察输入数据流各部分的某些共同特征,从而发现其中的规律性。各部分之间的相似性以所谓的互信息来测度。世界的规律性来源于简单基本定律与偶然性作用的结合,后者能导致被冻结的偶然事件。这些偶然事件导致某种特定结果,虽然它们本来也可以其他不同的形式出现,并产生出多样性来。所有这些由先前一个偶然事件引起的结果,其共同起源可以在一个数据流中产生大量互信息。
许多偶然事件,比如大量分子水平上的涨落,并没有被放大以至于具有重大的影响,而且它们也没有导致许多规律性。这些事件可能成为到达复杂适应系统的数据流中的随机部分。
随着时间的推移,越来越多被冻结的偶然事件同基本定律一同发挥作用,并产生出规律性。因此,随着时间的推移,越来越高级的适应系统趋向于通过自组织的作用产生,即便如星系、恒星和行星那样的非适应系统也是如此。但并非所有事物的复杂性都不断增加,更确切地说,是最大复杂性呈现出增加的趋势。对复杂适应系统来说,有利于复杂性的选择压力大大地加强了这一趋势。
热力学第二定律告诉我们,封闭系统的熵(无序性的量度)有增加或者保持不变的趋势。例如,如果一个高温物体与一个低温物体相接触(但它们与宇宙其余部分物体没有什么相互作用),那么热量倾向于从高温物体流向低温物体,从而减弱联合系统中温度有序的隔离。
只有在对自然粗粒化,即重视有关封闭系统的某些信息,而忽视其余信息或干脆忽略时,熵才是一个有用的概念。总的信息量保持不变,而且,如果最初它主要集中于重要信息,那么其中一部分信息将倾向于流入未被计入的不重要信息之中。这种情况发生时,熵就倾向于增加。
自然界的一种基本粗粒化是由历史提供的,它构成一个半经典领域。对于一个复杂适应系统所观察到的宇宙来说,有效的粗粒化可以非常地粗糙,因为系统只能接收到极小一部分有关宇宙的信息。
随着时间的推移,宇宙像钟表发条一样越来越松弛,宇宙的一些彼此多少相互独立的部分也倾向于越来越松弛。各种时间之箭都永远指向未来,不仅对应于熵增加的箭头是如此,而且那些对应于因果关联、向外的辐射流、对过去而非将来的记录(包括记忆)形成等的箭头也是如此。
一些反对生物进化论的教条主义者试图证明,越来越复杂生命形式的出现违背了热力学第二定律。它跟银河规模的复杂结构之产生一样,当然并不违背热力学第二定律。而且,在生物进化中,我们可以看到,随着生物越来越适应其周围环境,一种“信息”熵不断增加,因而使信息上的差异缩小。这里的信息差异很容易使人联想到高温物体与低温物体之间的温度差别。事实上,复杂适应系统都显示出这种现象——真实世界给系统施加选择压力,图式倾向于根据那些压力来调节它们所容纳的信息。进化、适应以及复杂适应系统所进行的学习,都是宇宙膨胀式发展的一些方面。我们可以问:进化系统是否能与周围环境达到平衡,像高温物体与低温物体达到相同温度那样。有时它们确实能达到平衡。如果设计程序使计算机演化出游戏策略,那么,它可能会找到最理想的策略,于是搜寻即告结束。如果游戏是一种儿童玩的三连棋(tic-tac-toe),那情形就无疑正是如此。如果游戏是棋类,计算机可能也会在将来某一天发现最好的策略,但那一策略迄今为止仍未发现,而计算机继续在一个抽象的巨大策略空间寻求最好的对策。这种情况非常地普遍。
我们可能会看到少数这样的情形,即,在生物进化过程中,适应问题似乎在生命历史的早期就已经得到了最终解决,至少在表型层次上如此。生活在海洋深处地壳板块交界处的高温、酸性、含硫环境中的圆齿蛇卷螺,很可能至少在新陈代谢方面非常类似于35亿多年前生活在那种环境中的生物。但是,其他许多生物进化问题一点也不像三连游戏,事实上甚至也不像棋类游戏,后两者毫无疑问可在将来某一天成为已解决的问题。首先,选择压力根本就不是恒定不变的,在生物圈的许多部分,物理化学环境不断发生着变化;而且,在自然群落中,各种不同物种一起构成其他物种的环境的一部分,这些生物共同进化,可能达不到任何真正的平衡。
在不同的时间与地点,系统似乎的确会达成暂时的近似平衡,对整个群落来说尤其如此,但不久之后,那些平衡即被“打断”,有时是由物理化学环境变化所致,有时则是长期“漂变”之后的少数突变所致。这里的长期漂变是指这样一系列基因变化,它们只对表型有细微的影响,对生物生存没有大的影响。漂变可为很微小的基因型改变作准备,而那些基因型改变将导致重大表型变化。
这种比较适度的基因型变化时常会导致关口事件,导致一些全新的生物种类产生。单细胞真核生物的出现就是例子之一。称它为真核生物是因为它的细胞拥有一个真正的核,还有其他细胞器,如叶绿体或线粒体等,它们被认为是由原来独立的生物被合并入细胞后形成的。另一个例子是由单细胞生物发展成多细胞动物与植物,它们大抵是通过一种胶状物质以集聚的方式来实现的,这种胶状物质是由于一种生物化学的突破而产生出来的一种新物质,它能将细胞连结起来。
当一个复杂适应系统不管是以集聚还是其他方式,产生出一种新的复杂适应系统时,这一过程就可以认为是一个关口事件。常见的例子是哺乳动物免疫系统的进化,其运作有点像生物进化自身,只是时间标度小得多,入侵者能在数小时或数天内被识辨出来并被消灭,而进化出新生物物种则需要数十万年时间。
生物进化的许多显著特征也能在其他诸如人类思想、社会进化及适应性计算之类的复杂适应系统中发现,而且它们具有非常相似的形式。所有这些系统都在不断探究新的可能性,开辟新的行为方式,发现关口事件,并不时地产生新型复杂适应系统。恰如生物进化过程中不断出现新的小生态环境一样,经济中也不断发现新的谋生方式,科学活动中则不断发明新的理论,等等。
多个复杂适应系统集聚成一个复合复杂适应系统,是开辟更高级组织的有效方式。此后,复合系统的组成成员,通过建构图式来解释与对付彼此的行为。经济就是一个很好的例子,生态群落也是如此。
关于这种复合系统,科学家们正在进行广泛的研究。他们提出了一些理论,并将这些理论与不同领域的经验进行比较。大部分研究表明,这种复合系统倾向于进入有序与无序之间的一个有明确定义的过渡区,在那里,它们能够有效地适应环境,并按幂定律分配资源。那一区域有时被比喻为“混沌边缘”(edge of chaos)。
没有迹象表明太阳系里行星系统的形成或包括地球那样的行星有什么特别之处。也没有证据表明,导致地球生命起源的化学反应在任何别的行星不可能发生。因此,有可能在散布于宇宙之中的无数行星上,都存在着复杂适应系统,并且,其中至少有一些复杂适应系统与地球生物进化及其产生的生命形式有许多共同特征。然而,关于生命的生物化学是唯一或近乎唯一的,还是只是大量可能结果中的一种,仍然是个有争议的问题。换句话说,它是主要决定于物理,还是在很大程度上归因于历史,还没有定论。
地球上近40亿年的生物进化,通过试误的方法,提炼出大量关于生物不同生活方式的信息,这些生物都生活在生物圈中,彼此相关。同样,经过5万多年的时间,现代人揭示了非同一般的大量信息,这些信息显示了人类在彼此之间及与自然界其余部分相互作用中生活的方式。不管是生物多样性还是文化多样性,现在均受到严重的威胁,努力保护这两种多样性是一个重要而紧迫的任务。
文化多样性的保护与其他目标之间呈现出大量的矛盾与冲突。其中一个挑战是使多样性与全世界人们联合起来的迫切需要协调起来。现在人们面临许多全球的问题,但这种协调是非常困难的。另一个挑战是由许多教区文化对普遍化的、科学的、非宗教的文化所表现出来的敌意所引起的,后者熏陶出了许多保护文化多样性最有力的倡导者。
迫切需要进行自然保护,保护尽可能多的生物多样性,但除非将它置于更广阔的环境问题背景中来考虑,否则这种目标最终是不可能实现的。而这些环境问题也必须与人类所面临的人口、技术、经济、社会、政治、军事、外交、机构、信息以及观念问题放到一起考虑。尤其是所有这些领域中的挑战,可以认为是需要在21世纪完成的一系列通向更持续发展的连锁转变。如果能实现的话,更大的持续性将意味着全球及大多数地区人口停止增加;实行鼓励索取真实成本、质量提高甚于数量增加、靠自然的收入而非其资本为生的经济政策;具有对环境影响较小的技术;更加公平分配的财富,尤其是极度贫困现象不再普遍存在;有更加强大的世界性与国际机构来处理紧急的全球性问题;公众更加了解未来多种彼此相互牵连的挑战;还有,也许是最重要与最困难的是普遍赞赏多样性的联合——各种不同文化传统和国家合作与无暴力竞争,以及与我们人类共享生物圈的其他生物持续共存。这样一种情形似乎是乌托邦式的,也许不可能实现,但值得我们去建构未来的模型——不是作为蓝图,而是作为想象的辅助手段——并看是否能设想出可导向21世纪后期这样一个理想的持续发展世界的途径,在这样一个世界中,整个人类与自然的其余部分,将比现在在更大得多的程度上发挥复杂适应系统的作用。
写长篇小说吗?那么长…
全文照搬都可以是精品文章?
全文照搬都可以是精品文章?
我也喜欢这些文章