【科普贴】洪水“XX年一遇”的意义以及什么叫重现期

来源:百度文库 编辑:超级军网 时间:2024/05/06 02:35:10
[color=Red不知道有没有人发过,我转贴一次~~~



PS:其实呢,就是一个教科书中的一章内容。往下拉,看看红字部分就够了,其余的算是扩展阅读吧,如果你有兴趣的话。。。。。。。。。。。。
第5章 水文统计方法

10.学习水文统计方法要注意什么?

水文统计方法部分内容这部分内容十分重要。因为水文统计的一些基本概念、基本方法,比如 随机事件、随机变量、概率、统计规律、频率曲线、适线法、相关分析等,不但在水资源管理这门课程中要经常用到,而且是水利工程专业人员应当掌握的最基本的知识。

水文统计方法这部分内容又比较抽象,而且在认识具有随机性的事物时,要求在思维方法上有所转变,更增加了学习的难度。这就使得水文统计方法成为既是重点又是难点的内容。

在学习水文统计方法时,一方面要充分重视,注意多下一些功夫,另一方面仍要着重理解和掌握基本概念、基本理论、基本方法,并注意掌握一些最实用的内容。

11.什么是随机事件和概率

(1)随机事件

在客观世界中,不断地出现和发生一些事物和现象。这些事物和现象可以统称为事件。时间的发生有一定的条件。

经分析,就因果关系来看,有一类事件是在一定的条件下必然发生的(如水到0度会结冰,一年会有四个季节)。这种在一定的条件下必然发生的事件称为必然事件。

另有一类事件在一定的条件下是必然不发生的(如石头不能孵化成小鸡,太阳不会从西边出来)。这种在一定的条件下必然不发生的事件称为不可能事件。

必然事件或不可能事件虽然不同,但又具有共性,即在因果关系上都具有确定性。

除了必然事件和不可能事件以外,在客观世界中还有另外一类事件,这类事件发生的条件和事件的发生与否之间没有确定的因果关系。这种发生的条件和发生与否之间没有确定的因果关系的事件称为随机事件。

在长期的实践中人们发现,虽然对随机事件作一两次或少数几次观察,随机事件的发生与否没有什么规律,但如果进行大量的观察或试验,又可以发现随机事件具有一定的规律性。

比如一枚硬币,投掷一次或几次的时候看不出什么规律,但是在同样的条件下反复多次进行试验,把硬币投掷成千上万次,就会发现硬币落地时正面朝上和反面朝上的次数大致是相等的。

再比如,一条河流的某一个断面的年径流量在各个年份是不相同的,但进行长期观测,如观测30年、50年、80年,就会发现年径流量的多年平均值是一个稳定数值。
随机事件所具有的这种规律称为统计规律。

具有统计规律的随机事件的范围是很广泛的。随机事件可以是具有属性性质的,比如投掷硬币落地的时候哪一面朝上,出生的婴儿是男孩还是女孩,天气是晴、是阴,有没有雨、雪,商业上股票买卖的盈亏,城市里交通事故的发生等等。

随机事件也可以是具有数量性质的,比如射手打靶的环数,建筑结构试件破坏的强度,某条河流发生洪水的洪峰流量等等。

(2)概率

在数学中有两个分支,即概率论和数理统计。研究随机事件统计规律的学科称为概率论。由随机现象的一部分实测资料研究和推求随机事件全体的规律的学科称为数理统计。

概率是表示统计规律的方式。用概率可以表示和度量在一定条件下随机事件出现或发生的可能性。

针对不同的情况,概率有不同的定义。

按照数理统计的观点,事物和现象都可以看为是试验的结果。

如果试验只有有限个不同的试验结果,并且它们发生的机会都是相同的,又是相互排斥的,则事件概率的计算公式为

                              

式中  P(A)——随机事件A的概率;

n  ——进行试验可能发生结果的总数;

         m  ——进行试验中可能发生事件A的结果数。

例如,掷骰子(俗称“掷色子”)的情况就符合以上公式的条件。因掷骰子可能发生的结果是有限的(1到6点),试验可能发生结果的总数是6;同时骰子是一个均匀的6面体,掷骰子掷成1点到6点的可能性都是相同的,又是相互排斥的(一次掷一个骰子不可能同时出现两个点)。

如果定义Z为随即事件“掷骰子的点数大于2”,则符合Z的结果为3、4、5、6点4种情况,即事件Z可能发生的结果数是4。按照上述公式,Z的概率



像这种比较简单的,等可能性、相互排斥的情况,是概率论初期的主要研究对象。故按上面公式确定的事件概率称为古典概率。

在客观世界里中,随机事件并不都是等可能性的。如射手打靶打中的环数是随机事件,但打中0环到10环各环的可能性并不相同,优秀的射手打中9环、10环的可能性大,而新手打中1环、2环的可能性就较大。

一条河流出现大洪水的可能性和一般洪水的可能性显然也是不同的。

为了表示不是等可能性情况的统计规律,概率论中队概率给出了更一般的定义 。

在同样条件下进行试验,将事件A出现的次数μ 称为频数,将频数μ与试验次数n的比值称为频率,记为P(A),则

                                 

大量的实践证明,当着试验的次数充分大的时候,随机事件的频率会趋于稳定。

概率的统计定义如下:在一组不变的条件下,重复作n次试验,记μ是事件A发生的次数,当试验次数很大时,如果频率μ/n稳定地在某一数值p的附近摆动,而且一般说来随着试验次数的增多,这种摆动的幅度愈变愈小,则称A为随机事件,并称数值p为随机事件A的概率,记作

P(A)=  p                        

(以上可简单地说成,频率具有稳定性的事件叫做随机事件,频率的稳定值叫作随机事件的概率)。

概率的统计定义它既适用于事件出现机会相等的情况,又适用于事件出现机会不相等的一般情况。

前述的必然事件和不可能事件发生的可能性也可以用概率表示。必然事件的概率等于1.0(表示事件必然发生);不可能事件的概率等于0(表示事件发生的可能性是0,必然不发生);一般随机事件的概率介于0和1.0之间。

对于概率的统计定义还需注意,进行统计试验的条件必须是不变的。如果条件发生了变化,即使试验的次数再多,也不能求得随机事件真正的概率。如要确定某一个射手打靶射中不同环数的概率,必须让射手在同样的条件下进行射击,如射击的射程、靶型、武器、风力等都不应改变。

类似地,进行水文统计时,水文现象的各种有关因素也应当是不变的。如果流域的自然地理条件已经发生了比较大的变化,还把不同条件下的水文资料放在一起进行统计就不合理了。下面将要介绍,发生这种情况的时候,应当把实测水文资料进行必要的还原和修正以后,再进行统计计算。

12.什么是随机变量,怎样表示随机变量的概率分布?

要进行水资源管理工作及对水资源进行配置、节约和保护,必须了解和掌握水资源的规律,必须预测未来水资源的情势。但因影响水资源的因素十分众多和复杂,目前还难于通过成因分析,对水资源进行准确的长期预报。实际工作中采用的基本方法是对于水文实测资料进行分析、计算,研究和掌握水文现象的统计规律,然后按照统计规律对未来的水资源情势进行估计。而这样做,需要对随机事件定量化地表示,为此引入随机变量。

按照概率论理论,随机变量是对应于试验结果,表示试验结果的数量。如在工地上检验一批钢筋,可以随机抽取几组试件进行检验,每一组试件检验不合格的根数就是随机变量。又如某条河流,其历年的最大洪峰流量、最高水位、洪水持续时间等都可看为随机变量。

随机变量的数学定义为:在一组不变的条件下,试验的每一个可能结果都唯一对应到一个实数值,则称实数变量为随机变量(“唯一对应”又称“一一对应”,是指每一个试验结果,就只对应一个数据,而每一个数据,又只对应一个试验结果)。

随机变量常用大写字母来表示,如随机变量X(注意这里大写的X是变量,X的取值可以是x1、x2、……xn,即X表示随机取值的系列x1、x2、……xn)。

随机变量可以分为两类:

(1)离散型随机变量

如果随机变量是可数的,即随机变量的取值是和自然数一一对应的,就称为离散型随机变量。离散型随机变量不能在两个相邻随机变量取值之间取值。

离散型随机变量可以是有限的,也可以是无限的,但必须是可数的。

(2)连续型随机变量

如果随机变量的取值是不可数的,也就是在有限区间里面,随机变量可以取任何值,就称为连续型随机变量。

比如,某一个长途汽车站,每隔30分钟有一班车发往某地。对于一位不知道长途汽车时刻表的旅客,来车站等车到出发的时间是一个随机变量,这个随机变量取值可以是从0到30分钟区间的任意值,所以是一个连续型随机变量。

连续型随机变量是普遍存在的。水文变量,如降雨量、降雨时间、蒸发量、河流的流量、水量、水位等等,都是连续型随机变量。

对于随机变量,仅仅知道它的可能取值是不够的,更为重要的是了解各种取值出现的可能性有多大,也就是明确随机变量各种取值的概率,掌握它的统计规律。

随机变量取值与其概率的对应关系称为随机变量的概率分布。

对于离散型随机变量,可以用列举的方式表示它的概率分布。列举的方法可以是列表,画图等。我们的文字教材中举了例子。

对于连续型随机变量,因为它是不可数的,不能一一列举,所以也就也不能用列举的方法表示概率分布。

比如前面提到的乘客在长途汽车站等车的例子,等车时间可以是0到30分钟区间里的任何时间,故无法列举所有的随机变量及其相应概率。实际上,等车时间在0到30分钟的任何时间的可能性是相等的,对于这个区间的任意时间,其概率等于无穷大分之一,即近似等于0。

从这个例子可以看出,列举连续型随机变量各个值的概率不仅做不到,而且实际上是没有意义的。

为此,我们转而研究和分析连续性随机变量在某一个区间取值的概率。在工程水文里面,就是研究某一水文变量大于或等于某一数值的概率。

对于一个随机变量,大于或等于不同数值的概率是不同的。当随机变量取为不同数值时,随机变量大于等于此值的概率也随之而变,即概率是随机变量取值的函数。这一函数称之为随机变量的概率分布函数。分布函数的公式为

     F(x)= P(X≥x)                                    

式中       X —— 随机变量;

      x —— 随机变量X的取值;

    P(X≥x)—— 随机变量X取值大于或等于x的概率;

  F(x)—— 随机变量X的分布函数。

随机变量的分布函数可用曲线的形式表示。在工程水文里面,又习惯于将水文变量取值大于或等于某一数值的概率称为该变量的频率,同时将表示水文变量分布函数的曲线称为频率曲线。

分布函数、水文变量的频率,以及频率曲线这些概念均十分重要,需注意理解和掌握。

对于连续性随机变量,还有另一种表示概率分布的形式——概率密度函数。

按照概率论的定义,概率密度函数是分布函数的导数。概率密度函数在某一个区间的积分值,表示随机变量在这个区间取值的概率。  

在工程水文中,频率是水文变量取值大于或等于某一数值的概率,因此,水文变量的频率就是概率密度函数从变量取值到正无穷大区间的积分值。用公式表示,水文变量频率和概率密度函数之间的关系可以写为

(字幕)      

此式中, F(x)是随机变量X的分布函数值,也就是水文变量X取值为x时候的的频率,而p(x)是概率密度函数。

如前述,水文变量的分布函数可以用频率曲线表示。类似地,概率密度函数也可以用概率密度函数曲线表示。

因分布函数和概率密度函数之间存在着对应关系,频率曲线和概率密度函数曲线之间也存在着对应关系,这种对应关系可以用文字教材的图5.3表示。图5.3中,左边是概率密度函数曲线,右边是频率曲线。图中两边的纵坐标均表示随机变量的取值,左边的横坐标表示概率密度函数值,右图的横坐标表示频率。左边随机变量取值的概率密度函数值越大,表明随机变量在这个值附近区间取值的概率越大。

因频率F(xi)是概率密度函数从xi到正无穷大这个区间的积分,所以,右边中的F(xi)等于左图中xi以上的阴影面积。从图中可以看到,xi取值越小,阴影面积越大,频率F(xi)取值也越大。这显然是合理的,因为随机变量取值越小,大与等于这个取值的可能性越大。

对这张图里面表示的各种关系大家一定要弄清楚。

13.经常听到“多少年一遇的洪水”、“多少年一遇的干旱”这样的提法,如何正确理解?

工程中,习惯上常用洪水、潮汐等水文现象的“重现期”来表示其频率【即累计频率 】,“重现期”以年为单位,俗称“XX年一遇”,都是工程和生产上,用来表示随机变量统计规律的概念。

“重现期”表示在长时间内,随机事件发生的平均周期。即在很长的一段时间内,随机事件平均多少年发生一次。

“重现期”这个名词听起来很通俗,但需注意理解:

第一,重现期和概率一样,都表明随机事件或随机变量的统计规律。说某一条河流发生了 “百年一遇洪水”,是指从很长一个时期来看,大于或等于这次洪水的情况,平均100年出现一次。

重现期是对于类似于洪水这样的随机事件发生的可能性的一种定量描述。不能理解为百年一遇的洪水每隔100年一定出现一次。实际上,百年一遇洪水可能间隔100年以上时间发生,也可能连续两年接连发生。

第二,水文随机变量是连续型随机变量,水文变量的频率是水文变量大于或等于某个数值的概率。对应于频率,水文变量的重现期是指水文变量在某一个范围内取值的周期。如某条河流百年一遇的洪水洪峰流量是1000m3/s,是指这条河流洪峰流量大于或等于1000m3/s的洪水重现期是100年,而不是指洪峰流量恰恰等于1000m3/s的洪水重现期是100年。

第三,水利工程中所说的重现期,是指对工程不利情况的重现期。对于洪水、多水的情况,水越大对工程越不利。此时,重现期是指水文随机变量大于或等于某一数值这一随机事件发生的平均周期。如用大写的T表示重现期,用大写的P表示频率,按照频率和周期互为倒数的关系,可知洪水、多水时,重现期计算公式为

                                

因洪水、多水的时候,频率P小于或等于50%,此公式的适用条件又可写为P≤50%。

对于枯水、少水的情况,水越小对工程越不利,此时重现期是指水文随机变量小于或等于某一数值的平均周期。按照概率论理论,随机变量“小于或等于某一数值”是“大于或等于某一数值”的对立事件,“小于或等于某一数值”的概率等于1-P,故此时重现期的计算公式为

(P≥50 %)

因枯水、少水时,频率大于或等于50%,第二个公式的适用条件又可以写为P≥50%。

14.什么是统计参数,什么是理论频率曲线,统计参数和理论频率曲线有什么作用?

(1)统计参数。

知道了随机变量的概率分布函数或者概率密度函数,就掌握了随机变量在各个取值区间的概率,也就掌握了随机变量的统计规律。

但在实际工作里,求出概率分布函数或者概率密度函数往往比较困难,有时甚至求不出来。但是,有一些数字具有特征意义,可以简明地表示随机变量的统计规律和特性。在概率论里,把这些数字称为随机变量的数字特征,在工程水文中,习惯于把这些数字称为统计参数。

在文字教材中介绍了以下几种最常用的统计参数:

1)均值

均值又称为期望,它表示随机变量平均数的概念;

2)均方差、和离势系数Cv

均方差和离势系数都表示随机变量的离散情况,但均方差和随机变量取值的大小有关,而离势系数是一个无因次的量,排除了随机变量自身大小的影响;

3)偏态系数Cs

偏态系数反映随机变量的分布对于均值是否对称。Cs是一个无因次量;

4)众数

众数是随机变量取值概率最大,或者概率密度函数最大的数;

5)中位数

随机变量大于或等于以及小于或等于中位数的概率都为0.5。

文字教材中介绍了以上面统计参数的定义式。

统计参数可简明地表示随机变量概率分布的特性。文字教材的图5.5表明了随机变量的统计参数均值和Cv、Cs发生变化的时候,随机变量的概率密度函数曲线变化的情形。

由图5.5可以看到,当随机变量分布的类型不变的时候,如果上面三个统计参数之中的一个参数发生变化,另外两个参数不变时,如果均值增大,表明随机变量取值的平均水平增高,概率密度函数曲线沿横轴向右平行移动;如果离势系数Cv增大,表明随机变量分布相对于均值更为分散,概率密度函数曲线从较为尖瘦变为较为矮胖;如果偏态系数Cs=0时,概率密度函数曲线对称于均值分布,Cs<0时,分布的均值小于众数Eo(X),分布称为负偏,Cs>0时,分布的均值大于众数Eo(X),分布称为正偏(水文变量的分布大多数是正偏)。

(2)理论概率曲线

客观世界中的随机变量具有不同的概率分布规律。经过研究和分析,可以对某些概率分布给出数学表达式,并得到相应的频率曲线。具有数学表达式的频率曲线称为理论频率曲线。

理论频率曲线对应于以后将要介绍的经验频率曲线。在文字教材里,介绍了两种最为常用的理论频率曲线:

1)正态分布

文字教材的图5.6是正态分布的概率密度函数曲线。该曲线为单峰,曲线对称于均值,同时曲线两端以x轴为渐近线,趋向于正、负无穷大。正态分布有两个参数,即均值μ和均方差σ,当这两个参数确定后,分布就唯一确定了。

实践经验和理论分析表明,可以用正态分布描述许多随机变量的概率分布。如各种测量、检测的误差,因多种偶然因素形成的偏差(比如设备正常运转情况下产品的质量指标、正常施工情况下混凝土试件的强度等),都服从或者可以近似地看为服从正态分布。

2)皮尔逊Ⅲ型分布

文字教材的图5.7是皮尔逊Ⅲ型分布概率密度函数曲线。

英国生物学家、统计学家皮尔逊分析了生物、物理以及经济领域里的许多随机变量,归纳出一系列概率分布,其中有一种在水文里面用得较多,称为皮尔逊Ⅲ型分布。

皮尔逊Ⅲ型分布的概率密度函数曲线也是单峰的,曲线的一端有限,另一端无限,形状是不对称的。

皮尔逊Ⅲ型分布有3个参数,这 3个参数和统计参数均值、离势系数Cv、偏态系数Cs之间,存在着函数关系。所以,只要能够确定皮尔逊Ⅲ型分布的均值和Cv和Cs,就可以确定随机变量的概率分布。

我们文字教材的第5章第1节对正态分布和皮尔逊Ⅲ型分布的概率密度函数公式、概率密度函数曲线、分布的性质等都作了介绍。

为了实际应用皮尔逊Ⅲ型分布,必须对它的概率密度函数进行积分,这样才能得到随机变量在某个区间取值的概率。

在工程水文里,要求出水文变量的频率,即水文变量从某一个取值到正无穷大个概率,因此需计算从随机变量的各个取值到无穷大的积分。因皮尔逊Ⅲ型分布的概率密度函数十分复杂,进行积分相当困难。为了能够在实际工作中运用皮尔逊Ⅲ型分布,有人制作了皮尔逊Ⅲ型分布的积分表格,我们文字教材中介绍的福斯特—雷布京表就是这样的表格。

幅斯特—雷布京表又叫做离均系数Ф值表,文字教材中介绍了离均系数Ф的概念,以及使用福斯特—雷布京表的方法,并提供了例题。

当确定了皮尔逊Ⅲ型分布的统计参数以后,可以按照Cs值从离均系数Ф值表查到对应于某一个频率P的离均系数Ф,同时可以由随机变量的均值和离势系数Cv,求出相应的随机变量值。亦即,确定了皮尔逊Ⅲ型分布的统计参数后,就可以借助离均系数Ф值表,查出对应于各个频率的水文变量值,从而绘制出水文变量的频率曲线。

为了更方便地进行频率分析计算,又有人根据皮尔逊Ⅲ型分布的离均系数表制作了模比系数表。

模比系数是随机变量取值x与均值的比值。如用k表示模比系数,则



运用皮尔逊Ⅲ型分布的模比系数表,可以直接查出常用Cv、Cs取值情况下,对应于某个频率P的模比系数kp,也就可以求出相应的随机变量xp。

离均系数Ф值表和模比系数表已作为第5章的附表编入文字教材。这两个表是经常要用到的,应熟练掌握它们的使用方法。

关于理论频率曲线,还有一个问题需要说明一下,就是所谓理论频率曲线只是一些具有数学表达式频率曲线。把理论频率曲线用于水文分析计算,并不是已经从理论上严格证明了水文现象的概率分布应当服从某种理论频率曲线。用某种理论频率曲线描述水文变量概率分布仅仅是根据经验。[color=Red不知道有没有人发过,我转贴一次~~~



PS:其实呢,就是一个教科书中的一章内容。往下拉,看看红字部分就够了,其余的算是扩展阅读吧,如果你有兴趣的话。。。。。。。。。。。。
第5章 水文统计方法

10.学习水文统计方法要注意什么?

水文统计方法部分内容这部分内容十分重要。因为水文统计的一些基本概念、基本方法,比如 随机事件、随机变量、概率、统计规律、频率曲线、适线法、相关分析等,不但在水资源管理这门课程中要经常用到,而且是水利工程专业人员应当掌握的最基本的知识。

水文统计方法这部分内容又比较抽象,而且在认识具有随机性的事物时,要求在思维方法上有所转变,更增加了学习的难度。这就使得水文统计方法成为既是重点又是难点的内容。

在学习水文统计方法时,一方面要充分重视,注意多下一些功夫,另一方面仍要着重理解和掌握基本概念、基本理论、基本方法,并注意掌握一些最实用的内容。

11.什么是随机事件和概率

(1)随机事件

在客观世界中,不断地出现和发生一些事物和现象。这些事物和现象可以统称为事件。时间的发生有一定的条件。

经分析,就因果关系来看,有一类事件是在一定的条件下必然发生的(如水到0度会结冰,一年会有四个季节)。这种在一定的条件下必然发生的事件称为必然事件。

另有一类事件在一定的条件下是必然不发生的(如石头不能孵化成小鸡,太阳不会从西边出来)。这种在一定的条件下必然不发生的事件称为不可能事件。

必然事件或不可能事件虽然不同,但又具有共性,即在因果关系上都具有确定性。

除了必然事件和不可能事件以外,在客观世界中还有另外一类事件,这类事件发生的条件和事件的发生与否之间没有确定的因果关系。这种发生的条件和发生与否之间没有确定的因果关系的事件称为随机事件。

在长期的实践中人们发现,虽然对随机事件作一两次或少数几次观察,随机事件的发生与否没有什么规律,但如果进行大量的观察或试验,又可以发现随机事件具有一定的规律性。

比如一枚硬币,投掷一次或几次的时候看不出什么规律,但是在同样的条件下反复多次进行试验,把硬币投掷成千上万次,就会发现硬币落地时正面朝上和反面朝上的次数大致是相等的。

再比如,一条河流的某一个断面的年径流量在各个年份是不相同的,但进行长期观测,如观测30年、50年、80年,就会发现年径流量的多年平均值是一个稳定数值。
随机事件所具有的这种规律称为统计规律。

具有统计规律的随机事件的范围是很广泛的。随机事件可以是具有属性性质的,比如投掷硬币落地的时候哪一面朝上,出生的婴儿是男孩还是女孩,天气是晴、是阴,有没有雨、雪,商业上股票买卖的盈亏,城市里交通事故的发生等等。

随机事件也可以是具有数量性质的,比如射手打靶的环数,建筑结构试件破坏的强度,某条河流发生洪水的洪峰流量等等。

(2)概率

在数学中有两个分支,即概率论和数理统计。研究随机事件统计规律的学科称为概率论。由随机现象的一部分实测资料研究和推求随机事件全体的规律的学科称为数理统计。

概率是表示统计规律的方式。用概率可以表示和度量在一定条件下随机事件出现或发生的可能性。

针对不同的情况,概率有不同的定义。

按照数理统计的观点,事物和现象都可以看为是试验的结果。

如果试验只有有限个不同的试验结果,并且它们发生的机会都是相同的,又是相互排斥的,则事件概率的计算公式为

                              

式中  P(A)——随机事件A的概率;

n  ——进行试验可能发生结果的总数;

         m  ——进行试验中可能发生事件A的结果数。

例如,掷骰子(俗称“掷色子”)的情况就符合以上公式的条件。因掷骰子可能发生的结果是有限的(1到6点),试验可能发生结果的总数是6;同时骰子是一个均匀的6面体,掷骰子掷成1点到6点的可能性都是相同的,又是相互排斥的(一次掷一个骰子不可能同时出现两个点)。

如果定义Z为随即事件“掷骰子的点数大于2”,则符合Z的结果为3、4、5、6点4种情况,即事件Z可能发生的结果数是4。按照上述公式,Z的概率



像这种比较简单的,等可能性、相互排斥的情况,是概率论初期的主要研究对象。故按上面公式确定的事件概率称为古典概率。

在客观世界里中,随机事件并不都是等可能性的。如射手打靶打中的环数是随机事件,但打中0环到10环各环的可能性并不相同,优秀的射手打中9环、10环的可能性大,而新手打中1环、2环的可能性就较大。

一条河流出现大洪水的可能性和一般洪水的可能性显然也是不同的。

为了表示不是等可能性情况的统计规律,概率论中队概率给出了更一般的定义 。

在同样条件下进行试验,将事件A出现的次数μ 称为频数,将频数μ与试验次数n的比值称为频率,记为P(A),则

                                 

大量的实践证明,当着试验的次数充分大的时候,随机事件的频率会趋于稳定。

概率的统计定义如下:在一组不变的条件下,重复作n次试验,记μ是事件A发生的次数,当试验次数很大时,如果频率μ/n稳定地在某一数值p的附近摆动,而且一般说来随着试验次数的增多,这种摆动的幅度愈变愈小,则称A为随机事件,并称数值p为随机事件A的概率,记作

P(A)=  p                        

(以上可简单地说成,频率具有稳定性的事件叫做随机事件,频率的稳定值叫作随机事件的概率)。

概率的统计定义它既适用于事件出现机会相等的情况,又适用于事件出现机会不相等的一般情况。

前述的必然事件和不可能事件发生的可能性也可以用概率表示。必然事件的概率等于1.0(表示事件必然发生);不可能事件的概率等于0(表示事件发生的可能性是0,必然不发生);一般随机事件的概率介于0和1.0之间。

对于概率的统计定义还需注意,进行统计试验的条件必须是不变的。如果条件发生了变化,即使试验的次数再多,也不能求得随机事件真正的概率。如要确定某一个射手打靶射中不同环数的概率,必须让射手在同样的条件下进行射击,如射击的射程、靶型、武器、风力等都不应改变。

类似地,进行水文统计时,水文现象的各种有关因素也应当是不变的。如果流域的自然地理条件已经发生了比较大的变化,还把不同条件下的水文资料放在一起进行统计就不合理了。下面将要介绍,发生这种情况的时候,应当把实测水文资料进行必要的还原和修正以后,再进行统计计算。

12.什么是随机变量,怎样表示随机变量的概率分布?

要进行水资源管理工作及对水资源进行配置、节约和保护,必须了解和掌握水资源的规律,必须预测未来水资源的情势。但因影响水资源的因素十分众多和复杂,目前还难于通过成因分析,对水资源进行准确的长期预报。实际工作中采用的基本方法是对于水文实测资料进行分析、计算,研究和掌握水文现象的统计规律,然后按照统计规律对未来的水资源情势进行估计。而这样做,需要对随机事件定量化地表示,为此引入随机变量。

按照概率论理论,随机变量是对应于试验结果,表示试验结果的数量。如在工地上检验一批钢筋,可以随机抽取几组试件进行检验,每一组试件检验不合格的根数就是随机变量。又如某条河流,其历年的最大洪峰流量、最高水位、洪水持续时间等都可看为随机变量。

随机变量的数学定义为:在一组不变的条件下,试验的每一个可能结果都唯一对应到一个实数值,则称实数变量为随机变量(“唯一对应”又称“一一对应”,是指每一个试验结果,就只对应一个数据,而每一个数据,又只对应一个试验结果)。

随机变量常用大写字母来表示,如随机变量X(注意这里大写的X是变量,X的取值可以是x1、x2、……xn,即X表示随机取值的系列x1、x2、……xn)。

随机变量可以分为两类:

(1)离散型随机变量

如果随机变量是可数的,即随机变量的取值是和自然数一一对应的,就称为离散型随机变量。离散型随机变量不能在两个相邻随机变量取值之间取值。

离散型随机变量可以是有限的,也可以是无限的,但必须是可数的。

(2)连续型随机变量

如果随机变量的取值是不可数的,也就是在有限区间里面,随机变量可以取任何值,就称为连续型随机变量。

比如,某一个长途汽车站,每隔30分钟有一班车发往某地。对于一位不知道长途汽车时刻表的旅客,来车站等车到出发的时间是一个随机变量,这个随机变量取值可以是从0到30分钟区间的任意值,所以是一个连续型随机变量。

连续型随机变量是普遍存在的。水文变量,如降雨量、降雨时间、蒸发量、河流的流量、水量、水位等等,都是连续型随机变量。

对于随机变量,仅仅知道它的可能取值是不够的,更为重要的是了解各种取值出现的可能性有多大,也就是明确随机变量各种取值的概率,掌握它的统计规律。

随机变量取值与其概率的对应关系称为随机变量的概率分布。

对于离散型随机变量,可以用列举的方式表示它的概率分布。列举的方法可以是列表,画图等。我们的文字教材中举了例子。

对于连续型随机变量,因为它是不可数的,不能一一列举,所以也就也不能用列举的方法表示概率分布。

比如前面提到的乘客在长途汽车站等车的例子,等车时间可以是0到30分钟区间里的任何时间,故无法列举所有的随机变量及其相应概率。实际上,等车时间在0到30分钟的任何时间的可能性是相等的,对于这个区间的任意时间,其概率等于无穷大分之一,即近似等于0。

从这个例子可以看出,列举连续型随机变量各个值的概率不仅做不到,而且实际上是没有意义的。

为此,我们转而研究和分析连续性随机变量在某一个区间取值的概率。在工程水文里面,就是研究某一水文变量大于或等于某一数值的概率。

对于一个随机变量,大于或等于不同数值的概率是不同的。当随机变量取为不同数值时,随机变量大于等于此值的概率也随之而变,即概率是随机变量取值的函数。这一函数称之为随机变量的概率分布函数。分布函数的公式为

     F(x)= P(X≥x)                                    

式中       X —— 随机变量;

      x —— 随机变量X的取值;

    P(X≥x)—— 随机变量X取值大于或等于x的概率;

  F(x)—— 随机变量X的分布函数。

随机变量的分布函数可用曲线的形式表示。在工程水文里面,又习惯于将水文变量取值大于或等于某一数值的概率称为该变量的频率,同时将表示水文变量分布函数的曲线称为频率曲线。

分布函数、水文变量的频率,以及频率曲线这些概念均十分重要,需注意理解和掌握。

对于连续性随机变量,还有另一种表示概率分布的形式——概率密度函数。

按照概率论的定义,概率密度函数是分布函数的导数。概率密度函数在某一个区间的积分值,表示随机变量在这个区间取值的概率。  

在工程水文中,频率是水文变量取值大于或等于某一数值的概率,因此,水文变量的频率就是概率密度函数从变量取值到正无穷大区间的积分值。用公式表示,水文变量频率和概率密度函数之间的关系可以写为

(字幕)      

此式中, F(x)是随机变量X的分布函数值,也就是水文变量X取值为x时候的的频率,而p(x)是概率密度函数。

如前述,水文变量的分布函数可以用频率曲线表示。类似地,概率密度函数也可以用概率密度函数曲线表示。

因分布函数和概率密度函数之间存在着对应关系,频率曲线和概率密度函数曲线之间也存在着对应关系,这种对应关系可以用文字教材的图5.3表示。图5.3中,左边是概率密度函数曲线,右边是频率曲线。图中两边的纵坐标均表示随机变量的取值,左边的横坐标表示概率密度函数值,右图的横坐标表示频率。左边随机变量取值的概率密度函数值越大,表明随机变量在这个值附近区间取值的概率越大。

因频率F(xi)是概率密度函数从xi到正无穷大这个区间的积分,所以,右边中的F(xi)等于左图中xi以上的阴影面积。从图中可以看到,xi取值越小,阴影面积越大,频率F(xi)取值也越大。这显然是合理的,因为随机变量取值越小,大与等于这个取值的可能性越大。

对这张图里面表示的各种关系大家一定要弄清楚。

13.经常听到“多少年一遇的洪水”、“多少年一遇的干旱”这样的提法,如何正确理解?

工程中,习惯上常用洪水、潮汐等水文现象的“重现期”来表示其频率【即累计频率 】,“重现期”以年为单位,俗称“XX年一遇”,都是工程和生产上,用来表示随机变量统计规律的概念。

“重现期”表示在长时间内,随机事件发生的平均周期。即在很长的一段时间内,随机事件平均多少年发生一次。

“重现期”这个名词听起来很通俗,但需注意理解:

第一,重现期和概率一样,都表明随机事件或随机变量的统计规律。说某一条河流发生了 “百年一遇洪水”,是指从很长一个时期来看,大于或等于这次洪水的情况,平均100年出现一次。

重现期是对于类似于洪水这样的随机事件发生的可能性的一种定量描述。不能理解为百年一遇的洪水每隔100年一定出现一次。实际上,百年一遇洪水可能间隔100年以上时间发生,也可能连续两年接连发生。

第二,水文随机变量是连续型随机变量,水文变量的频率是水文变量大于或等于某个数值的概率。对应于频率,水文变量的重现期是指水文变量在某一个范围内取值的周期。如某条河流百年一遇的洪水洪峰流量是1000m3/s,是指这条河流洪峰流量大于或等于1000m3/s的洪水重现期是100年,而不是指洪峰流量恰恰等于1000m3/s的洪水重现期是100年。

第三,水利工程中所说的重现期,是指对工程不利情况的重现期。对于洪水、多水的情况,水越大对工程越不利。此时,重现期是指水文随机变量大于或等于某一数值这一随机事件发生的平均周期。如用大写的T表示重现期,用大写的P表示频率,按照频率和周期互为倒数的关系,可知洪水、多水时,重现期计算公式为

                                

因洪水、多水的时候,频率P小于或等于50%,此公式的适用条件又可写为P≤50%。

对于枯水、少水的情况,水越小对工程越不利,此时重现期是指水文随机变量小于或等于某一数值的平均周期。按照概率论理论,随机变量“小于或等于某一数值”是“大于或等于某一数值”的对立事件,“小于或等于某一数值”的概率等于1-P,故此时重现期的计算公式为

(P≥50 %)

因枯水、少水时,频率大于或等于50%,第二个公式的适用条件又可以写为P≥50%。

14.什么是统计参数,什么是理论频率曲线,统计参数和理论频率曲线有什么作用?

(1)统计参数。

知道了随机变量的概率分布函数或者概率密度函数,就掌握了随机变量在各个取值区间的概率,也就掌握了随机变量的统计规律。

但在实际工作里,求出概率分布函数或者概率密度函数往往比较困难,有时甚至求不出来。但是,有一些数字具有特征意义,可以简明地表示随机变量的统计规律和特性。在概率论里,把这些数字称为随机变量的数字特征,在工程水文中,习惯于把这些数字称为统计参数。

在文字教材中介绍了以下几种最常用的统计参数:

1)均值

均值又称为期望,它表示随机变量平均数的概念;

2)均方差、和离势系数Cv

均方差和离势系数都表示随机变量的离散情况,但均方差和随机变量取值的大小有关,而离势系数是一个无因次的量,排除了随机变量自身大小的影响;

3)偏态系数Cs

偏态系数反映随机变量的分布对于均值是否对称。Cs是一个无因次量;

4)众数

众数是随机变量取值概率最大,或者概率密度函数最大的数;

5)中位数

随机变量大于或等于以及小于或等于中位数的概率都为0.5。

文字教材中介绍了以上面统计参数的定义式。

统计参数可简明地表示随机变量概率分布的特性。文字教材的图5.5表明了随机变量的统计参数均值和Cv、Cs发生变化的时候,随机变量的概率密度函数曲线变化的情形。

由图5.5可以看到,当随机变量分布的类型不变的时候,如果上面三个统计参数之中的一个参数发生变化,另外两个参数不变时,如果均值增大,表明随机变量取值的平均水平增高,概率密度函数曲线沿横轴向右平行移动;如果离势系数Cv增大,表明随机变量分布相对于均值更为分散,概率密度函数曲线从较为尖瘦变为较为矮胖;如果偏态系数Cs=0时,概率密度函数曲线对称于均值分布,Cs<0时,分布的均值小于众数Eo(X),分布称为负偏,Cs>0时,分布的均值大于众数Eo(X),分布称为正偏(水文变量的分布大多数是正偏)。

(2)理论概率曲线

客观世界中的随机变量具有不同的概率分布规律。经过研究和分析,可以对某些概率分布给出数学表达式,并得到相应的频率曲线。具有数学表达式的频率曲线称为理论频率曲线。

理论频率曲线对应于以后将要介绍的经验频率曲线。在文字教材里,介绍了两种最为常用的理论频率曲线:

1)正态分布

文字教材的图5.6是正态分布的概率密度函数曲线。该曲线为单峰,曲线对称于均值,同时曲线两端以x轴为渐近线,趋向于正、负无穷大。正态分布有两个参数,即均值μ和均方差σ,当这两个参数确定后,分布就唯一确定了。

实践经验和理论分析表明,可以用正态分布描述许多随机变量的概率分布。如各种测量、检测的误差,因多种偶然因素形成的偏差(比如设备正常运转情况下产品的质量指标、正常施工情况下混凝土试件的强度等),都服从或者可以近似地看为服从正态分布。

2)皮尔逊Ⅲ型分布

文字教材的图5.7是皮尔逊Ⅲ型分布概率密度函数曲线。

英国生物学家、统计学家皮尔逊分析了生物、物理以及经济领域里的许多随机变量,归纳出一系列概率分布,其中有一种在水文里面用得较多,称为皮尔逊Ⅲ型分布。

皮尔逊Ⅲ型分布的概率密度函数曲线也是单峰的,曲线的一端有限,另一端无限,形状是不对称的。

皮尔逊Ⅲ型分布有3个参数,这 3个参数和统计参数均值、离势系数Cv、偏态系数Cs之间,存在着函数关系。所以,只要能够确定皮尔逊Ⅲ型分布的均值和Cv和Cs,就可以确定随机变量的概率分布。

我们文字教材的第5章第1节对正态分布和皮尔逊Ⅲ型分布的概率密度函数公式、概率密度函数曲线、分布的性质等都作了介绍。

为了实际应用皮尔逊Ⅲ型分布,必须对它的概率密度函数进行积分,这样才能得到随机变量在某个区间取值的概率。

在工程水文里,要求出水文变量的频率,即水文变量从某一个取值到正无穷大个概率,因此需计算从随机变量的各个取值到无穷大的积分。因皮尔逊Ⅲ型分布的概率密度函数十分复杂,进行积分相当困难。为了能够在实际工作中运用皮尔逊Ⅲ型分布,有人制作了皮尔逊Ⅲ型分布的积分表格,我们文字教材中介绍的福斯特—雷布京表就是这样的表格。

幅斯特—雷布京表又叫做离均系数Ф值表,文字教材中介绍了离均系数Ф的概念,以及使用福斯特—雷布京表的方法,并提供了例题。

当确定了皮尔逊Ⅲ型分布的统计参数以后,可以按照Cs值从离均系数Ф值表查到对应于某一个频率P的离均系数Ф,同时可以由随机变量的均值和离势系数Cv,求出相应的随机变量值。亦即,确定了皮尔逊Ⅲ型分布的统计参数后,就可以借助离均系数Ф值表,查出对应于各个频率的水文变量值,从而绘制出水文变量的频率曲线。

为了更方便地进行频率分析计算,又有人根据皮尔逊Ⅲ型分布的离均系数表制作了模比系数表。

模比系数是随机变量取值x与均值的比值。如用k表示模比系数,则



运用皮尔逊Ⅲ型分布的模比系数表,可以直接查出常用Cv、Cs取值情况下,对应于某个频率P的模比系数kp,也就可以求出相应的随机变量xp。

离均系数Ф值表和模比系数表已作为第5章的附表编入文字教材。这两个表是经常要用到的,应熟练掌握它们的使用方法。

关于理论频率曲线,还有一个问题需要说明一下,就是所谓理论频率曲线只是一些具有数学表达式频率曲线。把理论频率曲线用于水文分析计算,并不是已经从理论上严格证明了水文现象的概率分布应当服从某种理论频率曲线。用某种理论频率曲线描述水文变量概率分布仅仅是根据经验。
概率和分布以前上过,现在忘光了,LZ能不能算一下百年一遇、千年一遇、万年一遇的标准分别比平均值高几个标准差?
这是专业课的教学课件吧。:D
回复 2# scut_m


    不止是你,我也忘光……不是最近这个这么火,也不会有人去找这个……
回复 1# 戍卫部队
  给一个链接吧。这么重要的资料有链接,才说明你是负责任的转帖。
回复 5# 新侨联委员


    校内有人总结的的……

http://blog.renren.com/share/238485690/2797296592
搞好科普工作,提高民众科学素养