看多报刊电视后不禁感慨,今年分明是个 “N 年一遇 ” 之年!刚进 2010 年北方就迎来 “ 几十年一遇 ” 的大暴雪,接着西南遭遇 “ 五十年一遇 ” 的大旱,现在全国各地纷纷迎来 “ 百年一遇 ” 的大暴雨,媒体报道从南到北多条河流最高洪峰 “ 千年一遇 ”… 有网友抱怨近年来, “N 年一遇 ” 频频出现,人们看到审美疲劳,甚至怀疑它是顶逃避责任的 “ 堂而皇之的帽子 ” 。 “N 年一遇 ” 到底是算出来的还是拍脑袋想出来的?是不是哪里都能使用 “N 年一遇 ” ? N 是不是可以无限放大到几千几万? …
“N 年一遇 ” 不是周期是概率
水文上, “N 年一遇 ” 有个更科学的名称 “ 重现期 ” 。根据某地长期水文记录 , 可以算出某量级的洪水平均多少年出现一次,也就是洪水重现期。洪水重现期为百年,表示当地发生某量级洪水的概率为 1% ,那就是俗称的百年一遇洪水。不同地方概率为 1% 的洪水大小并不相同,常年干旱地区 “ 百年一遇 ” 洪水,搬到长江流域某支流就可能变成 “ 五十年一遇 ” 。政府在确定防洪建设规模和等级时,要参考当地的重现期。这样可以有效防洪的同时,避免过度建设。值得一提的是, “ 重现期 ” 要假定 “ 历史会稳定重现 ” 。如果气候变化让一个干旱地方的雨水逐年增多,过去概率为 1% 的洪水就会慢慢变成 2% ,也就是 “ 五十年一遇 ” 。因此,在防洪抗旱决策制定过程中不仅要计算 “ 重现期 ” ,也应该把未来气候变化趋势考虑进去。
“N 年一遇 ” 不是说每 N 年灾害就会发生一次,它只代表了历史上灾害的罕见程度。如果连续多年某地报道 “N>50 年一遇 ” 的同种灾害,要么是当地气候发生改变,让原本罕见的灾害频繁发生,要么就是媒体滥用词汇。因此强烈建议媒体在提出 “N 年一遇 ” 之前,核实数据来源和计算过程。
N 是算出来的 , 不是拍脑袋想出来的
2007 年高考,湖南文科考生面对这么一道数学填空题:根据如下某河流水位概率分布图,选择该河流平均至少一百年才发生一次的洪水最低水位。实际上, “ 百年一遇 ” 的洪水就是这么算出来的。某条河过去 400 年,水位 50 米出现过 4 次,发生概率为 1% ,是 “ 百年一遇 ” 洪水。今年发大水水位涨到 50 米,那么明年统计时 50 米水位概率就成了 1.25% ,这样 50 米水位就成了 “80 年一遇 ” 洪水。但是统计样本和方法本身就存在误差,所以 N 一般只取个大数,例如五十年,一百年。
N 不能随便乱放大
“N 年一遇 ” 是历史统计,需要足够多的样本数, N 比资料年限小的时候才可靠。比如,只有一百年水文记录的河流,计算它 “ 五十年一遇 ” 的洪水量级就已经比较勉强,更别说 “ 百年一遇 ” , “ 千年一遇 ”… 我国水文历史记录很久远,有的地区洪水和干旱的历史记录达到上千年。然而气象灾害的降水、风速、温度等要素在现代观测仪器发明以前很难获得。我国从 20 世纪 50 年代开始,才全面建起统一规范的气象观测网络。那些所谓 “ 五十年一遇 ” 甚至 “ 一百年一遇 ” 气象灾害的说法非常可疑。全国常规气象观测记录也就五六十年,又怎么确定历史上平均一百年才会发生的气象灾害?其实气象专业报导的常用说法是 “ 降水量(温度)达到 N 年来最高(低)值 ” ,一传二传就成了 “ 五十年一遇 ” 、 “ 百年一遇 ” 。
N 年一遇 和 N 年不遇
就差了一个字, “N 年不遇 ” 像是 “N 年一遇 ” 的山寨版。它的意思可以被理解为过去五十年里都没有出现的灾情,也可以是发生概率低于 2% 的灾情。它的频繁出现让本来就鱼龙混杂的 “N 年一遇 ” 变得更加复杂。如果只是要描述灾情有多严重,完全不涉及灾情罕见程度。为了避免混淆视听,建议改用 “ 近 N 年未遇 ” 。这样媒体讲得放心,观众也看得明白。
作者:丁裕国
进入21世纪以来,全人类所面临的自然灾害愈来愈多。研究表明,近几年来,我国也不例外,发生极端天气气候事件的频率看来似有增加的趋势,由于极端天气气候事件的增加,如暴雨、洪涝、雷电、冰雹、台风、干旱、高温热浪、低温冷冻天气等事件所直接导致的灾害也更加频繁。无怪乎各类媒体乃至政府的有关部门和相关事业单位,不时地都会用一些带有专业性质的日常用语来形容某工程质量的牢固性或受灾的严重性。例如什么能抵御“百年一遇的洪水” 这次暴雨是“近百年一遇”的最强降水,本地遭受了“百年不遇”的大旱啦!,等等,诸如此类,不一而足,但是,对于极端天气气候事件而言,上述种种描述,未必都很科学,有的甚至误导了公众。 目 前在新闻报道中亦或在某些专业人士的口头或书面文稿中,经常有如下的误解:( 1 )已经出现的极值事件(只是某个极端事件的一次观测值),它不同于未来可能会出现的具有小概率的极值事件。我们不要误解。( 2 )“多年一遇”并非是“多少年非得出现一次”的概念,而只不过是小概率事件的另一种提法。况且,由于对研究对象观测时段和统计时段的不同,往往有逐日的、逐时的、逐旬的气象记录,从这些记录资料中所挑选的极端值,不但其量级不同,而且其挑选极端值的方法也可有多种,这就会出现各种不同时段极端值的“多次一遇”或“ N 次一遇”的现象。
( 3 )任何极端事件的出现概率都只能是一种观测结果即样本观测值,而并非是真正的极值的概率值。因此,对于用不同的抽样方法所得到的极值记录序列估计出来的“多年一遇”极值数据,有必要作置信区间的估计。
事实上,关于“多年一遇”“多少年不遇”这类术语,原先都只在有关业务部门、科研院所或高校师生中使用,而如今却被各种媒体及公众所广泛采用。当然,这是好事,一方面说明,这类科学术语已较为普及并为大众所接受,另一方面也反映出,当前由于极端气候事件的频发而引起政府和公众密切的关注。不过,在运用或引用这类术语时,请不要忘记其学术性和科学性,尤其是不要误导传媒和公众,应该正确地解读和宣传,笔者从事统计气候诊断和预测研究工作多年,有必要对此类术语作一全面阐述,以飨读者。
目前在报道或报告极端天气气候事件时,不泛出现的术语有:
“N年一遇”或“N年不遇”等等,所谓“N年一遇”就是以年为时间单位的1/N的小概率的另一种表述而已。换言之,其倒数就是统计意义上的重现期(或称回转周期),多年来人们对气候问题的研究表明:“气候”本身在很大程度上具有概率性。一切天气气候事件(包括极端气候事件)的诊断、模拟和预测,其理论基础都涉及到气候及其变化的基本概率属性。事实上,地球表面的任何地点乃至全球的气候,它所发生的变化,都是由于表征气候的某种特征它所围绕着的“气候平衡状态”(例如热平衡)被打破,而其相应变量(例如温度)的概率分布型态有了某种程度的改变而造成的。 例如概率分布两端尾部大约 5% 甚或 1% 概率范围以内所对应的小概率事件(统计气候上又称为右侧 / 左侧小概率)即 20 年一遇甚或百年一遇的随机的“极端天气气候”事件的概率发生了某种变化。我们姑且不论其变化的成因为何?而只讨论其概率特性所发生的变化:其中最容易使人误解的问题有以下两个:
1 )极值概率与重现期的统计意义
一般而言,我们并不关注某气象要素(如温度)的全部概率属性如平均值和方差等特征量的变化。而主要关注其部分的概率属性(如极端温度出现的概率如何?当某一变量服从某一分布的条件下,对应于极值概率为 的变量,其对应的取值就是所谓的 分位数。假如可将一个变量的观测值所占的频数份额或比率划分为百分数区间,按照上面所说的小概率对应的分位数若用百分数来表述(通常又称之为百分位点)。这里的分位数涉及到变量的累积概率问题。一般说来,上面所述都是从变量的总体或理论意义来理解的。事实上,若从应用的角度来看,还可定义累积概率的余补概率 ,通常又称为保证概率或风险概率。这一概念对研究极端气候事件特别有用。
2 )极值的置信区间问题
理论上已证明,随机变量的极端值,实际上就是随机变量的某种函数,这一概念在气象研究和业务工作中尤其重要。但是通常所观测到的某气象极值只是该要素的一个随机的函数观测值,即使我们根据观测记录知道,它是多年一遇,例如百年一遇( 1% )或 50 年一遇( 2% )或 20 年一遇( 5% ),等等,那也仅仅是一个对应于小概率的分位数的推测值(或估计值)。这里蕴含着一个科学原理:小概率所对应的数值只是分位数的样本估计值,它们必然有对应于某一可信度的置信区间,否则就不能作出肯定的结论。显然,不同的气象要素,它出现某种极值的数量级并不一样,举个最简单的例子:温度的极值与降水量的极值就很不一样。后者(降水量)的变化幅度简直无法想象。因此,当我们对某个气象要素作出极值估计时,一定要说明它是在何种置信水平上得到的,其置信区间有多大?统计理论上已经证明,某一变量的原方差大小,决定了它的极值抽样方差的大小。我们所观测到的极值仅仅是多少次抽样中所得到的一次,所以,我们在报告(报道)某一极端气候事件发生时,必须要加上它的相应的置信区间和信度。例如,根据某种预测方法知道,某地可能出现 200 毫米的特大暴雨,那么同时应当给出在(比如置信水平为 95% )某给定的信度下的置信区间,例如,上面某地可能出现 200 毫米的例子中,若置信上下限为 100-250 毫米总比置信上下限为 90-300 毫米要可靠一些。
下面的内容是给理科生看的,文科生请自重
4.4 水文频率曲线线型 |
|
内容提要: 正态分布,对数正态分布,皮尔逊Ⅲ型分布,经验频率曲线 学习要求: 1.了解正态分布、对数正态分布的形式和特点;2.掌握皮尔逊Ⅲ型分布的形式、特点及其频率曲线的绘制方法;3.掌握经验频率曲线的特点及其绘制方法。
|
|
水文分析计算中使用的概率分布曲线俗称水文频率曲线,习惯上把由实测资料(样本)绘制的频率曲线称为经验频率曲线,而把由数学方程式所表示的频率曲线称为理论频率曲线。所谓水文频率分布线型是指所采用的理论频率曲线(频率函数)的型式(水文中常用线型为正态分布型、极值分布型、皮尔逊Ⅲ型分布型等),它的选择主要取决于与大多数水文资料的经验频率点据的配合情况。分布线型的选择与统计参数的估算,一起构成了频率计算的两大内容。
|
|
4.4.1 正态分布
|
|
1、正态分布的密度函数及其参数 2、频率格纸 图4-4-1 正态分布密度曲线
|
|
|
|
|
|
4.4.2 对数正态分布
|
|
当随机变量x的对数值服从正态分布时,称x的分布为对数正态分布。对于两参数正态分布而言,变量x的对数 y = ln x 服从正态分布时,y的概率密度函数为: (-∞﹤y﹤+∞)(4-4-2) 式中 a y - 随机变量y的数学期望; σ y 2 - 随机变量y的方差。 由此可得到随机变量x的概率密度函数: (x﹥0) (4-4-3) 式(4-4-3)的概率密度函数包含了a y 和σ y 两个参数,故称为两参数对数正态曲线。 因x = ey,故式(4-4-3)又可写成: (4-4-4) 由矩法可以得到各个统计参数,即: (4-4-5) (4-4-6) (4-4-7) 所以,两参数对数正态分布是正偏的。 |
|
4.4.3 皮尔逊Ⅲ(P-Ⅲ)型曲线
|
|
1、皮尔逊Ⅲ型曲线的概率密度函数 皮尔逊Ⅲ型曲线是一条一端有限一端无限的不对称单峰、正偏曲线(见图4-4-3),数学上常称伽玛分布,其概率密度函数为: (4-4-8) 式中:Γ(α)―α的伽玛函数; α、β、a0―分别为皮尔逊Ⅲ型分布的形状尺度和位置未知参数, α﹥0, β﹥0 。 图4-4-3 皮尔逊Ⅲ型概率密度曲线
|
|
|
|
显然,三个参数确定以后,该密度函数随之可以确定。可以推论,这三个参数与总体三个参数 、Cv、CS具有如下关系: (4-4-9) 2、皮尔逊Ⅲ型频率曲线及其绘制 水文计算中,一般需要求出指定频率P所相应的随机变量取值xp,也就是通过对密度曲线进行积分,即: (4-4-10) 求出等于及大于xp的累积频率P值。直接由式(4-4-10)计算P值非常麻烦,实际做法是通过变量转换,变换成下面的积分形式 : (4-4-11) 式(4-4-11)中被积函数只含有一个待定参数CS,其它两个参数 、Cv都包含在 中。,x是标准化变量, 称为离均系数。 的均值为0,标准差为1。因此,只需要假定一个CS值,便可从式(4-4-11)通过积分求出 与 之间的关系。对于若干个给定的C S 值, 的对应数值表,已先后由美国福斯特和前苏联雷布京制作出来,见附表1"皮尔逊Ⅲ型频率曲线的离均系数 值表"。由 就可以求出相应频率 的x值: (4-4-12) |
|
3、皮尔逊Ⅲ型频率曲线的应用 在频率计算时,由已知的C S 值,查 值表得出不同的P的 值,然后利用已知的 、C V ,通过式(4-4-12)即可求出与各种P相应的 值,从而可绘制出皮尔逊Ⅲ型频率曲线。 当C S 等于C V 的一定倍数时,P-Ⅲ型频率曲线的模比系数K P = ,也已制成表格,见附表2"皮尔逊Ⅲ型频率曲线的模比系数K P 值表"。频率计算时,由已知的C S 和C V 可以从附表2中查出与各种频率P相对应的K P 值,然后即可算出与各种频率对应的 =K P 。有了P和 的一些对应值,即可绘制出皮尔逊Ⅲ型频率曲线。 |
|
4.4.4 经验频率曲线
|
|
上述各种频率曲线是用数学方程式来表示的, 属于理论频率曲线。在水文计算中还有一种经验频率曲线, 是由实测资料绘制而成的, 它是水文频率计算的基础, 具有一定的实用性。 1、经验频率曲线的绘制 根据实测水文资料,按从大到小的顺序排列,如图4-4-4所示,然后用经验频率公式计算系列中各项的频率,称为经验频率。以水文变量x为纵坐标,以经验频率 为横坐标,点绘经验频率点据,根据点群趋势绘出一条平滑的曲线,称为经验频率曲线,图4-4-5为某站年最大洪峰流量经验频率曲线。有了经验频率曲线,即可在曲线上求得指定频率 的水文变量值 。 图4-4-4 水文系列按大小排列示意图
|
|
|
|
对经验频率的计算,目前我国水文计算上广泛采用的是数学期望公式 : (4-4-13) 式中 p - 等于和大于x m 的经验频率; m - x m 的序号,即等于和大于x m 的项数; n - 系列的总项数。 2、经验频率曲线存在的问题 经验频率曲线计算工作量小,绘制简单,查用方便,但受实测资料所限,往往难以满足设计上的需要。为此,提出用理论频率曲线来配合经验点据,这就是水文频率计算适线(配线)法。 图4-4-5 某站年最大洪峰流量经验频率曲线
|
|
|
|
4.4.5 频率与重现期的关系
|
|
频率曲线绘制后,就可在频率曲线上求出指定频率p的设计值x p 。由于"频率"较为抽象,水文上常用"重现期"来代替"频率"。所谓重现期是指某随机变量的取值在长时期内平均多少年出现一次,又称多少年一遇。根据研究问题的性质不同,频率P与重现期T的关系有两种表示方法。 1、当为了防洪研究暴雨洪水问题时,一般设计频率P<50%,则: (4-4-14) 式中:T――重现期,年; ――频率,%。 (2)当考虑水库兴利调节研究枯水问题时,设计频率P>50%,则 (4-4-15) |
|
0人已收藏
0人已打赏
免费4人已点赞
分享
水文与水资源工程
返回版块4.6 万条内容 · 237 人订阅
回帖成功
经验值 +10
全部回复(1 )
只看楼主 我来说两句 抢板凳既科普,又有益学习。赞一个
回复 举报