Gavin Schmidt and Stefan Rahmstorf
John Tierney 和 Roger Pielke Jr. 最近
探讨了IPCC 2000-2007时段全球温度变化预估的有效性(或者说不准确性)。其他人则试图证实去年的数据显示“
全球暖化已经停止”或者“
已经暂停”(Uli Kulke, Die Welt)。但是,正如我们的大多数读者将会认识到的,这些对比是有缺陷的,因为它们基本上是把长期的气候变化和短期的天气波动在做对比。
看一看下图就立刻清晰明了了:
红线是
GISTEMP模式的全球年平均气温记录(其他数据组也可以起到同样的作用),蓝线是8年期趋势线,每一条代表8年的数据。图中显示的是人人都能意识到的:在这样短的时期内,趋势是波动的,时大时小,有时甚至是负面的--这都取决于你是从哪一年开始衡量的。
这些8年期短期趋势线的平均值都和长期趋势接近(0.19ºC/10年),但是标准差却很大(0.17ºC/10年),暗示这些短期趋势或者 >0.5ºC/10年或者更消极(< -0.2ºC/10年),说它消极是因为它显然落在了分布之外。 因此想通过比较短期趋势来区分各种互相取代的长期预期几乎是没有什么作用的。由此也可以得到一个清晰的结论:短期对比是有误导性的,但是原因和以何取而代之,却是值得探索的。 第一点要说明的也是我们经常反复提到的,就是气候系统在从某一天到另外一天、某一月到另外一月、某一年到另外一年、甚至某一个10年到另一个10年的这些时间尺度上,波动都是非常巨大的。如果把思考建立在这些昼夜循环和季节交替之类的变动之上,大部分的波动显然都是杂乱的,并且与外部因素没有联系,这种波动就是我们所称的天气。天气在有些方面是可以预计的,如提前预估几天后中纬度风暴的位置,几个月后厄尔尼诺现象的进展等,但是由于天气对初始条件下不可避免的不确定性的异常敏感,可预测性就很快就消失了。 因此对于大多数研究目的和意图来说,天气因素可以被认为是随机的。如果你和很多人一样对气候的强迫性因素(译者按:也就是非随机因素)感兴趣,那么你就需要先评估一下这个假定的强迫性因素与非强迫性的天气“噪点”的关联程度。不然的话,观测到的任何变化其意义都是无法确定的。 实际上,噪点率信号对于你所观察使用的气候记录(或量度)是非常敏感的,因此同一个信号是否能被清楚的观察到,在不同的气候视角方面差别是非常大的。 一个明显的例子是观察一个气象站的温度波动。例如:纽约市月平均气温的标准偏差波动范围在2.5ºC,在年平均值上是0.6ºC左右,全球的平均值上则是0.2ºC左右。 因此时间均值的跨度越漫长,空间均值的范围越广泛,天气噪点就越小,探测到任意特定因素的几率也就越大。在现实世界里,还有其他不同来源的不确定性会增加讨论中的噪点部分。重要的是(要注意)任何特定的气候量度指标在表现气候实际情况的时候都有不确定性因素。这可以是由样本的稀少而导致,也会跟原始数据的组合过程有关。 不确定性可以是随机的或者系统性的,这一点在地表或近地表温度的各种记录上有
一对很好的例子。在GISTEMP地表温度数据产物(数据扩展到了北极地区之外的陆地)和HADCRUT3v(数据假设北极气温变化并没有扩展到陆地)数据产物上,样本偏差是容易发现的。
他们都是防御性的选择,但是在计算全球平均变化时,如果考虑北极迅速升温这种情形,这两组记录上就会产生明显的偏差(GISTEMP显示的大趋势会更高)。尽管如此,他们的长期的趋势却还是非常接近的。
更加系统的偏差发生在处理RSS和UAH版本的MSULT(低对流层)卫星温度记录上。两个版本名义上都是试图估计源自同一数据的同一事件,但是由于处理相关的不同卫星的数据所使用的前提假设和整合方法的不同,结果对大趋势的估计就产生了很大的差异。限于我们只有两种版本的量度,真实的系统不确定性显然要比他们之间的简单区别还要大。
接下来真正的问题是如何评估我们对气候变化驱动因素的理解,这种理解同时也被放进了气候系统模型中。这些模型可以是一个简单的推定趋势,或者最新尖端的GCM。无论这种关于未来“应该”会发生什么的预测有什么来源依据,都有三个问题需要注意:
首先,驱动因素是如我们所料的在变化吗?比方说:如果行人走到机动车路上,很容易预言他会被撞翻,但是预言只能在他们真的离开人行路时才能有效!在气候变化这件事上,我们需要知道在不同预测中对强迫因素(温室气体,火山效应,气溶胶,太阳辐射等)的估计有多大把握。
第二,对于一个特定的强迫因素,预测的不确定性有多大?比如在上例中,我们可怜的行人由于卡车突然转向而获救的机会有多少?就温度变化来说,相对应的则是长期趋势预测的不确定性。它取决于气候敏感度,时间的长度和非强迫性变化的尺度。
第三,我们需要对比各种可能性,留心真正的问题是什么。这一点有了20世纪的仿真系统
档案之后就相对容易了,这些档案在未来还会有更多。
对于第三点的展开是有必要的,因为人们经常被它绊倒。在模型仿真预测中,现在的标准举措是进行若干基于不同初始状态的仿真,来跨越可能的天气因素的影响。各个单独的仿真都会得出相同的强迫性气候变化,但是它们对于非强迫因素的噪点却有不同的认识。通过拉平各个运行结果,不同仿真中不相关的噪点会被平均掉,剩下的就是关于强迫性信号的估计和它的不确定性了。这有点类似于拉平上述数据中的所有短期趋势,做到了这一点,你就可以经常得到很好的关于气候强迫变化(或长期平均)的估计了。
但是如果把对强迫变化的估计直接同真实趋势对比以验证他们是否相一致,就可能会发生问题。你需要记住真实世界不仅同时包含着一个(潜在的)强迫趋势,还包含着一个随机的天气因素。这是最近的Douglass 和其他人合著的
文章中的研究问题,他们声称观测落在了对流层模型平均趋势和它的不确定性之外(译者按:也就是说包含了不确定性的气候模型的评估结果与观测到的事实不相符合)
。他们把表示对强迫信号估计(所有模型的平均值)有多大把握的不确定性和趋势+噪点的分布搞混了。
这看起来可能有点让人迷惑,用掷筛子理论来解释一下吧。如果你有一把普通的骰子(“模型”),他们点数的平均值是3.5,标准差是~1.7。这样的话,投掷100次将会得到一个3.5 +/- 0.17 分布,也就是说你的估计很完美。
要是想评估另一个骰子是不是装了实心,仅仅将它只掷一次是不能够比较出的。例如:如果你掷出一个5,这显然是在之前的100次投掷得到的期望值之外,但却明明还在预期分布之内。
再回到气候模型上来,对于当前的强迫趋势期望值来说,0.2ºC/10年是可以获得强烈共识的,但是在简单对比实际趋势与这个数值时,增加或减小数值中的不确定性,就是不正确的了。Tierney的帖子中的数值就是被暗中如此操作了。
如果这不是正确的办法,那有什么更好的方式吗?如果你要做的是长期趋势,而趋势估计中的不确定性接近期望趋势中的不确定性,这样的话比较它们就有意义了,因为“天气”因素已经被拉平掉了。在全球表面气温纪录里,对于超过15年的趋势,上述对比就是有效的,但是对于噪点水平高的较小的地域(如南极地区),时间跨度就需要延伸到数十年。
人们会回到过去的预估来评价它们的可靠性吗?是的。我们在这里已经为
Hansen's 1988 projections做过了,Stefan和同事们也从CO2、温度和海平面预估的角度为IPCC第三次评估报告-IPCC TAR (
Rahmstorf et al, 2007 )作了评估,而且IPCC他们自己也在第四次评估的第一章图表1.1中做了评估(
AR4 Chapter 1)。这些分析中的任何一个都显示长期温度趋势确实与期望值相符(译者按:也就是说观测到的事实和原先对事实的估计相符)。从另外一方面看,海平面上升看起来被模型低估了,原因目前还不明。
最后一点,本话题显然已经被从以下的期望挑起了:未来几年的短期天气事件一定会证实人类活动导致的全球变暖到底是不是个问题。我们上面的讨论应该已经明确了这不是一个应该问的问题。取而代之的问题应该是,未来几年将会进行的分析对气候模型的估计结果会有促进吗?问题很可能是肯定的。将会有关于降水、云雾、风、风暴强度、冰层厚度、冰川退缩、海洋暖化等等更好的长期趋势评估。我们对这些趋势将会如何发展已经有了估计,但是在许多情况下“噪点”还是太大,使得上述这些气候量度很难成为一个有用的限制条件。随着时间推进,噪点在更长期的趋势上会消失,到时候所揭示出的结果就可以显示我们对当下情况的理解到底有多可靠。