Datenbearbeitung
1-3-5 Datenbearbeitung
Mittelwerte, Trends und Glättungen
In diesem Abschnitt werden einfache und grundlegende Arbeitsweisen der Klimatologie angeschnitten. Die Ergebnisse von Klimaanalysen hängen wesentlich von der Art der Bearbeitung der Klimamessdaten ab. Der richtige Gebrauch der häufig zur Anwendung kommenden statistischen Methoden ist Voraussetzung für objektive Aussagen. Die Nachvollziehbarkeit jedes Arbeitsschrittes ist geboten.
Klimatologische Messdaten liegen üblicherweise in Form einer Zeitreihe, bei welcher Messwerte eines Klimaparameters in konstanten Zeitschritten eingetragen sind, vor. Während früher drei Mal pro Tag die Werte händisch vom Instrument abgelesen und aufgezeichnet wurden, werden sie heute üblicherweise im Zehnminutentakt und kürzer automatisch gemessen und registriert.
Monatliche, jahreszeitliche und jährliche Mittelwerte bzw. Summen
Um von dieser hohen zeitlichen Auflösung auf Stunden-, Tages-, Monats- oder Jahreswerte zu kommen, werden Klimaparameter kontinuierlicher Natur (z.B. Lufttemperatur, Luftfeuchtigkeit, relative Sonnenscheindauer, Windgeschwindigkeit) arithmetisch gemittelt, während Klimaparameter diskreter Natur (z.B. Niederschlag, Schneehöhe, absolute Sonnenscheindauer) aufsummiert werden. Jahreszeitenwerte werden durch die (nach der Anzahl der Tage pro Monat gewichtete) Mittelung bzw. Aufsummierung der drei entsprechenden Monatswerte gewonnen: Dezember, Jänner und Februar bilden den Winter, März, April und Mai den Frühling, Juni, Juli und August den Sommer und September, Oktober und November den Herbst. Ob der Dezember dem Winter des Folgejahres oder Jänner und Februar dem Winter des Vorjahres zugerechnet werden, variiert von Studie zu Studie. Die astronomisch definierten Jahreszeiten haben in der Klimatologie keine Bedeutung. Um jahreszeitliche Mittelwerte als geeignetes Gegenstück zu einem bestimmten Klimaproxy zu erhalten, werden oft spezielle (gewichtete) Saisonmittel oder -summen (z.B. April bis August als Vegetationsperiode) berechnet.
Normalperiode
In der Klimatologie wurde eine Normalperiode von 30 Jahren definiert, um langfristige Mittelwerte des Klimas als Bezug (Referenz) für vergleichende Klimaanalysen zu gewinnen. Die Erfahrung lehrt, dass dieser Zeitraum ausreicht, um zwischenjährliche Schwankungen auszugleichen. Die aktuell auf internationaler Ebene verwendete Klimanormalperiode ist 1961–1990. Aus Gründen der zeitlichen Nähe kommt derzeit häufig der Zeitraum 1981–2010, bei der Verfügbarkeit langer, homogener Zeitreihen der Zeitraum 1901–2000 zum Einsatz. Häufig werden Zeitreihen nicht als Absolutwerte sondern als Abweichungen (Anomalien) relativ zu einer dieser Normalperioden ausgedrückt (Abb. 1). Das ermöglicht raum- und zeitübergreifende Vergleiche von Klimaverhältnissen.
Linearer Trend
Zu den am häufigsten verwendeten statistischen Maßzahlen gehört der lineare Trend. Er ist die Steigung aus der einfachen linearen Regression der Werte einer Zeitreihe (Abb. 1). Die zugehörige absolute Änderung wird durch die Multiplikation dieses relativen Trends mit der Zeitreihenlänge ermittelt. Wegen der für das Klima typischen Kurzfrist-Variabilität sind Trends vor allem kürzerer Zeitabschnitte oft zufallsbedingt (statistisch nicht signifikant). Die statistische Signifikanz eines vermuteten Klimatrends muss erst durch statistische Tests belegt werden. Der Bogen reicht dabei vom einfachen Signal-Rausch-Verhältnis, das den Trend in Relation zur Streuung setzt, bis hin zu differenzierteren Methoden, wie dem oft benutzten Mann-Kendall-Test.
Zeitreihenglättung
Durch die in der Klimatologie gern benutzte Zeitreihenglättung erhält man eine Art laufenden Trend, der auch Auskunft über das dem langjährigen Trend überlagerte mittelfristige Verhalten einer Klimareihe gibt (Abb. 1). Man spricht von dekadischen Anomalien, z.B. den warmen Jahren um 1950 oder den kühlen 1960er-Jahren. Bei der so genannten numerischen Tiefpassfilterung werden die langfristigen Schwankungen (tiefe Frequenzen) hervorgehoben und kurzfristigen Schwankungen (hohe Frequenzen) unterdrückt. Zur Filterung wird um einen Zeitreihenwert herum ein Bereich definiert, innerhalb dessen der Wert mit seinem benachbarten Werte gewichtet gemittelt wird. Im Bereich von Klimaänderungsaussagen, kommt zunehmend der LOESS-Filter zur Anwendung. Der LOESS Filter ist ein statistisches Verfahren, das auf gewichteten, gleitenden Mittelwerten basiert. Im Randbereich verschiebt sich das Mittelungsintervall bei gleichbleiben der Breite und die Gewichtung ist nicht mehr symmetrisch. Der Wert des LOESS-Filters besteht darin, dass er den aktuellen starke Temperaturanstieg gut beschreiben kann. Im Falle der Bestimmung des Klimaänderungssignals der Temperatur fiel die Wahl der Filterbreite auf 42 Jahre, weil damit ein 30-jähriges Temperaturmittel, das um das aktuelle Jahr zentriert ist, recht gut angenähert wird.
Der mathematische Filter unterdrückt das kurzfristige (hochfrequente) statistische Rauschen – genauso wie in einer Kaffeemaschine ein Papierfilter nur die feinen Körnchen durchlässt und die groben zurückhält.
Abb. 1: Beispiel eines LOESS-Filters Anomalie der Jahresmitteltemperatur zur vorindustriellen Periode 1850-1900. Dargestellt sind die jährlichen Werte (rot) sowie deren geglätteter Trend (schwarz, 42-jähriger Filterbreite).
Korrelation
Korrelationen zwischen Zeitreihen werden üblicherweise mit einem Pearson-Korrelationskoeffizienten beschrieben. Eine hohe Korrelation deutet auf eine starke Ähnlichkeit der hochfrequenten Variabilität zwischen zwei Zeitreihen. Dieser dimensionslose Index ist an beiden Seiten begrenzt ( -1 - vollständiger gegenläufiger Zusammenhang, 0 - kein Zusammenhang, 1 - vollständiger gleichläufiger Zusammenhang). Ob die untersuchten Reihen tatsächlich ursächlich zusammenhängen, die damit nicht gesagt. Als warnendes Beispiel sei in diesem Zusammenhang an die oft zitierte hohe Korrelation des Rückganges der Geburtenrate mit der Zahl der Störche im Westeuropa der zweiten Hälfte des 20. Jahrhunderts erinnert - ein statistischer, aber sicher kein ursächlicher Zusammenhang.
Dem Verfahren der Homogenisierung von Klimamessdaten ist ein eigener Abschnitt gewidmet. Der Methodenkomplex der Klimamodellierung wird ausführlich behandelt. Zu den zahlreichen weiteren häufig in der Klimaforschung verwendeten statistischen Methoden wie Regressions-, Varianz- und Hauptkomponentenanalyse wird auf die Fachliteratur verwiesen.
Literatur:
Chimani B., Koch R., Tilg A-M, Ganekind M., Günther D., Rohrböck A., Seitner V., Greilinger M., Olefs M. (2024): Bestimmung der aktuellen Klimaerwärmung für Österreich, CCCA Factsheet #50, https://ccca.ac.at/fileadmin/00_DokumenteHauptmenue/02_Klimawissen/FactSheets/50_klimaaerwaermung_oesterr_202412.pdf
Sachs L., Hedderich J. (2006): Angewandte Statistik. 12. Aufl. Berlin, Heidelberg, New York: Springer, 702 Seiten, ISBN 978-3-540-32161-3
Schönwiese C.D. (2006): Praktische Statistik für Meteorologen und Geowissenschaftler. 4. Aufl. Berlin, Stuttgart: Bornträger, 302 Seiten, ISBN 978-3-443-01057-7
von Storch H., Zwiers F.W. (1999): Statistical analysis in climate research. Cambridge: Cambridge University Press, 494 Seiten, ISBN 978-0521450713