Meinungen

Echtzeitdaten sind kein Allheilmittel

Mehr Daten bedeuten nicht mehr Information. Der Anteil an verwertbaren Informationen nimmt mit zunehmender Frequenz der Datenerfassung oft ab. Ein Kommentar von George Sheldon.

George Sheldon
«Man spricht in der Fachwelt von einem abnehmenden Signal-Rausch-Verhältnis, wobei mit ‹Signal› der Informationsgehalt und mit ‹Rausch› Störungen gemeint sind.»

Das Angebot an Wirtschaftsindikatoren, die in kürzeren zeitlichen Abständen Informationen über die laufende Wirtschaftsentwicklung liefern, hat seit dem Ausbruch der Coronapandemie hierzulande deutlich zugenommen. Zu diesem wachsenden Angebot zählen unter anderem die Erfassung des landesweiten Stromverbrauchs, der geografischen Mobilität der Bevölkerung oder des Volumens an Finanzmarkt- bzw. Debitkartentransaktionen.

Das gestiegene Angebot ist auch auf eine wachsende Nachfrage getroffen, denn Massnahmen zur Bekämpfung der Coronapandemie wie etwa ein Lockdown können zum Teil einschneidende Auswirkungen auf den Gang der Wirtschaft haben, über deren Ausmass im Moment der Intervention Unsicherheit besteht. In einer solchen Situation ist eine vorausschauende Wirtschaftspolitik darauf angewiesen, Angaben über die aktuelle Wirtschaftsentwicklung zu erhalten, damit sie über drohende Wirtschaftseinbrüche rechtzeitig informiert werden, um Gegenmassnahmen einzuleiten.

Die amtliche Statistik kann diese Aufgabe vielfach nicht erfüllen. Angaben etwa über die laufende Entwicklung des schweizerischen Bruttoinlandprodukts (BIP) liegen erst zwei Monate nach Quartalsende vor und gelten zudem lediglich als vorläufig. Das ist viel zu langsam und ungenau, um notfalls schnell reagieren zu können.

Eher Hochfrequenzdaten als Echtzeitdaten

Daten, die in kurzen Zeitabständen wiederholt erfasst werden, werden in der Öffentlichkeit häufig Echtzeitdaten genannt, obwohl es sich eigentlich um keine solchen handelt. Echtzeit bedeutet «laufend» bzw. «im Moment des Geschehens». Dies trifft aber auf die allermeisten sogenannten Echtzeit-Indikatoren nicht zu. Vielmehr handelt es sich lediglich um Daten, die mit einer höheren Frequenz erhoben werden als sonst üblich. Dementsprechend sind solche Echtzeitdaten eher als Hochfrequenzdaten zu bezeichnen. Echtzeitdaten hingegen erheben etwa der Stromzähler daheim im Keller oder ein Handelsticker an der Börse.

Es mag auf den ersten Blick scheinen, dass Wirtschaftsindikatoren mit höherer Frequenz Datenreihen mit niedrigerer Frequenz immer überlegen sein müssen. Mehr Daten in höherer Taktfrequenz müssten doch immer von Vorteil sein. Der Schein kann aber täuschen. Mehr Daten bedeuten nicht immer mehr Information.

Der Anteil an verwertbaren Informationen nimmt nämlich mit zunehmender Frequenz der Datenerfassung oft ab. Man spricht in der Fachwelt von einem abnehmenden Signal-Rausch-Verhältnis, wobei mit «Signal» der Informationsgehalt und mit «Rausch» Störungen gemeint sind. Die Anzahl der Datenpunkte mag durch eine höhere Erhebungsfrequenz zunehmen, aber nicht notwendigerweise die Menge an Information. In diesem Zusammenhang ist bspw. an den landesweiten Stromverbrauch zu denken.

Die Trägheit des Phänomens

Dieser hängt nicht nur vom Gang der Wirtschaft ab, den er angeblich abbildet, sondern auch vom Wetter oder besonderen Ereignissen wie etwa Feiertagen oder Sportveranstaltungen, deren störender Einfluss mit der Erfassungsfrequenz eher zunimmt. Auch Börsendaten sind auf Störeinflüsse anfällig. In diesem Zusammenhang sei an die Beobachtung des Wirtschaftsnobelpreisträgers Paul Samuelson (1915–2009) erinnert, wonach der Aktienmarkt neun der letzten fünf Rezessionen vorhergesagt habe.

Es gibt allerdings Verfahren, um das Rauschen in den Daten zu eliminieren. Diese haben jedoch den Nachteil, dass sie am aktuellen Rand der Daten oft Mühe haben, einmalige Veränderungen von Trendwenden zu unterscheiden. Das liegt daran, dass die Bereinigungsverfahren im Allgemeinen auf gleitenden Durchschnitten aufbauen. Diese mitteln die Werte vor und nach einem sich auf der Zeitachse sukzessiv nach vorne verschiebenden Stichtag. Am aktuellen Rand stehen naturgemäss lediglich Beobachtungen vor dem Stichtag zur Mittelberechnung zur Verfügung. Demzufolge müssen weitere Beobachtungsperioden erst abgewartet werden, um Gewissheit über den tatsächlichen Gang der Dinge zu bekommen. Doch auf diese Weise geht die Aktualität der Hochfrequenzdaten verloren.

Es ist ebenfalls die Trägheit des Phänomens, das es zu erfassen gilt, zu bedenken. Es ist bspw. technisch möglich, die Arbeitslosenquote in der Schweiz täglich zu berechnen. Aber was wäre damit gewonnen? Die meisten Entlassungen und Einstellungen erfolgen um die Monatswende. In der Zeit dazwischen bewegt sich die Arbeitslosenquote kaum. Tägliche Arbeitslosenquoten würden diese Tatsache lediglich bestätigen. Ein Hochfrequenz-Indikator nutzt also wenig, wenn sich das Phänomen, das erfasst werden soll, nicht in mindestens der gleichen Geschwindigkeit verändert.

Das Bild wird verzerrt

Dann ist auch noch zu prüfen, ob die Grösse, die erfasst wird, die aktuelle Situation zutreffend abbildet. Zum Beispiel finden schwer vermittelbare Langzeitarbeitslose verstärkt in den Sommermonaten eine Stelle, wenn die Beschäftigungslage typischerweise günstig ist. Würde man die Arbeitsmarktlage an der vollendeten Dauer der Arbeitslosigkeit derjenigen messen, die wöchentlich aus der Arbeitslosigkeit austreten, bekäme man den Eindruck, dass die Arbeitsmarktlage im Sommer am schlechtesten ist, da die im Sommer verstärkt vermittelten Langzeitarbeitslosen die in dieser Jahreszeit gemessene Durchschnittsdauer anheben.

Die gestiegene Dauer erweckt dabei den Eindruck, dass Arbeitslose im Sommer am längsten nach Arbeit suchen, wenn in Wirklichkeit das Gegenteil zutrifft. Die Verzerrung ergibt sich daraus, dass eine Dauer sich über mehrere vergangene Perioden erstreckt und daher nicht lediglich die Gegenwart abbildet. Darauf hat die Erhebungsfrequenz keinen Einfluss.

Ein zusätzliches Problem entsteht dadurch, dass die meisten Hochfrequenzdaten solche Grössen wie das BIP, die Inflation oder die Arbeitslosigkeit, die im Zentrum des Interesses der Wirtschaftspolitiker stehen, nicht direkt erfassen. Sie erheben diese Grössen bestenfalls indirekt und müssen folglich noch in diese umgewandelt werden. Dazu dienen in der Regel empirisch ermittelte Korrelationen zwischen den Indikatoren und den interessierenden Grössen. Solche Korrelationen können sich aber im Zeitablauf als instabil erweisen. Debitkartentransaktionen sind dazu ein Paradebeispiel. Während der Coronapandemie haben Debitkarten das Bargeld als Zahlungsmittel vom ersten Platz verdrängt. Infolgedessen impliziert eine Erhöhung von Debitkartentransaktionen inzwischen nicht mehr in gleicher Weise einen entsprechenden Anstieg wirtschaftlicher Aktivität.

Prognosequalität fraglich

Schliesslich ist noch von Bedeutung, ob ein Hochfrequenzindikator auch Prognosequalitäten besitzt. Angesichts der Grösse des Zeitraums, der typischerweise benötigt wird, um Politikentscheide zu treffen und umzusetzen, kann eine solche Eigenschaft von grossem praktischen Nutzen sein. So kann sich ein wöchentlich erscheinender Indikator ohne Vorhersagefähigkeiten für politische Entscheidungsträger als weniger nützlich erweisen als beispielsweise ein Indikator, der nur in Monatsabständen vorliegt, aber dafür verlässliche Prognosen liefert.

Als Beispiele können der vom Staatssekretariat für Wirtschaft eingeführte Index zur wöchentlichen Wirtschaftsaktivität (WWA), der – wie der Name sagt – wöchentlich erscheint, und ein von uns an der Uni Basel entwickelter Arbeitsmarktfrühindikator dienen, der lediglich in Monatsabständen vorliegt.

Unsere Untersuchungen haben gezeigt, dass beide Indikatoren mit den laufenden BIP-Quartalswerten gleich stark korrelieren, dass aber der Arbeitsmarktfrühindikator im Gegensatz zum WWA-Index noch über mehrere Quartale hinweg Prognosecharakter besitzt. Schneller und häufiger ist also nicht immer besser.