Mit Unsicherheiten in der Statistik müssen wir umgehen lernen
Wir wünschen uns Sicherheit in unsicheren Zeiten. Die Statistik kann uns diese jedoch nicht immer bieten. Tanja Stadler erkl?rt anhand der von ihr für die Schweiz berechneten Sch?tzung des R-Werts, warum wir auch die statistische Unsch?rfe berücksichtigen müssen.
Steigen die Covid-Infektionszahlen derzeit in der Schweiz exponentiell an oder fallen sie? Und wie schnell verbreiten sich die neuen Virusvarianten im Vergleich zu den alten? Mit statistischen Auswertungen von Daten versuchen wir, diese Fragen zu beantworten. Noch so gerne würden wir Wissenschaftlerinnen und Wissenschaftler sehr klare und eindeutige Antworten liefern. Manchmal ist das m?glich, doch l?ngst nicht immer. Denn wenn es um unser Leben in der realen Welt und um Krankheiten geht, l?uft praktisch nichts genau getaktet.
Welchen Lebensbereich wir uns auch anschauen, wir haben es stets mit Fluktuationen und Variationen zu tun. Unsere Fahrt zur Arbeit dauert nicht immer genau gleich lang, und trotzdem k?nnen wir die Fahrzeit ungef?hr veranschlagen. Oder ein 7-j?hriger Knabe sollte gem?ss Tabelle 1,25 Meter gross sein. Jeder andere Wert zwischen 1,15 und 1,35 Meter liegt aber auch v?llig im Rahmen.
?Ein einzelner Sch?tzer reicht nicht aus, um ein vollst?ndiges Bild der epidemiologischen Situation zu haben.?Tanja Stadler
Die Pandemie ist da keine Ausnahme. Wenn eine mit Sars-CoV-2 infizierte Person im Schnitt eine weitere Person ansteckt, heisst das, das in der Realit?t einige Infizierte mehrere weitere Personen anstecken, andere aber gar keine. Ein weiteres Beispiel ist die Inkubationszeit – die Zeit, die von der Ansteckung mit dem Virus bis zum Ausbruch der ersten Symptome vergeht. Im Schnitt betr?gt diese fünf Tage. In der Realit?t m?gen das bei manchen Patienten drei Tage sein, bei anderen sieben oder acht. Oder die Zahl der Neuansteckungen, welche eine der Hauptgrundlagen unserer Auswertungen sind – auch sie fluktuieren von Tag zu Tag.
Das Unsicherheitsintervall ist zentral
In meiner Gruppe berechnen wir Sch?tzungen zum R-Wert der Corona-Pandemie1. Ist dieser Wert gr?sser als 1, verbreitet sich der Erreger in einer Bev?lkerung exponentiell. Unsere Sch?tzungen berücksichtigen die vorher genannten sowie weitere Fluktuationen. Eine Folge davon ist allerdings, dass unsere Sch?tzungen nie einen pr?zisen Wert liefen, sondern immer einen Sch?tzbereich.
Wir k?nnen zum Beispiel sagen, dass der gesch?tzte R-Wert für die Schweiz derzeit zwischen 0,96 und 1,21 liegt. Diese Aussage ist statistisch belastbar. Den entsprechenden Bereich nennen wir das Unsicherheitsintervall. Zus?tzlich kommunizieren wir einen Wert, der in der Mitte dieses Intervalls liegt. Er ist die beste Sch?tzung für einen Einzelwert – wir nennen das den Punktsch?tzer. Der Punksch?tzer darf aber nicht überinterpretiert werden.
?Gesicherte? Aussage und Trends
Liegt das Unsicherheitsintervall beim R-Wert nicht vollst?ndig unter 1 oder über 1, k?nnen wir die Daten zwar interpretieren, wir k?nnen über eine Tendenz sprechen. Wir k?nnen aber nicht mit statistischer Signifikanz sagen, ob wir uns in einer Phase des exponentiellen Wachstums befinden. Dies bedeutet, dass wir keine ?gesicherte? Aussage machen k?nnen.
Fluktuationen sind pr?gnanter, je weniger Daten wir analysieren. Denn bei einer sehr grossen Datenmenge gleichen sich die existierenden Fluktuationen wieder aus. Je weniger Daten wir analysieren k?nnen, desto gr?sser wird daher der Unsicherheitsbereich. Das sehen wir beispielsweise an den Daten aus kleinen Kantonen. In diesen Kantonen kommen zu wenig Daten zusammen, als dass man damit statistisch erh?rtete Aussagen treffen k?nnte. Die Unsicherheitsintervalle bei unseren Analysen für kleinere Kantonen sind sehr gross.
Ich halte es deshalb für zielführender, auf die sieben Wirtschaftsr?ume (Grossregionen) zu fokussieren. Die Menschen bewegen sich stark innerhalb dieser Regionen. Wenn wir uns diese Regionen anschauen, erkennen wir Trends. Derzeit liegt n?mlich der Punktsch?tzer für R in allen sieben Schweizer Grossregionen über 1. Selbst wenn wir keine abschliessende Aussage zum gesch?tzten R-Wert machen k?nnen, k?nnen wir diese Daten dennoch interpretieren. Die Punktsch?tzer in allen Regionen liefern einen starken Hinweis darauf, dass wir derzeit – leider – in der Schweiz in einem Bereich exponentiellen Wachstums liegen.
Sch?tzung des R-Werts alleine reicht nicht
Die Sch?tzung des R-Wertes kann Hinweise darauf geben, in welche Richtung sich die Pandemie entwickeln k?nnte. Aber wir müssen dafür immer auch den Unsicherheitsbereich berücksichtigen und die Daten vorsichtig interpretieren. Die Sch?tzung des R-Werts sollten wir zudem immer mit weiteren Kenngr?ssen der Pandemie abgleichen, denn ein einzelner Sch?tzer reicht nicht aus, um ein vollst?ndiges Bild der epidemiologischen Situation zu haben.
Wir alle h?tten gerne Sicherheit in diesen unsicheren Zeiten. Die Statistik kann uns die jedoch nicht immer bieten. Es gibt keine M?glichkeit, diese Unsicherheit wegzuzaubern. Sie ist eine direkte Folge davon, dass wir es mit Vorg?ngen in der realen Welt zu tun haben. Wir müssen die Unsicherheit also akzeptieren und als Gesellschaft einen Weg finden damit umzugehen. In unserem Team verfolgen wir das Ziel, basierend auf den verfügbaren Daten Dynamiken zu erkennen, m?gliche Szenarien aufzuzeigen und diese mit Wahrscheinlichkeiten zu beziffern. Wie wir gemeinsam darauf reagieren, ist dann ein Entscheid von Politik und Gesellschaft.
Erg?nzung vom 15.03.2021:
Die Sch?tzung für den R-Wert der Schweiz wird laufend aktualisiert. Zurzeit erstreckt sich der Sch?tzbereich von 1,00 bis 1,26.