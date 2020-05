Bild: rbb|24

Corona-Kennzahlen für Berlin - Den R-Wert zu berechnen ist schwierig - auch weil die Lage gut ist

26.05.20 | 19:46 Uhr

Der Senat veröffentlicht R-Werte - rbb|24 und andere kommen in eigenen Berechnungen jedoch teils auf abweichende Zahlen. Das hat weder mit schlechter Mathematik, noch mit Verschwörungen zu tun - sondern vor allem mit niedrigen Fallzahlen. Von Haluka Maier-Borst

"Was der rbb sich da leistet", schreibt ein User. "Sitzen neuerdings medizinische Sachverständige beim rbb?", heißt es von einem anderen. Oder auch: "Traue keiner Statistik, die du nicht selbst gefälscht hast."



Wer hätte vor ein paar Monaten gedacht, dass eine simple Zahl und die Frage, ob sie nun über oder unter 1 liegt, derart die Gemüter erhitzt, wie es die obigen Zitate aus Kommentaren unter rbb|24-Artikeln zeigen. Sie beziehen sich auf den R-Wert - oder besser: unterschiedliche R-Werte. Der R-Wert oder ausgeschrieben Reproduktionswert gibt an, wie viele Infizierte andere Menschen im Schnitt anstecken. Liegt der R-Wert bei 0,9, stecken zehn Infizierte statistisch gesehen neun Leute neu an. Liegt der Wert oberhalb von 1, nimmt die Epidemie wieder Fahrt auf. Bei einem R-Wert von 1,2 zum Beispiel würden zehn Infizierte zwölf neu anstecken - ein Szenario, das es zu vermeiden gilt. Doch unterschiedliche Quellen kommen derzeit auf unterschiedliche R-Werte. Während der Senat den Wert zeitweilig deutlich über 1 taxierte, kommen andere Berechnungen auf niedrigere Werte. Allerdings liegt das nicht daran, dass jemand nicht rechnen kann, willentlich Zahlen zurechtdreht oder glaubt, mal eben Epidemiologie im Schnelldurchlauf studieren zu können: Es geht um statistische Unsicherheiten, verschiedene Methoden und die Art, wie darüber kommuniziert wird. rbb|24 hatte die Gesundheitsverwaltung des Berliner Senats um Auskunft zur Berechnung dieses R-Wertes für Berlin gebeten - bisher aber leider nur spärtliche Antworten auf Anfragen erhalten und keine Möglichkeit bekommen, im Detail darüber zu sprechen. Bei einer eigenen Berechnung müssen wir daher einige Annahmen darüber treffen, wie sich der vom Senat kommunizierte R-Wert genau errechnet. Hier ist das, was wir wissen oder für den Moment zusammenpuzzlen können:

Wie wird der R-Wert grundlegend berechnet?

Zu Wochenbeginn erklärte Gesundheitssenatorin Dilek Kalayci (SPD) im Gesundheitsausschuss, dass das Robert-Koch-Institut (RKI) die Berechnung des R-Werts vornehme und für das Land Berlin zur Verfügung stellt. Ausgehend von dieser Information gehen wir davon aus, dass es sich beim R-Wert für Berlin um den Sieben-Tages-R-Wert handelt, dessen Berechnung das RKI hier erläutert [rki.de]. Die Grundformel, die das Robert-Koch-Institut und auch rbb|24 für die Berechnung nutzen, ist gar nicht so kompliziert: Man nimmt die Zahl der Neuinfektionen innerhalb von vier Tagen und teilt sie durch die Zahl der Neuinfektionen der vier Tage zuvor. Wenn also zum Beispiel es in den letzten vier Tagen 70 Neuinfektionen gab und in den vier Tagen davor 140, dann läge der R-Wert bei 0,5. Allerdings gibt es Wochentagseffekte: Am Wochenende wird immer weniger gemeldet, als unter der Woche. Wenn man also R nur so rechnen würden, hätte man nach dem Wochenende stets einen niedrigeren R-Wert und am Ende der Woche einen höheren. Also berechnet das RKI - und auch rbb|24 - eben den Sieben-Tages-R-Wert. Sprich: Man nimmt den Schnitt der Neuinfektionen der letzten sieben Tage und teilt diesen durch den Schnitt der Neuinfektionen der Tage vier bis elf zuvor. So sieht aktuell das R laut RKI-Berechnungen für Gesamtdeutschland aus.

Welche Fallzahlen nimmt man als Grundlage?

Der entscheidende Unterschied zwischen der simplen rbb|24-Methode zur Berechnung und der RKI-Berechnung ist, welche Fallzahlen als Grundlage benutzt werden. Für seine bundesweiten Berechnungen nimmt das RKI ein Verfahren namens Nowcasting [rki.de] als Grundlage und tut dies wohl auch für Berlin, während rbb|24 die aktuellen Fallzahlen nutzt. Das Nowcasting ist eine Methode, mit der versucht wird, Meldeverzögerungen auszugleichen. Diese können zum einen entstehen, weil es dauert, bis ein Gesundheitsamt einen Test verordnet, dieser ausgewertet wird und in die Statistik einfließt. Zum anderen können Verzögerungen auch entstehen, weil gewisse Altersgruppen einfach erst später ihre Symptome melden, weil sie zum Beispiel nicht so schwerwiegend sind. Um es an einem fiktiven Beispiel zu erklären: So könnte es sein, dass die Daten zeigen, dass von 100 Neuinfizierten zu einem Zeitpunkt im Mittel 40 über 60 Jahre alt sind und vor allem diese Ü60-Erkrankten sich früh melden. Wenn also an einem Tag Meldungen für 20 Fälle für Über-60-Jährige neu reinkommen, dann geht das Modell grob gesagt davon aus, dass draußen noch 30 neue Fälle sind, die aber teilweise noch nicht gemeldet sind. Natürlich schätzt das echte Nowcasting-Modell mithilfe eines viel komplexeren Algorithmus die Fallzahlen ab, aber das ist die grobe Funktionsweise. Und dieses Modell funktioniert bei großen Fallzahlen recht gut.

Wie kommt es zu Schwankungen und wie groß sind die Unsicherheiten?

Was aber passiert im fiktiven Fallbeispiel, wenn in einem Zeitabschnit nur zwei Personen über 60 Jahre gemeldet werden? Dann würde das Model von drei weiteren Fällen, also insgesamt fünf Fällen ausgehen. Und was wenn es stattdessen vier wären? Dann wären es eben auf einmal sechs zusätzliche Fälle - also insgesamt zehn. Solch kleine Schwankungen können dazu führen, dass auf einmal - statt von insgesamt fünf Fällen - zum Beispiel von zehn Fällen ausgegangen wird und der errechnete R-Wert sich bei kleinen Fallzahlen stark verändert. Infizieren fünf Personen fünf weitere Personen liegt R bei 1. Infizieren fünf Leute zehn neue Personen, so liegt R bei 2. Diesen Unsicherheiten trägt nach rbb-Informationen auch das RKI Rechnung. So soll das Konfidenzintervall der letzten drei Tage, in dem sich also R mit 95-prozentiger Wahrscheinlichkeit befand, für Berlin zwischen 0,9 und 1,8 gelegen haben. Und das ist eben nicht die Folge von schlechten Berechnungen, sondern schlicht der Tatsache geschuldet, dass bei kleinen Fallzahlen das Nowcasting und damit die R-Berechnung sehr instabil wird. Nur kommuniziert der Senat bislang diese statistischen Unsicherheiten nicht. rbb|24 nutzt kein Nowcasting und kann entsprechend auch keine Unsicherheiten mit einem 95-Prozent-Intervall angeben. Aber wir zeigen stets die Werte der letzten sieben Tage, um zumindest ein wenig die Unschärfe bei der Berechnung von R darzustellen.

Gibt es auch andere Berechnungen? Was sagt die Wissenschaft zu diesen Unsicherheiten?

Eine Arbeitsgruppe um Michael Meyer-Hermann vom Helmholtz-Zentrum für Infektionsforschung (HZI) in Braunschweig veröffentlicht jeden Tag [hzi.de] R-Berechnungen auf Bundesländerebene und nutzt dabei ein sogenanntes SECIR-Modell. Allerdings stellen die Forscher die Berechnungen erst vier Tage nach dem jeweiligen Tag an, um den Effekt des Meldeverzugs zu minimieren. Für den 23.5. allerdings ging das HZI für einen Wert von 0,89 [gitlab.com] aus und auch das Konfidenzintervall lag unterhalb von 1. Michael Meyer-Hermann wies aber in einem Pressebriefing des Science Media Centers am 7. Mai bereits darauf hin, dass eine solche Modellierung mit zunehmend geringen Fallzahlen schwierig werde. "Das liegt daran, dass wir dann so etwas wie 0,1 Patienten haben. Und das ist eine Sache, die natürlich nicht mehr sinnvoll ist." Auch das RKI hat eingeräumt, dass bei kleinen Fallzahlen die Berechnung schwieriger wird. Dass die R-Werte derart abweichen, ist zudem kein rein deutsches Phänomen. So zeigt sich auch in Großbritannien, dass die Schätzungen des Werts zwischen dem Modell der Universität Cambridge und dem Imperial College London [ft.com] sehr weit auseinandergehen. Insgesamt lässt sich sagen, dass bei kleinen Fallzahlen die Unsicherheiten sehr groß werden. Ein R-Wert über 1 sollte bei kleinen Fallzahlen entsprechend nicht zur großen Panik führen - ein R-Wert knapp unter 1 aber auch nicht zum Gefühl von großer Sicherheit.