Dieser Artikel wird regelmäßig aktualisiert.
Alle Grafiken sind auf dem Stand des 30.06.2020, das letzte inhaltliche Update gab es am 03.07.2020.

Einleitung

Die andauernde COVID-19 Pandemie bedarf keiner Erklärung, denn die ganze Welt ist momentan schwer davon betroffen. Die hohe Infektiosität des SARS-CoV-2-Erregers und der potenziell schwere Verlauf der Erkrankung stellt die Gesundheitssysteme weltweit auf eine harte Probe. Um jedoch richtige Schritte zur Eindämmung der Pandemie zu gehen, ist die Analyse der Fallzahlen ein unabdingbarer Schritt.

Viele von uns haben es sich mittlerweile zur Gewohnheit gemacht, mindestens einmal täglich auf den aktuellen Stand der Fallzahlen zu schauen. Die gute Verfügbarkeit der Daten und neuer Visualisierungstechnologien macht es uns möglich, Graphen in kürzester Zeit auf den neusten Stand zu bringen. Vor allem die Daten der Johns Hopkins University und des Robert Koch Institutes werden dafür intensiv verwendet. Auf verschiedenen Plattformen, z.B. Kaggle.com, stehen viele Daten für jedermann zur Verfügung, in der Hoffnung, dass die große weltweite Community an Data Scientists aus den Daten wertvolle Informationen und Vorhersagen generiert.

Wir von der StatSoft Europe GmbH bieten R-Trainings an und haben die jetzt anfallenden Daten ebenfalls genutzt, um Erkenntnisse durch Visualisierung zu erzeugen. Hierfür haben wir die Open-Source Statistiksoftware R verwendet und den hierfür verwendeten Code offengelegt, um interessierten Analysten eine kostenlose Hilfe für die Visualisierung mit R bereitzustellen. Es wurden die Daten der Johns Hopkins University verwendet (heruntergeladen von diesem Kaggle Link). Die Ursprungsdaten, wie sie in Kaggle verwendet werden, stammen aus dem Git Repository der Johns Hopkins University.

An dieser Stelle möchten wir einmal die Chance nutzen, Sie auf verschiedene Hilfsplattformen für die Corona-Krise aufmerksam zu machen. Vielleich sind Sie selbst betroffen oder kennen Personen, die besonders bedroht sind und zur eigenen Sicherheit zu Hause bleiben sollten. Um diesen Menschen zu helfen, wurden viele Hilfsplattformen eingerichtet, um beispielsweise Einkäufe für Betroffene zu übernehmen. Auf dieser Seite gibt es Links zu solchen Hilfsplattformen, bei denen Sie sich als Betroffene oder als potenzielle Helfer registrieren können. Denken Sie bitte auch daran, dass besonders Tierheime in dieser Zeit einen großen Zulauf an Haustieren haben, deren Besitzer aufgrund der Krankheit nicht mehr in der Lage sind, sich um diese zu kümmern. Durch Futter- oder Geldspenden und können Sie diese unterstützen.

Empfohlene Literatur

Für die Datenanalyse und Visualisierung können wir die hervorragenden Bücher R for Data Science sowie Hands on Programming with R von Hadley Wickham und Garret Grolemund wärmstens empfehlen. Beide Autoren sind übrigens auch die Urheber fast aller Pakete, die wir in diesem Projekt benötigen.

Die aktuelle Situation

In diesem Abschnitt möchten wir Ihnen anhand verschiedener Grafiken zeigen, wie sich die COVID-19 Pandemie in der Welt ausbreitet. Der Stand des Datensatzes ist der 30.06.2020. Im nächsten Abschnitt weiter unten zeigen wir dann, wie wir diese Grafiken mit R erzeugt haben.

Weltweit

In der folgenden Grafik sind die bestätigten Fallzahlen aller Staaten, aufgeteilt in akute Erkrankungen, Genesungen und Todesfälle, dargestellt, die am 30.06.2020 mindestens 40000 bestätigte Fälle registriert hatten.

Die folgende Grafik zeigt den Anstieg der bestätigten Fälle auf einer logarithmierten Skala in Abhängigkeit der vergangenen Tage seit dem 100. registrierten Fall. Auf diese Weise lässt sich gut erkennen, wie schnell sich COVID-19 in den entsprechenden Ländern ausgebreitet hat. Es sind nur diejenigen sieben Staaten abgebildet, die bis zum 30.06.2020 die meisten Fälle registriert hatten, sowie Südkorea, die durch ihre schnelle Reaktionszeit und hohe Testzahlen eine starke Eindämmung des Ausbruchs erzielen konnten. Durch die Log-Skala ist es möglich, den Zuwachs an bestätigten Fällen unabhängigkeit von deren Größenordnung zwischen den verschiedenen Ländern zu unterscheiden.

China, Europa und USA

Die folgende Grafik können wir erkennen, wie sich die Fallzahlen in China, Europa, den USA und allen anderen Ländern (Sonstige) entwickelt hat. Es wird deutlich erkennbar, wie schnell China den Ausbruch durch sehr striktes Durchgreifen in den Griff bekommen konnte. Etwa fünf Wochen nachdem die Fallzahlen in China ein Plateau erreicht hatten, waren die Fallzahlen in Europa bereits höher als die in China. Nur zwei weitere Wochen später gab es in Europa bereits fünfmal so viele Fälle wie in China. Die USA zeigen ebenfalls einen rasanten Anstieg, der um etwa eineinhalb Wochen verzögert von Europa stattfindet. Somit sind Europa und die USA die neuen Epizentren der COVID-19 Pandemie.

Die folgende Grafik zeigt den täglichen Zuwachs an Fallzahlen in China, Europa, den USA und in allen anderen Ländern. Hier wird deutlich erkennbar, wie schnell die chinesische Regierung reagiert und zu drastischen Mitteln gegriffen hat, denn schon am 23. Januar wurde mit der Quarantäne von Hubei begonnen, also zu einem Zeitpunkt, als es nur 639 Bestätigte Fälle und 18 Todesfälle in China gab. Dennoch stiegen trotz der Quarantäne die bestätigten Fälle in China auf 83534 an, darunter waren 4634 Todesfälle (Stand 30.06.2020). Das verdeutlicht sehr stark, dass eine starke Einschränkung der Reise- und Bewegungsfreiheit (so schmerzhaft diese auch sein mag) a) die weitere Verbreitung effektiv eindämmen kann, b) eher zu früh als zu spät ausgeführt werden sollte und c) die Kurve nur zeitverzögert abflachen kann.

In Europa wurde am 04.04.2020 der bisher höchste tägliche Zuwachs von 54896 neuen Fällen verzeichnet, in den USA lag der höchste Anstieg bei 45255 Fällen am 26.06.2020. In China lag der höchste Anstieg dagegen bei nur 15133 Fällen am 13.02.2020.

In der folgenden Grafik ist die Summe an akuten Erkrankungen aller hier betrachteten Regionen für den jeweiligen Zeitraum dargestellt, die Breite des farbigen Bandes symbolisert dabei den Anteil der Erkrankungen, die in der jeweiligen Region stattfanden. Zuerst begann die Ausbreitung in China. Diese setzte sich dann in Europa und anderen Ländern weiter fort und ging zeitgleich in China wieder zurück. Etwa zwei Wochen nach dem Ausbruch in Europa breitete sich die Erkankung dann auch in den Vereinigten Staaten aus. Die Vereinigten Staaten sind das Land mit der höchsten Zahl an akuten Erkankungen.

In der folgenden Darstellung sind die bestätigten Fälle, Todesfälle und akuten Erkrankungen für die verschiedenen Regionen am 30.06.2020 dargestellt.

Europa

In der folgenden Grafik sehen wir die bestätigten Fälle aller europäischen Staaten, in denen am 30.03.2020 mindestens 5000 bestätigte Fälle registriert wurden. Die Breite des jeweiligen Bandes zeigt dabei, welcher Anteil an bestätigten Fällen Staaten dem jeweiligen Staat zuzuordnen ist und wie sich dieser Anteil über die Zeit verändert. Daraus wird ersichtlich, dass Italien als erstes Land eine hohe Zahl an bestätigten Fällen registrierte. Wenige Wochen später stiegen dann die Infektionszahlen auch in umliegenden europäischen Staaten stark an. Die meisten Infektionen wurden bis zum 30.06.2020 in Italien, Spanien und Deutschland und Frankreich erfasst.

In der folgenden Grafik sehen wir die Todesfälle aller europäischen Staaten, in denen am 30.03.2020 mindestens 5000 bestätigte Fälle registriert wurden.. Die Zahl der Todesfälle in Deutschland ist verglichen mit der relativ hohen Zahl bestätigter Fälle noch sehr gering.