Eine wachsende Zahl redaktioneller Anfragen zeigt, wie zentral verlässliche Daten für eine fundierte Berichterstattung geworden sind. Damit Journalistinnen und Journalisten effizient und unabhängig arbeiten können, stellen wir umfassende Datensammlungen, Code-Bausteine und Analysewerkzeuge bereit. Unsere Datenangebote sind dabei so aufgebaut, dass sie Transparenz, Nachvollziehbarkeit und erneute unabhängige Berechnung jederzeit ermöglichen und damit die Qualität datenbasierter Recherchen stärken.
Für den schnellen Einstieg in ausgewählte Datensätze bieten wir auch Dashboards an. Aktuell gibt es Dashboards für folgende Themen:
Unsere Datensammlung auf GitHub bietet Datensätze, Beispielcode sowie Informationen zu Quellen und Lizenzen.
Datenrecherchen im Bereich der Krankenhausversorgung in Deutschland benötigen häufig die gleichen zentralen Datensätze: Eine Liste aller Kliniken in Deutschland und Informationen aus den Qualitätsberichten dieser Kliniken. Die Aufbereitung dieser Daten benötigt viel Zeit. Für die Klinikliste des Instituts für das Entgeltsystem im Krankenhaus (InEK) und die Qualitätsberichte der Krankenhäuser bieten wir Programmcode an, mit dem die Daten einfach eingelesen werden können. Die Code-Basis soll dabei als kollaboratives Projekt gepflegt werden, sodass Redaktionen ihre erweiterte Datenbasis auch mit der Community teilen können. Der Code für die Datensätze zu den Krankenhäusern in Deutschland befindet sich in einem Repositorium auf GitHub.
Wie gut erreichbar ist die nächste Stroke Unit oder Geburtsstation? Was verändert sich durch die Klinikreform in NRW? Wie viele Minuten müssen Bürgerinnen und Bürger im Schnitt zusätzlich zur nächsten Klinik fahren, wenn eine Klinik oder Fachabteilung im Ort schließt? Bei der Gesundheitsversorgung der Bevölkerung spielt die Erreichbarkeit von Krankenhäusern eine wichtige Rolle. Für unsere eigenen Analysen halten wir einen großen Datensatz vor, der die Fahrzeiten aus allen bewohnten 100-mal-100-Meter-Gitterzellen zu den Kliniken in der Umgebung enthält. Diesen Datensatz stellen wir interessierten Journalistinnen und Journalisten bei Bedarf zur Verfügung und unterstützen gern bei der Auswertung. Mithilfe unseres interaktiven Erreichbarkeiten-Tools können auch eigene Szenarien zu Fahrzeiten simuliert werden. Diese datengestützte Recherche kann dabei helfen, politische Entscheidungen zur Gesundheitsversorgung besser zu verstehen oder zu hinterfragen.
Unsere Data Reports enthalten immer einen Link auf das Dokument, das den Programmcode enthält. Durch die Datenbank kann jeder Data Report neu berechnet werden – zum Beispiel anhand neuer Daten oder mit anderen Parametern.
Um unsere Reports neu zu berechnen, ist das von uns bereitgestellte R-Paket SMChelpR notwendig. In diesem Paket befinden sich vorwiegend Funktionen zum einfachen Abruf unserer Datenbank und zur Erzeugung unserer Grafiken.
Kontakt

Lars Koppers
Lab-Leitung Datenwissenschaften, Personal
lars.koppers
+49 221 8888 25-144