Datenbeschaffung

Die auf dem AOK-Portal http://www.aok-pflegeheimnavigator.de publizierten Transparenzberichte zu ambulanten Diensten und stationären Einrichtungen wurden seit November 2013 regelmäßig mit einer eigens entwickelten Crawler-Technik abgegriffen. Die so eruierten Daten wurden in einer strukturierten Datenbank abgelegt. Dies ist die Basis der Analysen.

Ergebnis waren x Datensätze zu den ambulanten und 11.133 Datensätze zu den stationären Einrichtungen. Die Datensätze enthalten Post-/E-Mail-Adressen und URLs, die lfd. ID der AOK sowie die Pflegenoten der Fragen 1-82. Ebenso sind die  Durchschnittsnoten aus den Qualitätsbereichen sowie die Gesamtnote und die Durchschnittsnote der Länder enthalten.  Zusätzlich wurden die Daten vom Dienstleister um die Angaben Koordinaten ergänzt.

Seit Juli 2014 stehen weitere 2.000 Datensätze zur Verfügung, wobei hier die Einrichtungen nach der neuen Prüfgrundlage 2014 bewertet wurden. Ein Vergleich mit den „alten“ Daten in der Tiefe ist schwierig, da sich die Frage-Nummern geändert haben und insbesondere die Darstellung der Ergebnisse verändert ist (keine Notenbildung mehr). Beim Bundeslandvergleich wurden wurden die Ergebnisse der 2.000 neuen Transparenzberichte in dieser Analyse mit einbezogen.

Die Daten liegen in excel-Format vor und wurden mit diesem Programm bearbeitet. Die einzelnen Datensätze wurden noch nicht optimiert bzw. verifiziert. D.h. konkret:

  • Ggf. sind doppelte Eintragungen von Heimen vorhanden. Eine stichprobenartige Prüfung hat jedoch ergeben, dass diese Heime tatsächlich „doppelt“ im System vorhanden sind. Der häufigste Fall ist hier die Unterscheidung in Langzeit- und Kurzzeitpflege.
  • Fehlende Daten in den Pflegenoten - Eine stichprobenartige Prüfung lässt die Vermutung zu, dass diese Daten tatsächlich nicht erhoben wurden bzw. erhoben werden konnten, da dieses Kriterium auf das Heim nicht zutraf oder zu wenige Bewohner ausgewählt wurden.
  • Falsch- bzw. Fehlzuordnungen von Bundesländern/Kreisen - Die fehlenden 20 wurden händisch nachgetragen, „falsche“ Schreibweisen wurden nicht an allen Stellen korrigiert.
  • Daten enthalten noch kein Institutionskennzeichen (IK), womit in Zukunft der Datenabgleich neuer Datenlieferungen erschwert ist. Die Recherche hat ergeben, dass man das IK nicht bei der offiziell zuständingen Stelle erhalten kann. Das IK kann ggf. über zwei zusätzliche Spider-Schritte erschlossen werden. Hierfür sind jedoch weitere Ressourcen beim Dienstleister abzurufen. Evtl. gibt es auch die Möglichkeit, sowohl das IK als auch die Pflegenoten über einen der Träger (AOK?) zu beziehen.
  • zusätzliche „Stammdaten“, wie Preislisten, dedizierte Angebote etc. sind nicht abgespidert worden. Hier ergibt sich ggf. durch eine Kooperation die Möglichkeit, die Daten sicher und legal zu beschaffen.
  •  

Diese Punkte erschienen jedoch nicht so erheblich, so dass eine Datenanalyse aufgrund des „unbearbeiteten“ Datenbestands im Bereich der stationären Einrichtungen erfolgt ist.

Anmerkungen:

  • Bei einer neueren Datenlieferung werden einige der Punkte noch einmal genauer geprüft und ggf. Daten korrigiert oder selektiert/eliminiert werden.
  • Für die hier vorliegende Auswertung wurden die Ergebnisse der Bewohnerbefragung (Qualitätsbereich 5) bei der Betrachtung von Einzelthemen zunächst ausgespart.

Inhaltsverzeichnis