Was heißt „Offene Daten“ – „Open Data“?

Unter „Offenen Daten“/ „Open Data“ wird die Öffnung von Datenbeständen im Interesse der Allgemeinheit verstanden. Bei Datenbeständen des öffentlichen Sektors spricht man in diesem Zusammenhang von Open Government Data.

Gegenstand von Open Data können z.B. folgende Verwaltungsdaten sein:

  • statistische Daten (z.B. Einwohnerzahlen, Bevölkerungsstruktur)
  • Daten zu Finanzen und Haushalt
  • Geodaten
  • Daten zu Freizeit und Kultur (z.B. Veranstaltungen, Sehenswürdigkeiten)
  • Daten zur Stadtverwaltung (z.B. Ansprechpartner, Dienstleistungen)
  • Daten zu Umwelt und Klima (z.B. Baumkataster)
  • Soziales (z.B. Jugend, Familie, Senioren)

Ausgeschlossen sind personenbezogene Daten und Informationen, welche durch Offenlegung Risiken für die Sicherheit, Betriebs- oder Geschäftsgeheimnisse darstellen beziehungsweise gegen das Urheber-/ Verwertungsrecht sowie Datenschutzrecht verstoßen.

Die Verwendungsmöglichkeiten für diese Daten sind vielfältig. Neben der Entwicklung von Internetanwendungen oder Apps können die Daten für wissenschaftliche oder kommerzielle Zwecke, im Rahmen des bürgerschaftlichen Engagements und des Unterrichts in Schulen Verwendung finden.

Die Idee Open Data wird zum Beispiel in den 10 Prinzipien zu offenen Regierungsinformationen, herausgegeben von der Sunlight Foundation, sehr gut dargestellt (Link: http://sunlightfoundation.com/policy/documents/ten-open-data-principles/). Diese gelten als „Standard“ für „Open Data“.

  • Vollständigkeit
  • Primärquellen
  • zeitliche Nähe
  • leichter Zugang
  • Maschinenlesbarkeit
  • Diskriminierungsfreiheit
  • Verwendung offener Standards
  • Lizenzierung
  • Dauerhaftigkeit
  • Nutzungskosten

Der Grad der Offenheit von Datensätzen kann anhand des „Fünf-Sterne-Modells“ von Sir Tim Berners-Lee veranschaulicht werden:

  • kein Stern - Daten im Web (Format egal), ohne offene Lizenz
  • * - Daten im Web (Format egal) mit offener Lizenz
  • ** - Daten in strukturiertem Format (z.B. Excel)
  • *** - Daten in strukturiertem, nicht proprietärem Format (z.B. CSV statt Excel)
  • **** - Verwendung von eindeutigen URLs, so dass Datensätze verlinkt werden können
  • ***** - Verlinkung der eigenen Daten mit anderen Daten, um Kontext herzustellen

zitiert nach OGD Weißbuch Österreich (2011); Hg.: M. Kaltenböck, T. Thurner