Name des Datensatzes

Über den Datensatz

Schreiben Sie hier eine kurze (<100 Wörter) Zusammenfassung des historischen, technischen, organisatorischen Hintergrundes der Daten.

Problemstellung

Beschreiben Sie hier, für welches Problem Sie die Daten verwenden möchten. Listen Sie 3 oder mehr Hypothesen, die Sie anhand der Daten überprüfen möchten.

  1. Hypothese 1
  2. Hypothese 2
  3. Hypothese 3

Wert

Formulieren Sie hier, welchen Wert die Erkenntnisse aus Ihrer Analyse haben könnten. Kann man damit bessere Entscheidungen treffen? Ein Problem schneller lösen? Eine dringende Frage beantworten? Eine Empfehlung aussprechen? Achtung: Wert kann man zum Beispiel in Euro, in Gesundheit, in Stückzahlen oder in Zeit messen. So etwas wie “spannende Einblicke” sind per se kein Wert. Idealerweise können Sie den erwarteten Wert Ihrer Analyse konkret beziffern (bevor Sie mit dern Analyse beginnen).

Ursprung der Daten und Zugriff

Beschreiben Sie hier detailliert die Quelle der Daten. Listen Sie alle notwendigen Referenzen, Autoren, Copyright-Owner. Beschreiben Sie historische Entwicklungen der Daten (z.B. Joins mit anderen Quellen) und die Methode der Datenerhebung. Gehen Sie auf alles ein, was einen Einfluss auf die Datenqualität, auf ethisch-regulatorische Fragen oder auf die Hypothesen nehmen könnte. Beschreiben Sie hier auch, mit welcher Technik Sie grundsätzlich auf die Daten zugreifen (z.B. als Code-Snippet).

Datenformat und Struktur

Beschreiben Sie das Format der Daten und alle geplanten Transformationen. Gehen Sie bei veränderlichen Daten hier auch auf ggf. anstehende Aktualisierungen und deren technische Umsetzung ein.

Datenqualität

Fassen Sie hier Ihre Erkenntnisse zur Datenqualität zusammen. Notieren Sie hier alle geplanten Maßnahmen zur Verbesserung der Datenqualität. Notieren Sie ggf. wie sich diese Verbesserungen auf Ihre Hypothesen auswirken.

Ethik

Listen Sie hier alle ethischen, juristischen oder regulatorischen Besonderheiten Ihrer Analyse.