Name des Datensatzes
Über den Datensatz
Schreiben Sie hier eine kurze (<100 Wörter) Zusammenfassung des historischen, technischen, organisatorischen Hintergrundes der Daten.
Problemstellung
Beschreiben Sie hier, für welches Problem Sie die Daten verwenden möchten. Listen Sie 3 oder mehr Hypothesen, die Sie anhand der Daten überprüfen möchten.
- Hypothese 1
- Hypothese 2
- Hypothese 3
- …
Wert
Formulieren Sie hier, welchen Wert die Erkenntnisse aus Ihrer Analyse haben könnten. Kann man damit bessere Entscheidungen treffen? Ein Problem schneller lösen? Eine dringende Frage beantworten? Eine Empfehlung aussprechen? Achtung: Wert kann man zum Beispiel in Euro, in Gesundheit, in Stückzahlen oder in Zeit messen. So etwas wie “spannende Einblicke” sind per se kein Wert. Idealerweise können Sie den erwarteten Wert Ihrer Analyse konkret beziffern (bevor Sie mit dern Analyse beginnen).
Ursprung der Daten und Zugriff
Beschreiben Sie hier detailliert die Quelle der Daten. Listen Sie alle notwendigen Referenzen, Autoren, Copyright-Owner. Beschreiben Sie historische Entwicklungen der Daten (z.B. Joins mit anderen Quellen) und die Methode der Datenerhebung. Gehen Sie auf alles ein, was einen Einfluss auf die Datenqualität, auf ethisch-regulatorische Fragen oder auf die Hypothesen nehmen könnte. Beschreiben Sie hier auch, mit welcher Technik Sie grundsätzlich auf die Daten zugreifen (z.B. als Code-Snippet).
Datenformat und Struktur
Beschreiben Sie das Format der Daten und alle geplanten Transformationen. Gehen Sie bei veränderlichen Daten hier auch auf ggf. anstehende Aktualisierungen und deren technische Umsetzung ein.
Datenqualität
Fassen Sie hier Ihre Erkenntnisse zur Datenqualität zusammen. Notieren Sie hier alle geplanten Maßnahmen zur Verbesserung der Datenqualität. Notieren Sie ggf. wie sich diese Verbesserungen auf Ihre Hypothesen auswirken.
Ethik
Listen Sie hier alle ethischen, juristischen oder regulatorischen Besonderheiten Ihrer Analyse.