Dieser Artikel von Wikipedia ist u.U. veraltet. Die neue Version gibt es hier. Die Aufbereitung stellt der dritte Prozess einer Statistik dar der nach der Datengewinnung abläuft. Wesentliches Ziel der Aufbereitung ist Bereitstellung auswertbarer (teil-)plausibler Datenbestände für die nachfolgende
Die Aufbereitung kann mit der Umwandlung Angaben aus den Fragebogen in Rohdaten durch ein Einscannen von mit Texterkennungsverfahren oder durch eine Datenerfassung beginnen. wesentliche Aktivitäten der Aufbereitung stellen dar:
die Codierung von offenen Angaben wie Berufsbezeichnungen in auswertbare Codierziffern
die Erkennung von Fehlern mit Hilfe Plausibilitätsprüfungen in vorliegenden Rohdaten und ihre manuelle (Datenbereinigung Korrekturen) oder computergestützte Beseitigung
ggf. das Ersetzen von fehlenden Angaben Hilfe von anspruchsvollen mathematisch-statistischen Imputationsmethoden
ggf. das Zusammenfassen von Daten zu Merkmalen/Variablen (Typisierungen Merkmalszusammenfassungen) die häufig für nachfolgende benötigt werden (z.B. Erstellung der Variable "Familientyp" den Angaben über die Familienmitglieder) und
die Berechnung von Hochrechnungsfaktoren (nur bei
Die eingangs erwähnte Umwandlung der Angaben durch den Einsatz elektronischer Fragebogen entfallen. Im Idealfall sollte die Umwandlung Rahmen der Datengewinnung stattfinden weil dabei in der Regel Vollständigkeits- und Vollzähligkeitskontrollen durchgeführt werden.
Die genannten Aktivitäten zeigen dass die im Wesentlichen die Genauigkeit statistischer Daten zu der Aktualität der Ergebnisse fördert (Trade-off zwischen und Genauigkeit). Eine wesentliche Aufgabe des Statistikers daher die Klärung der Genauigkeits- und Aktualitätsanforderungen Nutzer. Der Konflikt kann durch die Bereitstellung vorläufigen Ergebnissen gelöst werden. Vorläufige Ergebnisse sind der Regel aktueller aber dafür auch fehlerhafter. und der Einsatz von Imputationsmethoden können entfallen die Angaben möglichst plausibel und mit Hilfe elektronischen Fragebogen gewonnen werden können.