Statistiker-Blog

Import von Excel-Daten in SPSS

Eigentlich hatte ich im vergangenen Beitrag für diese Woche etwas zum Thema Geburten und “Youth Bulg” angekündigt. Allerdings habe ich aktuell mal wieder sehr viel Arbeit, was natürlich einerseits gut ist, andererseits aber dazu führt, dass mein Beitrag noch nicht fertig ist. Deshalb gibt es diesmal etwas aus dem Stehsatz, nämlich einen Hintergrund-Beitrag über den Import von Exceldaten in SPSS:

Oft liegen erhobene Daten – beispielsweise bei einer Umfrage-Auswertung – nicht direkt im SPSS-Datenformat .sav vor, sondern als Exceldatei. Sie müssen also für eine SPSS Auswertung zunächst importiert werden. Der Import von Exceldateien in SPSS ist grundsätzlich intuitiv und einfach durchzuführen. Einige Aspekte sollten jedoch zu beachtet werden, damit die importierten Daten im richtigen Format in SPSS angezeigt werden. Grundsätzlich ist nämlich die Qualität der Daten ausschlaggebend für den Erfolg jeder Statistik-Auswertung.

Exceldateien müssen nicht über eine Rekodierungssoftware (z.B. Stattransfer) in SPSS-Dateien konvertiert werden, sondern lassen sich direkt über SPSS einlesen. Vorher sollte die Exceldatei so formatiert werden, dass der Import reibungslos klappt.

Es bietet sich an, die gewünschten Variablennamen in die erste Zeile des Tabellenblatts zu schreiben. Diese werden beim späteren Import auf Wunsch direkt von SPSS übernommen. Das spart spätere Arbeit und erhöht die Übersichtlichkeit sowie Lesbarkeit des neuen Datensets. Ab Zeile 2 folgen die Einträge pro Beobachtung (siehe Abb. 1). Da viele Prozeduren in SPSS besser mit numerischen Werten als mit Worten (sog. „String-Variablen“) funktionieren, sollte im Excelsheet darauf geachtet werden, dass Variablen nach Möglichkeit als Zahl angegeben sind. So ist empfiehlt es sich z.B. für das Geschlecht eines Fragebogenteilnehmers bspw. die Zahlen ‚1‘ für ‚männlich‘ und ‚2‘ für ‚weiblich‘ einzutragen, anstatt das Geschlecht als Text einzufügen. Später können diesen Zahlen in SPSS dann Beschriftungen (sog. „Labels“) zugewiesen werden.

Datensatz Beispiel

Beispiel eines aufbereiten Exceldatensatzes zum Import nach SPSS

 

Gleiches gilt für Angaben zu Datum oder Uhrzeit: Damit für die statistische Auswertung in SPSS das Format direkt übernommen wird, sollte hier sauber mit numerischen Werten gearbeitet werden (siehe Abb. 1). Manche Fragen können nicht numerisch beantwortet werden (sog. ‚offene Fragen‘), z.B. Kommentare oder ‚sonstige‘ Antworten. Diese Felder werden auch von SPSS eingelesen, allerdings als String-Variable.

Weitere Anmerkungen oder erste Berechnungen in Excel unterhalb der Daten sollten gelöscht bzw. auf andere Reiter kopiert werden, damit diese nicht in SPSS eingelesen werden und der Datensatz korrekt abgebildet werden kann.

Nach Aufbereitung des Exceldatensatzes kann dieser nun in SPSS importiert werden. In SPSS geht man dazu über ‚Datei‘, ‚Öffnen‘, ‚Daten‘ auf das Verzeichnis, unter dem die zu importierende Exceldatei abgespeichert wurde. Der Dateityp muss nun auf ‚Excel‘ geändert werden (siehe Abb. 2). Es werden dann alle Exceldateien des Typ .xls, .xlsx und .xlsm im Verzeichnis angezeigt.

Öffnen Excel in SPSS

Öffnen einer Exceldatei mit SPSS

 

Im nächsten Schritt wird angegeben, aus welchem Datenblatt der Exceldatei die Daten eingelesen werden sollen. Ebenso ist hier die Option „Variablennamen aus erstenzeile lesen“ per Standard markiert. Sollte man nicht wie oben beschrieben die Variablennamen in die erste Zeile geschrieben haben, darf diese Option nicht gewählt werden. Mit dem Klick auf „OK“ bestätigt man den Import, und fertig ist der SPSS-Datensatz, der – sollten die Exceldaten korrekt aufbereitet sein – auch direkt die richtigen Variablenformate erkennt (siehe Abb. 3).

 

Variablen- und Datenansicht in Excel

Variablenansicht (oben) und Datenansicht (unten) der importieren Exceldatei in SPSS

 

Posted in Hintergrund

Alter beim ersten Mal

Wir bleiben bei einem etwas weniger ernsten Thema, wobei der statistische Hintergrund, um den es dabei geht, nicht ganz so unernst ist. Es geht nämlich heute um das erste Mal. Ja, genau, um das was den meisten Lesern jetzt vermutlich zuerst in den Sinn kommt: SEX.

Keine Angst, es wird nicht schlüpfrig, weder in Wort noch in Bild. Vielmehr geht es um eine Statistiker von Durex, eines Herstellers von Gummiprodukten zur Ehehygiene (richtig, gemeint sind Kondome). Die könnte man so interpretieren, dass die Deutschen immer früher das erste Mal Geschlechtsverkehr haben

Statistik: Mit wie vielen Jahren hatten Sie erstmals Geschlechtsverkehr? | Statista
Mehr Statistiken finden Sie bei Statista

Das mag vielen plausibel erscheinen, steht aber im Widerspruch zu anderen Untersuchungen, die keine wesentliche Änderung beim Alter zeigen- und es wäre angesichts der neuen Prüderie auch überraschend. Das ist auch kein Wunder, denn die Art und Weise der Befragung lässt einen Vergleich gar nicht zu.

Statistisch geübten Beobachtern wird sofort auffallen, was das große Problem bei der Untersuchung ist. Natürlich kann es in der Gruppe der 18 bis 24-Jährigen niemanden geben, der erst mit 25 sein erstes Mal hatte. Betrachten wir eine Alterskohorte auf ihrer Reise durch die Zeit. Wenn wir sie im Alter von 13 Jahren fragen werden, werden die meisten antworten, sie hätte noch nie Sex gehabt. In die Berechnung des Durchschnitts gehen aber nur die ein, die bereits ihr erstes Mal hinter sich haben – oder das zumindest behaupten, denn wie bereits erwähnt wird bei dem Thema viel gelogen. So oder so wird der Durchschnitt unter 13 Jahren liegen. Wenn die Gruppe älter wird, kommen andere Mitglieder dazu, die dann natürlich alle älter als 13 sind. Und so steigt von Jahr zu Jahr der Schnitt in der Gruppe an.

Ab 40 wird sich vermutlich nicht mehr so viel tun, allerdings erhöhen die, die dann noch kommen, den Schnitt umso deutlicher. Tatsächlich steigt der Schnitt ab der Gruppe der 25 bis 34 Jahre alten Befragten auch kaum noch, die 50 bis 64 Jährigen waren sogar etwas jünger als die 35 bis 49 Jährigen. Der Unterschied ist aber so klein, dass das leicht Zufall sein mag.

Nach einer Untersuchung aus Österreich waren immerhin 12 Prozent der Männer und sechs Prozent der Frauen über 20, als sie das erste Mal Geschlechtsverkehr hatten. Und selbst diese Zahl ist zu niedrig gegriffen, denn laut der Beschriftung wurden hier Jugendliche befragt, wozu man in Österreich ganz offenbar bis zum Alter von 30 Jahren zählt. Auch hier fallen aber alle heraus, die zum Zeitpunkt der Befragung noch keinen Sex hatten.

Statistik: Wie alt waren Sie bei Ihrem ersten Geschlechtsverkehr? | Statista
Mehr Statistiken finden Sie bei Statista

Dieses Problem tritt öfter auf, als man denkt. Ich habe ja schon mal erwähnt, dass das Durchschnittseinkommen sinken kann, wenn die Arbeitslosigkeit sinkt und ehemals Arbeitslose einen Job finden, der aber schlecht bezahlt ist. Ihr persönliches Einkommen steigt zwar, trotzdem sinkt das Durchschnittseinkommen aller Beschäftigten. Gleichzeitig steigt mit einem beginnenden Aufschwung am Arbeitsmarkt auch der Anteil der Langzeitarbeitslosen an allen Arbeitslosen – weil Kurzzeitarbeitslose schneller Arbeit finden als Langzeitarbeitslose und damit die Gesamtzahl der Arbeitslosen schneller sinkt als die der Langzeitarbeitslosen. Aussagekräftiger wäre in dem Fall der Anteil der Langzeitarbeitslosen an den Erwerbspersonen (also Erwerbstätige + Arbeitslose).

Posted in Buntes Tagged with: ,

Reden wir mal wieder vom Wetter

Nach so vielen ernsten Themen reden wir heute mal wieder vom Wetter. Wer nicht gerade Bauer ist oder einen großen Garten hat, der möchte ja vor allem viel Sonnenschein.

Einige würden jetzt hinzufügen: “Viel Sonnenschein und wenig Regen”, allerdings beruht diese Aussage auf dem Irrglauben, dass wenig Regen auch viel Sonnenschein bedeutet. Dass das keineswegs so sein muss, zeigt ein einfaches Gedankenexperiment. Stellen wir uns eine tropische Stadt vor, in der wochenlang die Sonne scheint und dann in der Regenzeit das Wasser literweise vom Himmel herabfällt. Sie hat beides, viel Regen und viel Sonnenschein. Zumindest wenn man, wie es üblich ist, den Niederschlag in Litern pro Quadratmetern misst und nicht in Zeit. Wobei wir uns auch eine Stadt vorstellen können, in der auch die Zahl der Regenstunden niedrig ist, der Himmel aber trotzdem immer bedeckt ist.

Kongo Wald

In tropischen Gegenden gibt es oft beides, viel Regen und viel Sonne. Foto: Irene2005

Der Zusammenhang gilt nicht nur im Vergleich mit tropischen Städten, sondern auch innerhalb Deutschlands. Das zeigen die Daten von fast 400 Wetterstationen aus dem Bestand des Wetterkontors. Dort sind Jahresdurchschnitte für die Jahre 1981 bis 2010 für den Niederschlag, die Zahl der Sonnenstunden und die Temperatur gesammelt.

Betrachten wir zuerst den Januar, auch wenn wir mittlerweile ja schon Februar haben. Tatsächlich korrelieren Niederschlag und Sonnenscheindauer kaum. Die Korrelation ist sogar leicht positiv, das bedeutet, wo es mehr regnet scheint auch öfter die Sonne. Allerdings ist der Zusammenhang so schwach, dass er eigentlich nicht erwähnenswert ist.

Extrembeispiel ist die Zugspitze. Nirgends in Deutschland schien in den Jahren von 1981 bis 2010 im Januar öfter die Sonne – fast 70 Stunden im Durchschnitt. Gleichzeitig regnete es aber auch 182 Liter pro Quadratmeter. Besonders wenig regnete es im Januar in Würzburg, nur 8,8 Liter. Die Zahl der Sonnenstunden lag mit 28 aber nur im Mittelwert. Es gibt aber auch beides, viel Niederschlag und nur mäßigen Sonnenschein, beispielsweise am Brocken mit 117 Litern Niederschlag pro Quadratmeter und 24 Sonnenstunden.

Costa Rica

Nur Sonnenschein und kein Regen – dann wäre es beispielsweise hier in Costa Rica nicht so schön grün. Foto: Arturo Sotillo

Der Brocken und die Zugspitze haben natürlich vor allem deshalb so hohe Niederschlagswerte, weil sich an den beiden Bergen viele Wolken abregnen. Gut kann man das an einer Wetterkarte Bayerns sehen. Die Orte mit den höchsten Niederschlägen liegen alle an den Alpenrändern. Dann kommen ein paar Punkte im Bayerischen Wald und im Fichtelgebirge dazu, wo es ebenfalls Erhebungen von 1.000 Metern und mehr gibt.

Wer jetzt den Sommerurlaub an der Zugspitze buchen will, dem sei gesagt, dass es im August etwas anders aussieht. Da regnet es ebenfalls viel dort, bei den Sonnenstunden muss die Wetterstation am Berg aber ihren Spitzenplatz abgeben.

Dann liegen mit Mühlacker, Öhringen und Rheinfelden am Hochrhein drei Orte aus Baden-Württemberg ganz vorne. Viele Sonnenstunden hat auch die Wetterstation die mit Weißenburg-Ernersheim beschriftet ist, womit vermutlich Weißenburg-Emersheim gemeint ist, ein Ortsteil der Gemeinde Weißenburg in Mittelfranken südlich von Nürnberg.

Wetterdaten

Durchschnittstemperatur in Grad Celsius (rot), Niederschlag in Litern pro Quadratmeter (blau) und Sonnenscheindauer in Stunden (gelb) für ausgewählte Messstationen. Quelle: Wetterkontor.de

Die Durchschnittstemperatur liegt auf der Zugspitze das ganze Jahr über niedrig, im August bei durchschnittlich 4 Grad. Kein Wunder, die Messstation liegt ja ziemlich hoch. Kein Wunder, dass die im August kältesten Orte in der Tabelle der Große Arber im Bayerischen Wald und der Brocken mit rund 12 Grad sind.

Besonders warm ist es dagegen im Südwesten, beispielsweise in Bad Berzabern in der Pfalz oder in Mannheim. Auch Frankfurt am Main liegt ganz vorne. Vielleicht ist das ein Trost für die Londoner Banker die nach dem Brexit fürchten, ihre Jobs könnten nach Frankfurt verlegt werden.

Posted in In eigener Sache

Themen