22,99 €
Statistische Analyse statt Datenchaos
Ob Kundendaten Oder Absatzzahlen, Umfrageergebnisse oder wissenschaftliche Studien - große Datenmengen lassen sich am besten mit SPSS untersuchen, dem am häufigsten eingesetzten Softwaretool zur statistischen Datenanalyse. Mit »SPSS 24 für Dummies« erhalten Sie eine unterhaltsam geschriebene und zugleich sehr fundierte Einführung in dieses mächtige Programm. Werten Sie Daten professionell aus, kommen Sie auf dieser Basis zu belastbaren Ergebnissen, die Grundlage für Ihre Entscheidungen sein können, und machen Sie so umfangreiche Datenmengen zu wichtigen Informationsquellen.
Sie erfahren
Sie lesen das E-Book in den Legimi-Apps auf:
Seitenzahl: 543
Veröffentlichungsjahr: 2017
SPSS 24 für Dummies
Schummelseite
Die wichtigsten Eigenschaften von Variablen
Variablen werden in der Statistik nach den unterschiedlichsten Eigenschaften charakterisiert. So sprechen irgendwie immer alle vom Skalenniveau, von nominal‐, ordinal‐ oder intervallskalierten Variablen, stetigen und kategorialen oder numerischen und Textvariablen. Damit Sie bei diesen ganzen Begriffen nicht genauso leicht durcheinanderkommen wie ich, finden Sie hier eine kleine Übersicht zum Nachschlagen.
Skalenniveau. Das Skalenniveau (auch Messniveau) einer Variablen sagt etwas über die Abstufungsmöglichkeiten und numerische Genauigkeit der in der Variablen enthaltenen Werte aus. Dabei wird im Wesentlichen unterschieden, ob die Werte in einer Variablen lediglich Namen oder qualitative Bezeichnungen darstellen, eine Einordnung in einer Rangfolge zulassen oder ob es sich um präzise quantifizierbare Messwerte handelt.
Nominalskala. In einer nominalskalierten Variablen stellen die Variablenwerte lediglich Kategorien dar, die sich nicht in einer natürlichen Reihenfolge ordnen lassen. Typische Beispiele sind Namen, Ortsbezeichnungen, Farben, Berufsbezeichnungen und so weiter.
Ordinalskala. Eine ordinalskalierte Variable enthält Werte, die sich zwar in einer natürlichen Reihenfolge ordnen lassen, bei der aber die Abstände zwischen den einzelnen Werten nicht messbar oder quantifizierbar sind. Dies gilt zum Beispiel für Kategorien wie klein, mittel und groß oder Einstufungen wie sehr schlecht, schlecht, zufriedenstellend, gut, sehr gut.
Intervallskala. Lassen sich die in einer Variablen enthaltenen Werte nicht nur in einer natürlichen Reihenfolge ordnen, sondern können auch die Abstände zwischen den Werten gemessen werden, dann hat die Variable Intervallskalenniveau. Dies ist zum Beispiel bei Altersangaben der Fall (wenn das Alter in Jahren und nicht in Altersklassen angegeben ist), ebenso bei Angaben zu Einkommen, Umsatz oder Gewinn, Gewichts‐ oder Längenmessungen und so weiter.
Stetige Variable. Eine stetige Variable ist, etwas vereinfacht gesagt, eine Variable mit Intervallskalenniveau. Eine solche Variable kann typischerweise viele verschiedene Werte annehmen. Denken Sie zum Beispiel an eine Variable mit Angaben zum Einkommen von Personen, die jeden Wert zwischen 0 und vielen Millionen enthalten kann.
Kategoriale Variable. Kategoriale Variablen enthalten typischerweise nur eine überschaubare Anzahl an unterschiedlichen Werten, die eben verschiedene Kategorien beschreiben. Dies können zum Beispiel Alterskategorien (jung, mittel, alt) oder Einstufungen der Art gut, mittel, schlecht sein. Kategoriale Variablen haben Nominal‐ oder Ordinalskalenniveau.
Numerische Variable. Eine numerische Variable enthält Zahlenwerte wie 1, 2, 3, 10.698 oder 17,234. Die Tatsache, dass eine Variable Zahlenwerte enthält, sagt dabei zunächst nichts über das Skalenniveau einer Variablen aus. Auch eine numerische Variable kann nominalskaliert sein, wenn zum Beispiel die Zahlen lediglich Kodierungen für Namen darstellen. So werden zum Beispiel Angaben zum Geschlecht sehr häufig nicht als Text in der Form Frau und Mann abgespeichert, sondern als numerische Kodierungen 0 und 1.
Textvariable. Eine Textvariable enthält – man könnte es sich fast denken – Text. Ähnlich wie bei numerischen Variablen sagt dies zunächst nur etwas darüber aus, in welcher Form die Daten in der Variablen gespeichert werden, und ist nahezu unabhängig vom Skalenniveau – auch wenn es kaum sinnvoll möglich ist, eine Variable mit Intervallskalenniveau als Textvariable anzulegen.
WILEY‐VCH Verlag GmbH & Co. KGaA
SPSS 24 für Dummies
Bibliografische Information der Deutschen Nationalbibliothek
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d‐nb.de abrufbar.
1. Auflage 2017
© 2017 WILEY‐VCH Verlag GmbH & Co. KGaA, Weinheim
All rights reserved including the right of reproduction in whole or in part in any form. This translation published by arrangement with John Wiley and Sons, Inc.
Alle Rechte vorbehalten inklusive des Rechtes auf Reproduktion im Ganzen oder in Teilen und in jeglicher Form. Diese Übersetzung wird mit Genehmigung von John Wiley and Sons, Inc. publiziert.
Wiley, the Wiley logo, Für Dummies, the Dummies Man logo, and related trademarks and trade dress are trademarks or registered trademarks of John Wiley & Sons, Inc. and/or its affiliates, in the United States and other countries. Used by permission.
Wiley, die Bezeichnung »Für Dummies«, das Dummies‐Mann‐Logo und darauf bezogene Gestaltungen sind Marken oder eingetragene Marken von John Wiley & Sons, Inc., USA, Deutschland und in anderen Ländern.
Das vorliegende Werk wurde sorgfältig erarbeitet. Dennoch übernehmen Autoren und Verlag für die Richtigkeit von Angaben, Hinweisen und Ratschlägen sowie eventuelle Druckfehler keine Haftung.
Coverfoto: © tostphoto/fotolia
Korrektur: Isolde Kommer
Satz/ePub: Reemers Publishing Services GmbH, Krefeld
Print ISBN: 978‐3‐527‐71406‐3
ePub ISBN: 978‐3‐527‐81304‐9
mobi ISBN: 978‐3‐527‐81305‐6
Kapitel 1
Abbildung 1.1: Antwortkarte aus einer fiktiven Kundenbefragung
Abbildung 1.2: Windows‐Oberfläche mit dem Icon von SPSS zum Starten des Programms
Abbildung 1.3: Erster Bildschirm nach dem Start von SPSS – hier ohne Begrüßungs‐Dialogfeld
Abbildung 1.4: Leere Datendatei in der Variablenansicht
Abbildung 1.5: Datendatei in der Variablenansicht mit acht definierten Variablen
Abbildung 1.6: Ein Klick auf die Schaltfläche öffnet das Dialogfeld zur Auswahl des Datentyps.
Abbildung 1.7: Dialogfeld zur Auswahl des Datentyps
Abbildung 1.8: Datentyp für eine Textvariable mit maximaler Zeichenlänge von 16
Abbildung 1.9: Darstellung der Variablen nach Änderung des Datentyps
Abbildung 1.10: Datentyp für eine Datumsanzeige in der Form
Abbildung 1.11: Darstellung der Variablen , und mit neuem Datentyp
Abbildung 1.13: Datendatei in der Variablenansicht mit allen acht fertig definierten Variablen
Abbildung 1.12: Festlegen von Wertelabels für die zwei Kodierungen und
Abbildung 1.14: Datendatei in der Datenansicht nach dem Anlegen von acht Variablen
Abbildung 1.15: Erste Antwortkarte aus der Kundenbefragung
Abbildung 1.16: Datendatei nach der Eingabe des ersten Wertes in der Variablen
Abbildung 1.17: Datendatei nach der Eingabe aller Daten der ersten Antwortkarte
Abbildung 1.18: Datendatei mit 20 Fällen und den Daten von 20 Antwortkarten
Abbildung 1.19: Dialogfeld des Befehls zum Speichern der Datendatei
Abbildung 1.20: Dialogfeld des Befehls zum Berechnen von neuen Variablenwerten
Abbildung 1.21: Datendatei mit der neu berechneten Variablen
Abbildung 1.22: Dialogfeld des Befehls zum Erstellen von Häufigkeitstabellen
Abbildung 1.23: Dialogfeld der Schaltfläche ; hier können statistische Kennzahlen zur Ergänzung der Häufigkeitstabelle angefordert werden.
Abbildung 1.24: Ausgabedatei mit statistischen Kennzahlen und einer Häufigkeitstabelle
Abbildung 1.25: Dialogfeld zum Auswählen zwischen verschiedenen Arten von Balkendiagrammen
Abbildung 1.26: Dialogfeld zum Erstellen eines einfachen Balkendiagramms
Abbildung 1.27: Ausgabedatei mit dem Balkendiagramm für die Häufigkeitsverteilung der Variablen
Abbildung 1.28: Dialogfeld zum Speichern der Ausgabedatei
Abbildung 1.29: Frage nach dem Speichern von Dateien beim Beenden von SPSS
Kapitel 2
Abbildung 2.1: SPSS mit drei gleichzeitig geöffneten Dateien
Abbildung 2.2: Eine Datendatei in SPSS
Abbildung 2.3: Eine Ausgabedatei mit ersten Ergebnissen in SPSS
Abbildung 2.4: Diagramm‐Editor von SPSS
Abbildung 2.5: Dialogfeld zum Öffnen einer Datendatei
Abbildung 2.6: Dialogfeld des Befehls zum erstmaligen Speichern einer Datei
Abbildung 2.7: Fenster der Online‐Hilfe von SPSS
Kapitel 3
Abbildung 3.1: Erste Seite eines Fragenkatalogs aus einer »halb‐fiktiven« Befragung im Rahmen einer nationalen Sozialstudie
Abbildung 3.2: Datendatei in SPSS mit den Daten, die mit dem Fragenkatalog aus Abbildung erhoben wurden
Abbildung 3.3: Datendatei in der Variablenansicht mit beschreibenden Informationen über Variablen und Kodierungen
Abbildung 3.4: Datendatei in der Variablenansicht nach der Festlegung des ersten Variablennamens
Abbildung 3.5: Dialogfeld zum Festlegen des Datentyps – hier mit dem Datentyp
Abbildung 3.6: Dialogfeld zum Festlegen des Datentyps – hier mit dem Datentyp
Abbildung 3.7: Dialogfeld zum Festlegen des Datentyps – hier mit dem Datentyp
Abbildung 3.8: Datendatei in der Variablenansicht – für die Variable ist eine Beschriftung angegeben.
Abbildung 3.9: Dialogfeld zum Festlegen von Wertbeschriftungen – hier während die fünfte Beschriftung definiert wird
Abbildung 3.10: Dialogfeld zum Definieren von fehlenden Werten
Abbildung 3.11: Datendatei mit vielen Variablen, aber ohne Werte in der Datenansicht
Abbildung 3.12: Datendatei in der Datenansicht mit zahlreichen systemdefinierten fehlenden Werten
Abbildung 3.13: Dialogfeld zum Öffnen einer Datendatei – hier der Beispieldatei von SPSS
Abbildung 3.14: Beispieldatei von SPSS in der Datenansicht ohne und mit Anzeige von Wertbeschriftungen
Abbildung 3.15: Dialogfeld zum Suchen nach einem Wert in der Datendatei
Abbildung 3.16: Dialogfeld zum Suchen und Ersetzen von Werten in der Datendatei
Kapitel 4
Abbildung 4.1: Dialogfeld des Befehls zum Berechnen neuer Variablen
Abbildung 4.2: Einfache Datendatei mit einigen fiktiven Kundendaten
Abbildung 4.3: Dialogfeld zum Berechnen neuer Variablen mit einer einfachen Berechnungsformel
Abbildung 4.4: Datendatei mit Kundendaten und neu berechneter Variable
Abbildung 4.5: Datendatei mit Kundendaten und mehreren neu berechneten Variablen
Abbildung 4.6: Dialogfeld zum Formulieren einer Bedingung, die die Berechnung neuer Variablenwerte auf ausgewählte Fälle der Datendatei beschränkt
Abbildung 4.7: Datendatei mit Kundendaten und der nur für ausgewählte Fälle berechneten Variablen
Abbildung 4.8: Dialogfeld zum Umkodieren von Variablen
Abbildung 4.9: Dialogfeld zur Beschreibung der Umkodierungsregeln
Abbildung 4.10: Datendatei mit umkodierten Werten der Variablen in der neuen Variablen
Abbildung 4.11: Dialogfeld des Befehls
Abbildung 4.12: Dialogfeld zum Festlegen der zu zählenden Werte
Abbildung 4.13: Datendatei mit dem Ergebnis einer Zählung über Variablen hinweg
Kapitel 5
Abbildung 5.1: Dialogfeld des Befehls
Abbildung 5.2: Dialogfeld zur Beschreibung der Zufallsstichprobe
Abbildung 5.3: Datendatei mit deaktivierten Datensätzen
Abbildung 5.4: Dialogfeld zur Formulierung der Bedingung für die Auswahl der Fälle
Abbildung 5.5: Datendatei mit der Variablen für eine mögliche Gewichtung der Fälle
Abbildung 5.6: Dialogfeld des Befehls zum Gewichten der Fälle in der Datendatei
Abbildung 5.7: Dialogfeld des Befehls
Kapitel 6
Abbildung 6.1: Excel‐Datei mit Daten, die in SPSS eingelesen werden sollen
Abbildung 6.2: Dialogfeld zum Öffnen einer Datendatei – hier zum Einlesen von Daten aus Excel‐Dateien
Abbildung 6.3: Dialogfeld zur Beschreibung des Datenbereichs, der aus der Excel‐Tabelle gelesen wird
Abbildung 6.4: SPSS‐Datendatei mit den aus der Excel‐Tabelle eingelesenen Daten
Abbildung 6.5: Textdatei mit Daten in drei Varianten: mit fester Spaltenbreite (oben), mit Tabulatoren als Trennzeichen (Mitte) und mit Semikolons als Trennzeichen (unten)
Abbildung 6.6: Schritt 2 des Assistenten zum Einlesen von Textdateien
Abbildung 6.7: Schritt 4 des Assistenten zum Einlesen von Textdateien – unterschiedlich für Dateien mit Trennzeichen und solche mit fester Spaltenbreite
Abbildung 6.8: Dialogfeld des Befehls – hier zum Speichern von Daten als Excel‐Datei
Kapitel 7
Abbildung 7.1: Zwei Datendateien mit gleichartigen Daten, die in einer Datei zusammengeführt werden können
Abbildung 7.2: Datendatei, in der die Fälle der beiden Dateien aus Abbildung zusammengeführt wurden
Abbildung 7.3: Erstes Dialogfeld zum Zusammenführen der Fälle aus zwei Dateien
Abbildung 7.4: Dialogfeld zum Zusammenstellen der Variablenpaare in verschiedenen Bearbeitungsstufen
Abbildung 7.5: Zwei Datendateien mit Informationen über die gleichen Fälle (hier Personen), die in einer Datei zusammengeführt werden können
Abbildung 7.6: Zwei mögliche Ergebnisse des Zusammenfügens der Variablen aus den beiden Dateien aus Abbildung
Abbildung 7.7: Erstes Dialogfeld zum Zusammenfügen der Variablen aus zwei Dateien
Abbildung 7.8: Dialogfeld zur Auswahl der Variablen und Angabe der Schlüsselvariablen
Kapitel 8
Abbildung 8.1: Dialogfeld der Prozedur
Abbildung 8.2: Dialogfeld zum Auswählen der zu berechnenden Kennzahlen
Abbildung 8.3: Kennzahlen für die Variable (täglicher TV‐Konsum in Stunden)
Abbildung 8.4: Dialogfeld der Prozedur
Abbildung 8.5: Dialogfeld zum Auswählen der zu berechnenden Kennzahlen
Abbildung 8.6: Kennzahlen für die Variable (täglicher TV‐Konsum in Stunden) getrennt für Männer und Frauen
Abbildung 8.7: Dialogfeld zum Auswählen der zu erstellenden Diagramme
Abbildung 8.8: Boxplots mit der Verteilung des durchschnittlichen TV‐Konsums pro Tag getrennt für Männer und Frauen
Abbildung 8.9: Bedeutung der Elemente eines Boxplot‐Diagramms
Kapitel 9
Abbildung 9.1: Dialogfeld der Prozedur
Abbildung 9.2: Histogramm für die Variable mit Normalverteilungskurve als Vergleichsmaßstab
Abbildung 9.3: Diagramm‐Editor mit einem zur Bearbeitung geöffneten Histogramm
Abbildung 9.4: Dialogfeld der Prozedur
Abbildung 9.5: Dialogfeld zum Auswählen der Diagramme – hier für ein Normalverteilungsdiagramm
Abbildung 9.6: Ergebnis eines Normalverteilungstests für die Variable
Abbildung 9.7: Dialogfeld zum Auswählen der zu berechnenden Kennzahlen
Abbildung 9.8: Schiefe, Kurtosis und weitere Kennzahlen für die Variable
Kapitel 10
Abbildung 1.1: Dialogfeld zum Erstellen einer Häufigkeitstabelle
Abbildung 1.2: Häufigkeitstabelle für die Variable
Abbildung 1.3: Dialogfeld zum Anfordern eines Diagramms zu einer Häufigkeitstabelle
Abbildung 1.4: Balkendiagramm für die Häufigkeitsverteilung der Variablen
Abbildung 1.5: Balkendiagramm zur Bearbeitung im Diagramm‐Editor geöffnet
Abbildung 1.6: Kreisdiagramm mit der Häufigkeitsverteilung der Variablen
Abbildung 1.7: Kreisdiagramm im Diagramm‐Editor mit eingefügten und formatierten Beschriftungen der Tortenstücke
Abbildung 1.8: Kreisdiagramm im Diagramm‐Editor mit einer ausgeblendeten Kategorie
Abbildung 1.9: Kreisdiagramm mit einem hervorgehobenen Segment
Abbildung 1.10: Dialogfeld zum Erstellen eines Pareto‐Diagramms
Abbildung 1.11: Pareto‐Diagramm für die Variable (politische Selbsteinschätzung)
Abbildung 1.12: Pareto‐Diagramm im Diagramm‐Editor mit neu sortierter Kategorienreihenfolge
Kapitel 11
Abbildung 11.1: Dialogfeld zum Erstellen einer Kreuztabelle
Abbildung 11.2: Kreuztabelle für die Variablen und (Schulabschluss)
Abbildung 11.3: Dialogfeld zum Anfordern zusätzlicher Inhalte für die Kreuztabelle
Abbildung 11.4: Kreuztabelle mit beobachteten und erwarteten Häufigkeiten sowie Spaltenprozenten
Abbildung 11.5: Dialogfeld zum Anfordern von Statistiken wie einen Chi‐Quadrat‐Test für Kreuztabellen
Abbildung 11.6: Ergebnis eines Chi‐Quadrat‐Tests für die Variablen und
Abbildung 11.7: Kreuztabelle für die Variablen und mit der Kontrollvariablen
Abbildung 11.8: Chi‐Quadrat‐Test für die Variablen und – getrennt für Männer und Frauen
Kapitel 12
Abbildung 12.1: Dialogfeld des Befehls
Abbildung 12.2: Durchschnittlicher täglicher TV‐Konsum in Stunden von verheirateten und unverheirateten Personen
Abbildung 12.3: Dialogfeld zum Durchführen eines T‐Tests bei einer Stichprobe
Abbildung 12.4: Dialogfeld zur Festlegung der Wahrscheinlichkeit für das Konfidenzintervall des Mittelwertes
Abbildung 12.5: Ergebnis des T‐Tests bei einer Stichprobe für die Variable mit dem Testwert 2,75
Abbildung 12.6: Dialogfeld zum Durchführen eines T‐Tests bei unabhängigen Stichproben
Abbildung 12.7: Dialogfeld zum Definieren der beiden Fallgruppen für den T‐Test bei unabhängigen Stichproben
Abbildung 12.8: Ergebnis des T‐Tests bei unabhängigen Stichproben
Abbildung 12.9: Dialogfeld zum Durchführen eines T‐Tests bei verbundenen Stichproben
Abbildung 12.10: Ergebnisse des T‐Tests bei verbundenen Stichproben
Kapitel 13
Abbildung 13.1: Dialogfeld des Befehls
Abbildung 13.2: Dialogfeld für zusätzlichen Output zur Varianzanalyse
Abbildung 13.3: Ergänzender Output der einfaktoriellen Varianzanalyse
Abbildung 13.4: Zentrales Ergebnis der einfaktoriellen Varianzanalyse
Abbildung 13.5: Dialogfeld zum Anfordern von Mehrfachvergleichstests
Abbildung 13.6: Mehrfachvergleichstests für alle Fallgruppen‐Paare
Kapitel 14
Abbildung 14.1: Dialogfeld zum Erstellen eines einfachen Streudiagramms
Abbildung 14.2: Streudiagramm für die Variablen und
Abbildung 14.3: Dialogfeld zur Berechnung von Korrelationskoeffizienten
Abbildung 14.4: Tabelle mit Korrelationskoeffizienten für drei Variablen
Kapitel 15
Abbildung 15.1: Dialogfeld zum Durchführen einer Regressionsanalyse
Abbildung 15.2: Optionen für die Regressionsanalyse; hier können Sie die Konstante aus dem Modell ausschließen
Abbildung 15.3: Ergebnis der Regressionsanalyse
Abbildung 15.4: Dialogfeld zum Erstellen von Variablen mit Ergebniswerten
Abbildung 15.5: Dialogfeld zum Erstellen des Streudiagramms
Abbildung 15.6: Streudiagramm mit den vorhergesagten (predicted) und den tatsächlichen Werten der Lebenserwartung
Kapitel 16
Abbildung 16.1: Dialogfeld zum Durchführen einer Clusteranalyse
Abbildung 16.2: Zusätzliche Optionen für die Clusteranalyse
Abbildung 16.3: Ergebnisse der Clusteranalyse für 109 Länder dieser Erde
Abbildung 16.4: Auszug aus der Fallzuordnungstabelle mit den Cluster‐Zuordnungen der einzelnen Länder
Kapitel 17
Abbildung 17.1: Dialogfeld zur Beschreibung der Struktur der in einem Balkendiagramm darzustellenden Daten
Abbildung 17.2: Dialogfeld zum Erstellen eines gruppierten Balkendiagramms für die Auswertung von Kategorien einer Variablen
Abbildung 17.3: Gruppiertes Balkendiagramm in der Ausgabedatei
Abbildung 17.4: Balkendiagramm zur Bearbeitung im Diagramm‐Editor geöffnet
Abbildung 17.5: Die Elemente eines Diagramms können auf verschiedenen Ebenen markiert werden.
Abbildung 17.6: Um ein Element zu verschieben, ziehen Sie es mit der Maus an seiner Rahmenlinie an die gewünschte neue Position; um die Größe zu ändern, ziehen Sie Ziehpunkte der Rahmenlinie nach innen oder außen.
Abbildung 17.7: Ändern von Schriftarten, ‐größen und ‐farben
Abbildung 17.8: Ändern von Texten in einem Diagramm
Abbildung 17.9: Farben, Schraffuren und Linienarten eines Diagrammelements ändern
Abbildung 17.10: Beschriftung einer Diagrammachse steuern
Abbildung 17.11: Skalierung einer Größenachse ändern
Abbildung 17.12: Diagrammelemente, die zusätzlich in eine Grafik eingefügt werden können
Abbildung 17.13: Balkendiagramm mit abgeleiteter Größenachse
Kapitel 18
Abbildung 18.1: Dialogfeld zur Auswahl der Variante des Liniendiagramms
Abbildung 18.2: Dialogfeld zum Erstellen eines einfachen Liniendiagramms für die Auswertung der Kategorien einer Variablen
Abbildung 18.3: Einfaches Liniendiagramm für die Häufigkeiten der unterschiedlichen politischen Einstellungen gemäß der Selbsteinschätzung von Befragten
Abbildung 18.4: Dialogfeld zur Auswahl der Variante des Flächendiagramms
Abbildung 18.5: Dialogfeld zum Erstellen eines einfachen Flächendiagramms für die Auswertung der Kategorien einer Variablen
Abbildung 18.6: Flächendiagramm für den durchschnittlichen Fernsehkonsum (Mittelwert der Variablen ) unterschiedlicher Personengruppen (Kategorien der Variablen )
Abbildung 18.7: Dialogfeld zum Erstellen eines gestapelten Flächendiagramms zur Auswertung der Kategorien einer Variablen
Abbildung 18.8: Gestapeltes Flächendiagramm für den durchschnittlichen Fernsehkonsum (Mittelwert der Variablen ) unterschiedlicher Personengruppen (Kategorien der Variablen ), getrennt für Männer und Frauen
Abbildung 18.9: Dialogfeld zur Auswahl der Variante des Balkendiagramms
Abbildung 18.10: Dialogfeld zum Erstellen eines einfachen Balkendiagramms für die Auswertung verschiedener Variablen
Abbildung 18.11: Balkendiagramm für die durchschnittliche Schulzeit von befragten Personen und ausgewählten Angehörigen
Abbildung 18.12: Dialogfeld zur Auswahl der Variante des Liniendiagramms
Abbildung 18.14: Einfaches Liniendiagramm für die Lebenserwartung der Frauen in verschiedenen Ländern der Erde – hier geordnet in der Reihenfolge der Länder in der Datendatei
Abbildung 18.13: Dialogfeld zum Erstellen eines einfachen Liniendiagramms für die Darstellung der Werte einzelner Fälle
Abbildung 18.15: Liniendiagramm im Diagramm‐Editor mit Darstellung der Werte in aufsteigender Reihenfolge
Kapitel 19
Abbildung 19.1: Dialogfeld zur Auswahl der Variante des Boxplot‐Diagramms
Abbildung 19.2: Dialogfeld zum Erstellen eines einfachen Boxplot‐Diagramms für die Auswertung der Kategorien einer Variablen
Abbildung 19.3: Boxplot‐Diagramm mit der Verteilung der Variablen (höchstes abgeschlossenes Schuljahr) für unterschiedliche Kategorien der Variablen (politische Grundhaltung)
Abbildung 19.4: Boxplot‐Diagramm mit der Verteilung der Variablen für unterschiedliche Kategorien der Variablen , getrennt für Männer und Frauen
Abbildung 19.5: Dialogfeld zum Erstellen eines gruppierten Boxplot‐Diagramms für die Auswertung verschiedener Variablen
Abbildung 19.6: Boxplot‐Diagramm mit der Verteilung des persönlichen Einkommens und des Familieneinkommens (nach Einkommensklassen) getrennt für verschiedene Bildungsschichten
Abbildung 19.7: Dialogfeld zum Erstellen einer Bevölkerungspyramide
Abbildung 19.8: Bevölkerungspyramide mit der Altersverteilung getrennt für Männer und Frauen
Abbildung 19.9: Dialogfeld zum Auswählen der Variante des Streudiagramms
Abbildung 19.10: Dialogfeld zum Erstellen eines einfachen Streudiagramms
Abbildung 19.11: Einfaches Streudiagramm mit der gemeinsamen Verteilung der Variablen (Rate der Kindersterblichkeit) und (Alphabetisierungsgrad)
Abbildung 19.12: Streudiagramm im Diagramm‐Editor mit einzelnen eingeblendeten Beschriftungen
Abbildung 19.13: Dialogfeld zum Erstellen eines überlagerten Streudiagramms
Abbildung 19.14: Überlagertes Streudiagramm mit den beiden gemeinsamen Werteverteilungen von und
Abbildung 19.15: Dialogfeld zum Erstellen eines Matrix‐Streudiagramms
Abbildung 19.16: Matrix‐Streudiagramm mit der gemeinsamen Verteilung von insgesamt 15 Variablenpaaren aus sechs unterschiedlichen Variablen
Abbildung 19.17: Dialogfeld zum Erstellen eines 3D‐Streudiagramms
Abbildung 19.18: 3D‐Streudiagramm mit der gemeinsamen Verteilung dreier Variablen
Abbildung 19.19: 3D‐Streudiagramm im Diagramm‐Editor mit der Möglichkeit zur Rotation im Raum
Kapitel 20
Abbildung 2.1: Dialogfeld der explorativen Datenanalyse mit den Angaben für die Beispieltabellen
Abbildung 2.2: Ausgabedatei mit mehreren Ergebnistabellen
Abbildung 2.3: Ausgabedatei mit einer zur Bearbeitung geöffneten Tabelle
Abbildung 2.4: Tabelle im Bearbeitungsmodus mit eingeblendeten Pivot‐Leisten vor und nach der Verschiebung des Merkmals
Abbildung 2.5: Tabelle vor und nach der Verschiebung des Merkmals auf die Fläche
Abbildung 2.6: Schrittfolge zum Verschieben der Zeile
Abbildung 2.7: Drei Arbeitsschritte zur Gruppierung von Zeilen in einer Tabelle
Abbildung 2.8: Die zwei Schritte zum Ausblenden von Spalten in einer Tabelle
Kapitel 21
Abbildung 21.1: Dialogfeld zum Erstellen einer Häufigkeitstabelle mit den Angaben für die Beispieltabelle
Abbildung 21.2: Häufigkeitstabelle als Grundlage für die Beispiele in diesem Kapitel
Abbildung 21.3: Tabelle im Bearbeitungsmodus mit einem zur Bearbeitung geöffneten Tabellenfeld
Abbildung 21.4: Die Schritte zum Einfügen einer Fußnote in ein Tabellenfeld
Abbildung 21.5: Anwendung einer Tabellenvorlage auf eine Tabelle in der Ausgabedatei
Abbildung 21.6: Dialogfeld mit dem Register zum Festlegen der
Abbildung 21.7: Symbolleiste für die Schriftformate von Tabellenfeldern
Abbildung 21.8: Die drei Register des Dialogfelds zur Formatierung von Tabellenfeldern
Abbildung 21.9: Dialogfeld zur Formatierung der Rahmenlinien einer Tabelle
Kapitel 22
Abbildung 22.1: Dialogfeld des Befehls für eine Ausgabedatei
Abbildung 22.2: Seitenansicht einer Ausgabedatei mit einer Vorschau auf das Druckergebnis
Abbildung 22.3: Einfügen eines Seitenwechsels vor der Überschrift
Abbildung 22.4: Dialogfeld zum Festlegen von Papierformat und Seitenrändern
Abbildung 22.5: Dialogfeld zum Festlegen von Kopf‐ und Fußzeile für den Ausdruck einer Ausgabedatei
Abbildung 22.6: Dialogfeld zum Einfügen von SPSS‐Objekten in eine Word‐ oder PowerPoint‐Datei
Abbildung 22.7: Vorgang zum Kopieren der Daten aus einer SPSS‐Ergebnistabelle in eine Excel‐Tabelle
Kapitel 24
Abbildung 24.1: In dem Dialogfeld legen Sie in der Gruppe fest, ob in Dialogfeldern die Beschriftungen oder die Namen von Variablen aufgeführt werden sollen.
Abbildung 24.2: In dem Dialogfeld wählen Sie, ob für die Beschriftung von Ergebnistabellen sowie für die Zeilen‐ und Spaltenüberschriften innerhalb der Tabellen die Namen oder die Beschriftungen von Variablen verwendet werden sollen.
Abbildung 24.3: In der Drop‐down‐Liste legen Sie fest, ob Tabellen in der Ausgabedatei oder in einem eigenen Fenster bearbeitet werden.
Abbildung 24.4: Legen Sie fest, welche Formatierungen für neue Diagramme zur Anwendung kommen sollen.
Abbildung 24.5: Das bestimmt den voreingestellten Datentyp bei der Erstellung neuer Variablen.
Abbildung 24.6: In der Gruppe legen Sie fest, wie sich SPSS nach dem Erstellen neuer Ergebnisse verhalten soll.
Kapitel 25
Abbildung 25.1: Dialogfeld des Befehls
Abbildung 25.2: Aus einem Dialogfeld heraus kann für jede Variable eine Kurz‐Info aufgerufen werden.
Abbildung 25.3: Dialogfeld des Befehls
Abbildung 25.4: Die Schaltfläche öffnet eine Liste der letzten Befehle.
Über den Autor
Felix Brosius ist Gründer und Geschäftsführer von FX Ventures, einem Company Builder für Online‐Unternehmen, der Startups wie die PflegeWelt, SmartGenius und fashn hervorgebracht hat. Der promovierte Volkswirt ist Autor mehrerer Fachbücher über Programmierung und Statistik.
Einleitung
Wow! Sie wollen also wirklich mit SPSS arbeiten und sich in die Niederungen der statistischen Datenanalyse hinabbegeben? Wissen Sie eigentlich, worauf Sie sich da eingelassen haben? Oder wollen Sie vielleicht gar nicht, sondern Sie müssen, weil Ihr Lehrer oder Vorgesetzter Ihnen irgendeine Analyse aufs Auge gedrückt hat? Dann herzlichen Glückwunsch – dafür sollten Sie ihm dankbar sein. Denn mit SPSS zu arbeiten, ist in Wirklichkeit viel einfacher, als die meisten Menschen denken. Behalten Sie das aber bitte für sich. Schließlich werden Sie ja schon sehr bald selbst SPSS‐Profi sein und dann können Sie mit Ihren statistischen Analyseergebnissen mächtig Eindruck schinden – aber nur solange niemand weiß, wie einfach solche Analysen mit SPSS zu erstellen sind.
Ob nun aus freien Stücken oder nicht – Sie haben sich in jedem Fall richtig entschieden, wenn Sie jetzt den Umgang mit SPSS erlernen oder Ihre Kenntnisse weiter vertiefen möchten. Sollten Sie derzeit noch großen Respekt vor der Statistik im Allgemeinen oder SPSS im Besonderen haben, können Sie diesen getrost ablegen. Sie werden merken, dass auch dieses Buch frei von jeglichem Respekt ist. Das Buch hat auch nicht den Anspruch zu erklären, warum die Welt sich dreht. Ebenso werden Sie hier keine Herleitungen oder Beweise von statistischen Zusammenhängen finden und auch (fast) keine mathematische Formel. Dafür finden Sie eine einfache Anleitung dazu, wie Sie das Programm SPSS bedienen, Daten eingeben und bearbeiten, statistische Analysen durchführen und die Ergebnisse interpretieren sowie schöne, bunte Diagramme erstellen. Um dies alles tun zu können, müssen Sie weder Mathematiker noch Computergenie sein (obwohl beides manchmal helfen könnte), sondern einfach gesunden Menschenverstand mitbringen. Dann werden Sie mit Sicherheit viel SPaSS haben.
SPSS oder PASW oder IBM Statistics oder was?
Die Firma SPSS kann wirklich gute Statistik‐Programme erstellen. Das hat sie nun seit Jahren bewiesen. Ebenso hat sie aber auch schon seit Jahren bewiesen, dass sie kein wirklich glückliches Händchen hat, wenn es darum geht, Namen, Titel oder andere Bezeichnungen für oder innerhalb von Programmen zu vergeben. Um es kurz zu machen: Das Programm SPSS heißt schon seit Ewigkeiten SPSS und wird auch in Zukunft SPSS heißen. Zwischendurch hat sich aber irgendjemand mal gedacht: »Hey, wäre es nicht cool, dem Programm mal einen neuen Namen zu geben?«, und hat SPSS kurzerhand in PASW umbenannt – warum auch nicht, Raider heißt ja auch inzwischen Twix. Na ja, auf jeden Fall war es wohl doch nicht so cool, das Programm umzubenennen, denn nun heißt es wieder SPSS – und das ist auch gut so. Wobei …, genau genommen heißt es nur so ähnlich wie SPSS. Denn SPSS wurde inzwischen von der Firma IBM übernommen – und obwohl das Programm SPSS weitgehend unverändert geblieben ist, musste natürlich eine Eigenschaft ganz dringend geändert werden, und das war der Name. Schließlich ist der Name SPSS viel zu einfach für einen Konzern wie IBM – ein Konzern ist groß und hat ganz viele Hierarchien und Abteilungen, und das muss man natürlich auch in den Titeln, Abteilungsnamen und Produktbezeichnungen erkennen. Deshalb heißt SPSS heute IBM SPSS Statistics. Wundern Sie sich also nicht, wenn irgendwo von dem Programm PASW oder IBM Statistics oder ähnlichen Namensvarianten die Rede ist. Wie auch immer das Programm heißt, im Kern steckt SPSS drin – heute ebenso wie vor zehn Jahren und vermutlich auch noch in zehn Jahren.
Über dieses Buch
Dieses Buch ist kein Roman und deshalb müssen Sie auch nicht jede Seite von vorne bis hinten durchlesen, um die Handlung zu verstehen. Vielmehr können Sie an nahezu jeder beliebigen Stelle in das Buch einsteigen und genau bei dem Thema mit dem Lesen beginnen, das Sie gerade wirklich interessiert. Jedes Kapitel bildet eine abgeschlossene Einheit und setzt nicht voraus, dass Sie die vorhergehenden Kapitel gelesen haben. Wenn Sie allerdings gerade zum ersten Mal in Ihrem Leben mit SPSS arbeiten, ist es vielleicht doch nicht so ganz egal, in welches Kapitel Sie zuerst hineinspringen. Vielleicht beginnen Sie dann mit einem, das die Bedienung des Programms erläutert (hier empfehlen sich Kapitel 1 und 2), bevor Sie anschließend direkt mit der Datenanalyse loslegen.
Alle statistischen Verfahren werden in diesem Buch anhand von Beispielen erläutert. Diese Beispiele können Sie auch selbst an Ihrem Computer nacharbeiten, denn sie basieren alle auf Daten, die Bestandteil von SPSS sind und bei der Installation des Programms mit auf die Festplatte kopiert wurden. Zu Beginn jedes Beispiels wird angegeben, welche Daten jeweils verwendet werden. Natürlich können Sie diese Daten auch nutzen, um von den vorgestellten Beispielen abzuweichen und sich eigene Analysen zur Übung auszudenken oder einfach ein wenig mit den Daten herumzuspielen.
Konventionen in diesem Buch
Benutzen Sie dieses Buch wie ein Nachschlagewerk. Wenn Sie für eine bestimmte Aufgabenstellung einen Lösungsweg suchen, schlagen Sie an der entsprechenden Stelle in dem Buch nach und lesen Sie die zwei, drei Schritte, die es braucht, um die Aufgabe zu lösen. Um die richtige Stelle im Buch schnell zu finden, nutzen Sie neben dem Inhaltsverzeichnis auch das Stichwortverzeichnis am Ende des Buches.
Damit Sie sich in dem Text schnell zurechtfinden, gelten einige wenige Konventionen, die im gesamten Buch einheitlich angewendet werden:
Menübefehle und Optionen. Wenn im Text von einem Menübefehl oder einer bestimmten Dialogfeld‐Option die Rede ist, werden deren Bezeichnungen in dieser Form hervorgehoben. Wenn beispielsweise der Befehl »Drucken« aus dem Menü »Datei« aufgerufen werden soll, steht im Text etwas in der folgenden Art: »Wählen Sie den Menübefehl Datei|Drucken.«
Variablennamen und Kodierungen. Bei der Arbeit mit SPSS hat man es naturgemäß ständig mit Variablen, Kodierungen und Werten zu tun. Solche von dem Anwender vergebenen Namen und Begriffe sind im Text in dieser Form dargestellt. So könnten Sie zum Beispiel irgendwo auf einen Satz der folgenden Art treffen: »Die Variable Geschlecht weist die Kodierung 1 auf, für die als Beschreibung das Wertelabel Mann definiert ist.«
Tastenkombinationen. An einigen Stellen werden Sie zum Beispiel eine Aufforderung der folgenden Art finden: »Drücken Sie die Tastenkombination + .« Damit ist dann gemeint, dass Sie die beiden Tasten und gleichzeitig drücken sollen.
Was Sie nicht lesen müssen
Wenn man sich in der Statistik endlich auf sicherem Boden wähnt und alle Zusammenhänge verstanden zu haben glaubt, kommt garantiert irgendein Schlaumeier um die Ecke und weist einen auf zusätzliche Aspekte hin, die man bisher übersehen hat. Oder er klärt einen darüber auf, warum die Ergebnisse, die man selbst schon längst kennt, gerade genau so richtig sind, wie sie sind.
Will man das überhaupt wissen?
Möglicherweise nicht.
Falls aber doch, dann finden Sie auch in diesem Buch genau solche Schlaumeier‐Erklärungen, die Sie eigentlich gar nicht lesen müssen. Deshalb sind diese Hinweise auch alle durch graue Kästen hervorgehoben. Wenn Sie einen solchen Kasten entdecken, können Sie einen großen Bogen darum machen – Sie müssen den Inhalt wirklich nicht lesen! Nur wenn Sie unbedingt alles ganz genau wissen und auch die Hintergründe verstehen möchten, dann können Sie bei Gelegenheit ja auch mal einen Blick auf die Schlaumeier‐Erklärungen in den grauen Kästen riskieren.
Törichte Annahmen über den Leser
Ich habe nicht die geringste Ahnung, ob Sie gerade mit Ihrem Studium beginnen oder schon die Rede für die Verleihung Ihres ersten Nobelpreises vorbereiten. Vielleicht trifft auch beides auf Sie zu oder keines von beidem, weil Sie nämlich gerade für Ihren Chef irgendeinen Haufen Daten analysieren sollen, die er selbst nicht einmal in den Ansätzen verstanden hat. Sehr wahrscheinlich beschäftigen Sie sich aber in irgendeiner Weise mit Daten oder Statistik – und neuerdings auch mit SPSS. Ich nehme zudem an, dass Sie – auch wenn Sie möglicherweise noch nie mit SPSS gearbeitet haben – dennoch mit der Arbeit am Computer unter Windows oder am Mac vertraut sind und wissen, wie man ein Programm startet und eine Maus bedient. Sollte dies nicht der Fall sein, ist das auch kein Beinbruch, denn wenn Sie sich wirklich vorgenommen haben, den Umgang mit SPSS zu lernen, wird alles andere für Sie ohnehin ein Kinderspiel sein.
Wie dieses Buch aufgebaut ist
Das Buch ist in sechs Teile untergliedert, die sich jeweils einem der wesentlichen Arbeitsfelder im Umgang mit SPSS widmen – beginnend mit der Bedienung des Programms über die Dateneingabe und ‐analyse bis hin zum Erstellen und Exportieren präsentationsreifer Ergebnisse.
Teil I: SPSS kennen lernen
Dieser Teil soll helfen, eine Freundschaft entstehen zu lassen – und zwar zwischen Ihnen und SPSS. Im ersten Kapitel lernen Sie bereits alles kennen, was Sie benötigen, um eine vollständige Datenanalyse mit SPSS durchzuführen – von der Eingabe der Daten über die Datenaufbereitung bis zur Durchführung statistischer Ergebnisse und dem Erstellen von Diagrammen. Wenn Sie dieses Kapitel gelesen haben, brauchen Sie den Rest des Buches eigentlich nicht mehr, denn dort wird nur all das wiederholt, was im ersten Kapitel ohnehin schon steht, wenn auch vielleicht ein ganz klein wenig ausführlicher.
Teil II: Datendateien anlegen und bearbeiten
Ein wesentlicher Teil der Arbeit mit SPSS besteht darin, Daten einzugeben oder aus anderen Programmen zu importieren, Daten aufzubereiten, Daten umzukodieren und neue Daten zu berechnen. All dies muss häufig geschehen, bevor überhaupt eine erste statistische Analyse durchgeführt werden kann. Wie Sie genau das alles mit SPSS erledigen, erfahren Sie in den fünf Kapiteln aus Teil II dieses Buches.
Teil III: Statistische Datenanalyse
Der Hauptgrund, warum man SPSS benutzt, sind die statistischen Analyseverfahren, die man damit durchführen möchte. Dazu hält SPSS ein sehr breites Spektrum unterschiedlicher Analysemethoden bereit. Die wichtigsten davon werden im dritten Teil dieses Buches beschrieben. Dabei bezieht sich jedes der neun Kapitel auf eine spezielle Fragestellung oder Analysemethode – beginnend mit der Berechnung einfacher Kennzahlen und dem Erstellen einer Häufigkeitstabelle über Signifikanztests wie dem Chi‐Quadrat‐ und dem T‐Test bis hin zu höheren statistischen Verfahren wie der Regressions‐ und der Clusteranalyse.
Teil IV: Malen nach Zahlen
Neben dem umfangreichen Instrumentarium an statistischen Analysemethoden bilden die vielfältigen Möglichkeiten zum Erstellen von Diagrammen die zweite große Stärke von SPSS. Da Diagramme ja auch immer ganz schön anzuschauen sind und bei der Präsentation von Ergebnissen mächtig Eindruck machen, empfiehlt es sich, diese Möglichkeiten zu nutzen. Wie Sie dies tun und beispielsweise Balken‐, Linien‐ oder Kreisdiagramme, Boxplots, Bevölkerungspyramiden und Streudiagramme erstellen, erfahren Sie in Teil IV dieses Buches. Dort wird auch beschrieben, wie Sie ein mit SPSS erstelltes Diagramm nachträglich noch bearbeiten können und zum Beispiel in Ihren Wunschfarben erstrahlen lassen.
Teil V: Ergebnisse professionell gestalten und nutzen
Die Ergebnisse statistischer Analysen sind oftmals sehr trocken – und naturgemäß einigermaßen zahlenlastig. Daher sollten sie wenigstens hübsch anzuschauen sein, wenn man sie präsentiert. Um dies zu gewährleisten, können Sie die von SPSS produzierten Ergebnistabellen nachträglich umfangreich formatieren und mit Farben, Rahmenlinien, anderen Schriftarten und gemusterten Hintergründen versehen. Wenn Sie auf diese Weise umwerfende Tabellen erstellt haben, können Sie diese anschließend auch guten Gewissens in Präsentationen übernehmen und dazu beispielsweise in eine PowerPoint‐ oder eine Word‐Datei kopieren. Die drei Kapitel des fünften Teils verraten Ihnen, wie Sie dies alles tun.
Teil VI: Der Top‐Ten‐Teil
Die Musikindustrie hat's vorgemacht: Die wirklich wichtigen Dinge im Leben lassen sich in einer Top‐Ten‐Liste zusammenfassen. Genau dies geschieht auch im letzten Teil dieses Buches.
Symbole, die in diesem Buch verwendet werden
Dieses Symbol weist auf einen hilfreichen Tipp hin, mit dem Sie Zeit sparen, neue Wege zur Lösung einer Aufgabe entdecken oder den logischen nächsten Schritt kennen lernen können.
Jeder einzelne Schritt der Datenanalyse wird in diesem Buch anhand von Beispielen erläutert. Diese Beispiele verwenden Daten, die von SPSS bereitgestellt werden. Wenn Sie dieses Symbol sehen, können Sie dort nachlesen, welche Daten dem jeweils folgenden Beispiel zugrunde liegen – diese Daten können Sie dann selbst an Ihrem Computer aufrufen, um die Beispiele nachzuarbeiten.
Wenn Sie dieses Symbol sehen, sollten Sie daneben einen Hinweis vorfinden, der ausnahmsweise tatsächlich einmal wichtig ist und nicht einfach so überlesen werden sollte.
Die Arbeit mit SPSS ist nicht wirklich gefährlich – in manchen Situationen sollten Sie aber dennoch besonders aufmerksam sein, um nicht versehentlich eine Katastrophe ähnlich dem Weltuntergang auszulösen. Die Stellen, an denen in diesem Buch auf derartige Gefahren hingewiesen wird, sind durch dieses Symbol besonders hervorgehoben.
Wie es weitergeht
An welcher Stelle lesen Sie jetzt als Nächstes weiter? Das ist eine gute Frage und ehrlich gesagt würde mich die Antwort auch interessieren. Ich hätte da aber einen Tipp für Sie: Wenn Sie gerade zum ersten Mal mit SPSS in Berührung kommen und sich schnell einen Überblick verschaffen möchten, wie das Programm organisiert ist, was man damit alles anstellen kann und welche Schritte auf dem Weg von dem vor Ihnen liegenden Stapel an ausgefüllten Fragebögen bis zu den fertigen Ergebnissen der Datenanalyse notwendig sind, dann beginnen Sie doch mal ganz konventionell mit dem ersten Kapitel des Buches, denn dort wird genau dies anhand eines Beispiels beschrieben.
Wenn Sie über diesen Schritt aber schon hinaus sind, im Grunde bereits wissen, worauf Sie sich mit SPSS eingelassen haben und die Bedienung einer Software unter Windows oder Mac ohnehin intuitiv beherrschen, dann sollten Sie tatsächlich direkt bei dem Thema einsteigen, mit dem Sie gerade befasst sind. Blättern Sie in diesem Fall also ein paar Seiten zurück und suchen Sie im Inhaltsverzeichnis das Kapitel oder den Abschnitt, der genau Ihre Frage zu beantworten verspricht.
Behalten Sie dabei in jedem Fall immer eines im Kopf: SPSS ist zwar manchmal ein wenig widerspenstig, meint es dabei aber nie böse. Schließen Sie also Freundschaft mit SPSS und gehen Sie Ihren Daten auf den Grund. Viel Spaß und viel Erfolg!
Teil I
SPSS kennen lernen
In diesem Teil …
werden Sie einen neuen Freund kennen lernen, nämlich SPSS. Und wie es sich für gute Freunde gehört, werden Sie nach einiger Zeit der Bekanntschaft keine Geheimnisse mehr voreinander haben.
erfahren Sie alles, was Sie wissen müssen, um eine Datenanalyse mit SPSS durchzuführen. Genau genommen erfahren Sie dies sogar schon im ersten Kapitel.
werden im zweiten Kapitel lediglich einige Besonderheiten von SPSS noch mal ein wenig detaillierter beschrieben – und damit ist der erste Teil auch schon beendet. Ob Sie danach auch noch die weiteren Teile des Buches lesen möchten, ist Ihnen überlassen – notwendig ist es nicht, denn eigentlich wissen Sie dann eh schon alles.
Kapitel 1
In 25 Minuten zum SPSS‐Profi
In diesem Kapitel
Das Programm SPSS starten
Daten aus einer Umfrage in den Computer eingeben
Eine Datendatei anlegen und richtig strukturieren
Stupide, aber notwendig: Daten eintippen
Mit SPSS rechnen und Daten für eine Analyse vorbereiten
Eine erste statistische Auswertung
Eine erste Grafik mit SPSS erstellen
Daten und Ergebnisse speichern
SPSS beenden
SPSS dient dazu, mehr oder weniger umfangreiche Datenmengen mit statistischen Methoden zu untersuchen und auszuwerten. Nur wer eine solche statistische Datenanalyse durchführen möchte, wird sich typischerweise überhaupt näher mit SPSS beschäftigen. Dennoch kann das Programm SPSS wesentlich mehr, als »einfach nur Analysen durchzuführen«, und wenn Sie ernsthaft mit SPSS arbeiten, werden Sie auch nicht umhinkommen, neben der eigentlichen Analyse weitere, meistens vorbereitende Arbeitsschritte mit SPSS umzusetzen. Bevor Sie irgendwelche Daten mit SPSS analysieren können, müssen Sie diese nämlich erst einmal in eine Datendatei von SPSS eingegeben oder aus anderen Programmen einlesen. Zudem müssen die Daten nach einem bestimmten Muster strukturiert sein, denn nur dann ist SPSS überhaupt in der Lage, die Daten zu interpretieren und auszuwerten.
In diesem Kapitel werden an einem kleinen Beispiel alle Arbeitsschritte vorgestellt, die eine vollständige Analyse mit SPSS typischerweise umfasst – von dem Starten des Programms über die Dateneingabe und die Durchführung statistischer Analysen bis zum Beenden von SPSS. Wenn Sie dieses Beispiel nachvollzogen haben, werden Sie nahezu alle Arten von Arbeiten kennen, die Sie mit SPSS durchführen können. Natürlich gibt es von jedem Arbeitsschritt sehr, sehr viele Varianten, zum Beispiel sehr viele unterschiedliche Verfahren der statistischen Analyse oder viele verschiedene Arten von Grafiken. Diese Varianten werden Sie in dem folgenden Beispiel nicht alle kennen lernen, aber in Bezug auf den generellen Ablauf der Arbeit mit SPSS sollten Sie nach diesem Kapitel keine großen Überraschungen mehr erleben.
Eine typische Aufgabenstellung für SPSS
Sollten Sie irgendwann einmal ein Buch in die Hände bekommen, in dem eine Überschrift großspurig eine »typische Aufgabenstellung für SPSS« ankündigt, können Sie es getrost ungelesen zurücklegen, denn offensichtlich hat der Autor keine Ahnung, worüber er schreibt: SPSS wird in der Praxis für derart viele und unterschiedliche Fragestellungen zum Beispiel aus der Marktforschung, den Naturwissenschaften, der Ökonomie oder den Sozialwissenschaften eingesetzt, dass es eine »typische Aufgabenstellung für SPSS« gar nicht geben kann. Allerdings gibt es so etwas wie »typische Arbeitsschritte«, die unabhängig von der konkreten Aufgabenstellung bei der Datenanalyse mit SPSS anfallen. So lässt sich nahezu jedes Analyseprojekt, das mit SPSS durchgeführt wird, in die folgenden Teilaufgaben untergliedern, wobei je nach Art und Umfang des Projektes einige dieser Schritte auch entfallen können:
Zu Beginn wird das Programm SPSS gestartet.
Die zu analysierenden Daten müssen irgendwie in eine Datendatei von SPSS gelangen. Hierzu können die Daten entweder direkt in SPSS eingetippt oder aus einer bestehenden Datei eines anderen Programms übernommen werden.
Bevor sich die Daten analysieren lassen, müssen sie häufig noch aufbereitet oder umstrukturiert werden.
Anschließend kann die eigentliche Analyse der Daten erfolgen. Das Ergebnis solcher Analysen sind meistens Tabellen oder Grafiken, in denen die Resultate präsentiert werden.
Wenn die Ergebnisse der Analyse in Dokumentationen oder Präsentationen weiterverwendet werden sollen, lassen sie sich zuvor mit SPSS in ihrem Aussehen präsentationsreif gestalten, damit man die Ergebnisse hoffentlich nicht nur inhaltlich, sondern auch äußerlich herzeigen mag.
Damit Daten und Ergebnisse nicht verloren gehen, müssen sie vor dem Beenden des Programms gespeichert werden.
Zum Abschluss wird das Programm SPSS wieder beendet.
Ein erstes kleines Beispiel
Im Folgenden wird eine kleine Analyse durchgeführt, die alle wesentlichen Arbeitsschritte umfasst. Die Aufgabenstellung besteht darin, die Ergebnisse einer sehr einfachen Kundenbefragung auszuwerten. Eine solche Aufgabe ist »ein Klassiker« für alle »Newbies«, die anfangen, mit SPSS zu arbeiten. Das Beispiel geht davon aus, irgendein beliebiges Unternehmen wie zum Beispiel ein Kaufhaus habe seine Kunden anhand der »Gewinnspielkarte« aus Abbildung 1.1 über deren Produktinteressen befragt und gleichzeitig versucht, Informationen über das Alter der Kunden zu gewinnen und das Einverständnis für weitere Werbezusendungen zu erhalten. Natürlich ist die hier abgebildete Karte simplifiziert, denn wesentliche Informationen wie die Abfrage von Adressdaten, einer Kundennummer oder der E‐Mail‐Adresse fehlen. Gehen Sie einfach davon aus, die Daten würden auf der Rückseite der Karte abgefragt und seien im ersten Schritt nicht relevant.
Abbildung 1.1: Antwortkarte aus einer fiktiven Kundenbefragung
Um die mit diesen Antwortkarten gewonnenen Daten auszuwerten, werden im Folgenden alle oben aufgeführten Arbeitsschritte durchgeführt. Sie können die folgende Analyse Schritt für Schritt an Ihrem Computer nacharbeiten. Je nachdem, wie viel Erfahrung Sie bereits mit anderen Programmen wie Excel, Word oder Access haben, werden Ihnen dabei einige Schritte vielleicht sehr vertraut vorkommen. Bei anderen Schritten haben Sie eventuell das Gefühl, man müsste noch wesentlich mehr Details erfahren, um alle Möglichkeiten kennen zu lernen. Dieses Gefühl wird dann vermutlich richtig sein, denn jeder der folgenden Arbeitsschritte wird in den späteren Kapiteln dieses Buches noch sehr viel ausführlicher vorgestellt. Das folgende Beispiel sollte vor allem ein guter Start für die erste Begegnung mit SPSS sein:
Sie lernen den »typischen« Ablauf einer Analyse mit SPSS kennen.
Sie werden mit der Oberfläche von SPSS und einigen verschiedenen Fenstern vertraut (SPSS hat nämlich jeweils eigene Fenster zur Darstellung und Bearbeitung von Daten, Ergebnissen und Grafiken).
Sie können hinterher, ohne rot zu werden, behaupten, bereits vollständige Analysen mit SPSS durchgeführt zu haben, also quasi ein SPSS‐Profi zu sein.
SPSS starten
Wie für nahezu jedes Programm unter Windows gilt auch für SPSS: Viele Wege führen zum Starten des Programms. Glücklicherweise gibt es aber überhaupt keinen Grund, alle Wege zu lernen – es genügt vollkommen, den einfachsten Weg zu kennen.
Der einfachste Weg zu SPSS
Der einfachste Weg zum Starten von SPSS ist meistens das Icon auf der Oberfläche von Windows. Wenn Sie auf dieses Icon doppelklicken, starten Sie das Programm.
Statt dieses Icons auf der Windows‐Oberfläche können Sie auch das Startmenü verwenden, um SPSS aufzurufen. Die verschiedenen Wege zum Starten von SPSS werden im folgenden Kapitel systematisch dargestellt. Wenn Sie mit einem Mac‐Betriebssystem arbeiten, starten Sie SPSS auch dort genau so, wie Sie auch sonst Programme auf dem Mac starten, zum Beispiel indem Sie das Launchpad aufrufen und dort auf das Icon für SPSS klicken.
Abbildung 1.2: Windows‐Oberfläche mit dem Icon von SPSS zum Starten des Programms
Die erste Begrüßung durch SPSS
Die Begrüßung durch SPSS fällt traditionell sehr nüchtern aus. Je nach den bei Ihnen vorgenommenen Einstellungen zeigt SPSS zur Begrüßung entweder nur ein vollkommen leeres Tabellenblatt, wie in Abbildung 1.3 dargestellt, oder ein leeres Tabellenblatt mit einem Dialogfeld, das Sie fragt, was Sie denn jetzt eigentlich tun möchten. Sollte dieses Dialogfeld bei Ihnen angezeigt werden, ist es in den meisten Fällen das Zweckmäßigste, es einfach mit der Schaltfläche Schließen zu schließen, um ohne Umwege mit der Arbeit beginnen zu können. Danach sieht der Bildschirm wie in Abbildung 1.3 ziemlich aufgeräumt aus und zeigt neben einer leeren Tabelle nur einige wenige Symbole und Menübefehle.
Abbildung 1.3: Erster Bildschirm nach dem Start von SPSS – hier ohne Begrüßungs‐Dialogfeld
Datendatei anlegen
Die leere Tabelle in Abbildung 1.3 ist das Gerüst einer Datendatei. Die ersten Schritte bei der Arbeit mit SPSS bestehen nahezu immer darin, diese Tabelle mit den Daten zu füllen, die dann im Weiteren analysiert werden sollen. Das Füllen dieser Datei kann dadurch geschehen, dass die zu untersuchenden Daten tatsächlich einzeln »mit der Hand«, also über die Tastatur in die leere Tabelle eingegeben werden. In vielen Fällen liegen die Daten aber auch schon in elektronischer Form als Datei vor und können je nach dem Format dieser Datei einfach als fertige SPSS‐Datei geöffnet oder aus einer anderen Anwendung wie Excel oder Access eingelesen werden. Dieses Glück haben Sie mit den Antwortkarten aus der Kundenbefragung leider nicht, weshalb Sie im nächsten Schritt tatsächlich alle Daten mit der Hand eingeben müssen.
Ordnung schaffen: Daten brauchen eine Struktur
Ordnung schaffen: Daten brauchen eine StrukturBevor Sie mit der Eingabe der Antworten von den Antwortkarten in die Datendatei beginnen können, sollten Sie sich die Frage stellen, in welcher Form diese Daten in das leere Tabellenblatt von SPSS übertragen werden sollen. Diese Frage mag trivial erscheinen, in Wirklichkeit ist sie aber von zentraler Bedeutung. Vor jeder Dateneingabe sollte man sich zwei Punkte sehr gut überlegen:
1. Wie sollen die Daten angeordnet werden? Die richtige Antwort auf diese Frage lautet: Jeder Datensatz wird als Zeile und jede Variable als Spalte angelegt. Was dies genau bedeutet, wird im folgenden Abschnitt deutlich.
2. Wie können die Antworten so eingegeben werden, dass man möglichst wenig tippen muss, die Daten gut mit dem Computer auswerten kann und die Inhalte der Datendatei auch in Zukunft noch versteht? Hier werden Sie bei der Datenanalyse sehr schnell merken, dass Kodierungen (statt der Eingabe vollständiger Antwortsätze) die Arbeit ganz erheblich erleichtern. Unten wird sich zeigen, wie sich dies auf die vorliegenden Antwortkarten übertragen lässt.
Von Fällen und Variablen in Zeilen und Spalten
Die Aufgabe des Beispiels besteht darin, die Ergebnisse der kleinen Kundenbefragung in die Datendatei einzugeben. Es werden also viele einzelne Kunden (beziehungsweise deren Antwortkarten) betrachtet, und für jeden dieser Kunden liegen mehrere Merkmale wie der Name, das Geburtsdatum, der Wunsch nach Werbezusendungen und so weiter vor. Jedes dieser Merkmale wird als eine Variable bezeichnet, denn es handelt sich um eine veränderliche (also variable) Größe, die an verschiedenen Stellen (hier bei verschiedenen Kunden) beobachtet wurde. So umfasst eine Variable alle Vornamen, die von den Kunden abgefragt wurden, eine zweite Variable enthält alle Nachnamen, eine dritte die Geburtstage und so weiter.
Für jeden Kunden aus der Kundenbefragung liegt damit in jeder Variablen genau ein Wert vor, also ein Wert in der Vornamen‐Variablen, ein Wert in der Nachnamen‐Variablen und so weiter. Die Gesamtheit aller Werte, die sich auf denselben Kunden (generell auf dieselbe Beobachtungseinheit) beziehen, wird als ein Datensatz oder in der statistischen Analyse häufig auch als ein Fall bezeichnet.
Bei der Eingabe der Daten in eine Datendatei ist es allgemein üblich und bei SPSS zwingend notwendig, dass jeder Fall als eine Zeile und jede Variable als eine Spalte eingegeben wird. Das heißt im Ergebnis, dass sämtliche Werte einer Variablen wie zum Beispiel alle Nachnamen in einer Spalte untereinander stehen, während gleichzeitig alle Daten eines Falles wie hier alle Informationen zu einem Kunden in einer Zeile nebeneinander aufgeführt werden.
Warum das Ganze?
