15,99 €
Dieses Buch enthält die wichtigsten statistischen Instrumente und Formeln, die Sie in den Wirtschafts- und Sozialwissenschaften benötigen. Besonderer Wert wird darauf gelegt, dass Sie jede einzelne Formel verstehen und anwenden können. Zu jeder Formel finden Sie deshalb eine Erläuterung der Anwendungsfälle, eine detaillierte Beschreibung der einzelnen Symbole in der Formel und der notwendigen Rechenschritte, ein Anwendungsbeispiel mit vollständigem und erläutertem Rechenweg sowie eine Interpretation des jeweiligen Ergebnisses.
Sie lesen das E-Book in den Legimi-Apps auf:
Seitenzahl: 400
Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies
In der Standardnormalverteilungstabelle dargestelltes Flächenvolumen unter der Dichtefunktion einer standardnormalverteilten Zufallsvariablen Z
Die Einträge in der Tabelle stellen die Fläche zwischen 0 und z > 0 dar. Beispielsweise umfasst die Fläche zwischen 0 und z = 1,99 insgesamt 47,67 Prozent der Fläche, das heißt, die Wahrscheinlichkeit einen z-Wert zwischen z = 0 und z = 1,99 zu erhalten, beträgt P(0 ≤ Z ≤ 1,99) = 0,4767. Genau diesen Wert können Sie direkt aus der Standardnormalverteilungstabelle entnehmen. Sie müssen dazu nur in der ersten Spalte den Wert 1,9 und in der ersten Zeile den Wert 0,09 wählen; dann können Sie die Fläche im Schnittpunkt der entsprechenden Zeile und Spalte ablesen.
Z-Werte
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
Flächenanteile unter der Standardnormalverteilung
0
0
0,004
0,008
0,012
0,016
0,0199
0,0239
0,0279
0,0319
0,0359
0,1
0,0398
0,0438
0,0478
0,0517
0,0557
0,0596
0,0636
0,0675
0,0714
0,0753
0,2
0,0793
0,0832
0,0871
0,091
0,0948
0,0987
0,1026
0,1064
0,1103
0,1141
0,3
0,1179
0,1217
0,1255
0,1293
0,1331
0,1368
0,1406
0,1443
0,148
0,1517
0,4
0,1554
0,1591
0,1628
0,1664
0,17
0,1736
0,1772
0,1808
0,1844
0,1879
0,5
0,1915
0,195
0,1985
0,2019
0,2054
0,2088
0,2123
0,2157
0,219
0,2224
0,6
0,2257
0,2291
0,2324
0,2357
0,2389
0,2422
0,2454
0,2486
0,2518
0,2549
0,7
0,258
0,2612
0,2642
0,2673
0,2704
0,2734
0,2764
0,2794
0,2823
0,2852
0,8
0,2881
0,291
0,2939
0,2967
0,2995
0,3023
0,3051
0,3078
0,3106
0,3133
0,9
0,3159
0,3186
0,3212
0,3238
0,3264
0,3289
0,3315
0,334
0,3365
0,3389
1
0,3413
0,3438
0,3461
0,3485
0,3508
0,3531
0,3554
0,3577
0,3599
0,3621
1,1
0,3643
0,3665
0,3686
0,3708
0,3729
0,3749
0,377
0,379
0,381
0,383
1,2
0,3849
0,3869
0,3888
0,3907
0,3925
0,3944
0,3962
0,398
0,3997
0,4015
1,3
0,4932
0,4049
0,4066
0,4082
0,4099
0,4115
0,4131
0,4147
0,4162
0,4177
1,4
0,4192
0,4207
0,4222
0,4236
0,4251
0,4265
0,4279
0,4292
0,4306
0,4319
1,5
0,4332
0,4345
0,4357
0,437
0,4382
0,4394
0,4406
0,4418
0,4429
0,4441
1,6
0,4452
0,4463
0,4474
0,4484
0,4495
0,4505
0,4515
0,4525
0,4535
0,4545
1,7
0,4554
0,4564
0,4573
0,4582
0,4591
0,4599
0,4608
0,4616
0,4625
0,4633
1,8
0,4641
0,4649
0,4656
0,4664
0,4671
0,4678
0,4686
0,4693
0,4699
0,4706
1,9
0,4713
0,4719
0,4726
0,4732
0,4738
0,4744
0,475
0,4756
0,4761
0,4767
2
0,4772
0,4778
0,4783
0,4788
0,4793
0,4798
0,4803
0,4808
0,4812
0,4817
2,1
0,4821
0,4826
0,483
0,4834
0,4838
0,4842
0,4846
0,485
0,4854
0,4857
2,2
0,4861
0,4864
0,4868
0,4871
0,4875
0,4878
0,4881
0,4884
0,4887
0,489
2,3
0,4893
0,4896
0,4898
0,4901
0,4904
0,4906
0,4909
0,4911
0,4913
0,4916
2,4
0,4918
0,492
0,4922
0,4925
0,4927
0,4929
0,4931
0,4932
0,4934
0,4936
2,5
0,4938
0,494
0,4941
0,4943
0,4945
0,4946
0,4948
0,4949
0,4951
0,4952
2,6
0,4953
0,4955
0,4956
0,4957
0,4959
0,496
0,4961
0,4962
0,4963
0,4964
2,7
0,4965
0,4966
0,4967
0,4968
0,4969
0,497
0,4971
0,4972
0,4973
0,4974
2,8
0,4974
0,4975
0,4976
0,4977
0,4977
0,4978
0,4979
0,4979
0,498
0,4981
2,9
0,4981
0,4982
0,4982
0,4983
0,4984
0,4984
0,4985
0,4985
0,4986
0,4986
3
0,4986
0,4987
0,4987
0,4988
0,4988
0,4989
0,4989
0,4989
0,499
0,499
In der t-Verteilungstabelle dargestellter Flächenbereich einer t-verteilten Zufallsvariablen tdf mit df Freiheitsgraden
Die t-Verteilung verwenden Sie statt der Standardnormalverteilung, wenn der Stichprobenumfang 30 oder weniger statistische Einheiten umfasst. Die Einträge in der t-Verteilungstabelle zeigen Ihnen die t-Werte für bestimmte Flächen beziehungsweise Wahrscheinlichkeiten, die oberhalb dieser t-Werte in den nach Freiheitsgraden unterschiedenen t-Verteilungen liegen. Wenn die Zufallsvariable t beispielsweise einer t-Verteilung mit zehn Freiheitsgraden folgt, ist die Wahrscheinlichkeit, einen größeren Wert als 1,812 zu erhalten, P(t > 1,812) = 0,05; das bedeutet gleichermaßen, dass die Fläche unter der t-Verteilung, die über dem t-Wert von 1,812 liegt, nur fünf Prozent der gesamten Fläche der t-Verteilung mit zehn Freiheitsgraden einnimmt.
Freiheitsgrade
Oberer Teil der t-Verteilung
0,01
0,005
0,1t-Werte
0,05
0,025
1
3,078
6,314
12,706
31,821
63,657
2
1,886
2,92
4,303
6,965
9,925
3
1,638
2,353
3,182
4,541
5,841
4
1,533
2,132
2,776
3,747
4,604
5
1,476
2,015
2,571
3,365
4,032
6
1,44
1,943
2,447
3,143
3,707
7
1,415
1,895
2,365
2,998
3,499
8
1,397
1,86
2,306
2,896
3,355
9
1,383
1,833
2,262
2,821
3,25
10
1,372
1,812
2,228
2,764
3,169
11
1,363
1,796
2,201
2,718
3,106
12
1,356
1,782
2,179
2,681
3,055
13
1,35
1,771
2,16
2,65
3,012
14
1,345
1,761
2,145
2,624
2,977
15
1,341
1,753
2,131
2,602
2,947
16
1,337
1,746
2,12
2,583
2,921
17
1,333
1,74
2,11
2,567
2,898
18
1,33
1,734
2,101
2,552
2,878
19
1,328
1,729
2,093
2,539
2,861
20
1,325
1,725
2,086
2,528
2,845
21
1,323
1,721
2,08
2,518
2,831
22
1,321
1,717
2,074
2,508
2,819
23
1,319
1,714
2,069
2,5
2,807
24
1,318
1,711
2,064
2,492
2,797
25
1,316
1,708
2,06
2,485
2,787
26
1,315
1,706
2,056
2,479
2,779
27
1,314
1,703
2,052
2,473
2,771
28
1,313
1,701
2,048
2,467
2,761
29
1,311
1,699
2,045
2,462
2,756
30
1,31
1,697
2,042
2,457
2,75
40
1,303
1,684
2,021
2,423
2,704
60
1,296
1,671
2
2,39
2,66
120
1,289
1,658
1,98
2,358
2,617
∞
1,282
1,645
1,96
2,326
2,576
Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies
Bibliografische Information der Deutschen Nationalbibliothek
Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.
2. Auflage 2019
© 2019 WILEY-VCH Verlag GmbH & Co. KGaA, Weinheim
All rights reserved including the right of reproduction in whole or in part in any form.
Alle Rechte vorbehalten inklusive des Rechtes auf Reproduktion im Ganzen oder in Teilen und in jeglicher Form.
Wiley, the Wiley logo, Für Dummies, the Dummies Man logo, and related trademarks and trade dress are trademarks or registered trademarks of John Wiley & Sons, Inc. and/or its affiliates, in the United States and other countries. Used by permission.
Wiley, die Bezeichnung »Für Dummies«, das Dummies-Mann-Logo und darauf bezogene Gestaltungen sind Marken oder eingetragene Marken von John Wiley & Sons, Inc., USA, Deutschland und in anderen Ländern.
Das vorliegende Werk wurde sorgfältig erarbeitet. Dennoch übernehmen Autoren und Verlag für die Richtigkeit von Angaben, Hinweisen und Ratschlägen sowie eventuelle Druckfehler keine Haftung.
Coverfoto: © Cifotart – stock.adobe.comKorrektur: Frauke Wilkens
Print ISBN: 978-3-527-71561-9ePub ISBN: 978-3-527-81947-8
Thomas Krickhahn hat Wirtschafts- und Sozialwissenschaften studiert und an der philosophischen Fakultät der Martin-Luther-Universität in Halle-Wittenberg promoviert (1995). Er hat eine mehrjährige Erfahrung im Bereich der empirischen Wirtschaftsforschung als Forschungsassistent und wissenschaftlicher Gutachter. Auch als Dozent ist er unter anderem in den Bereichen Volkswirtschaftslehre, quantitative Methoden und Betriebswirtschaftslehre (an Weiterbildungseinrichtungen, Fachhochschulen und Universitäten) langjährig tätig. Er ist Autor mehrerer Publikationen im Bereich der wirtschafts- und sozialwissenschaftlichen Forschung und Lehre. Zurzeit ist er als wissenschaftlicher Projektleiter an der Hochschule Bonn-Rhein-Sieg und als Dozent für die Bonner Akademie (Gesellschaft für DV- und Management-Training, Bildung und Beratung mbH) tätig.
Dominik Poß studierte Volkswirtschaftslehre an der Rheinischen Friedrich-Wilhelms-Universität Bonn. Bereits während seines Studiums legte er sein Augenmerk auf das Fachgebiet Statistik und begleitete als Tutor erfolgreich zahlreiche Studenten durch die Grundvorlesungen der Statistik.
Zur Zeit ist er Doktorand an der Bonn Graduate School of Economics und beschäftigt sich am Institut für Finanzmarktökonomik und Statistik der Universität Bonn mit der Analyse von funktionalen Daten, hochdimensionalen Regressionsproblemen und der Variablenselektion.
Die Niederschrift von Büchern ist mit viel Zeit verbunden. Zeit die der Autor nicht seinen Nächsten widmen kann. Mein Dank gilt daher zuallererst meiner lieben Frau, Susanne Krickhahn. Die Qualität des Werks hängt nicht zuletzt auch an den Menschen, die bei der Erstellung unterstützend mitgewirkt haben. Meiner Lektorin, Frau Esther Neuendorf, und meinem Fachlektor, Herrn Dominik Poß, bin ich für die vielen wertvollen Hinweise und Korrekturen sehr dankbar.
Thomas KrickhahnBonn, im Frühjahr 2019
Cover
Titelseite
Impressum
Über den Autor
Über den Fachkorrektor
Danksagung
Einführung
Über dieses Buch
Törichte Annahmen über den Leser
Wie dieses Buch aufgebaut ist
Symbole, die in diesem Buch verwendet werden
Wie es weitergeht
Teil I: Ein paar statistische Grundlagen
Kapitel 1: Was Statistik ist und warum sie benötigt wird
Warum Statistik?
Einsatzgebiete der Statistik
Bereiche der Statistik
Kapitel 2: Die Quellen: Woher die Daten kommen
Datenerhebung: Auf den Informationsbedarf ausgerichtet
Ziele festlegen
Untersuchungsansatz definieren
Das Datenerhebungsdesign festlegen
Der Datensatz als Grundlage für statistische Analysen
Teil II: Die beschreibende Statistik
Kapitel 3: In jeder Zeitung zu finden: Tabellen und Diagramme
Darstellung in Tabellen
Ein Diagramm sagt mehr als tausend Zahlen
Kapitel 4: Mitten drin – zentrale Lagemaße
Zentrale Lagemaße – ein Steckbrief
Das arithmetische Mittel
Das geometrische Mittel
Der Median
Median oder arithmetisches Mittel – was ist aussagekräftiger?
Der Modus
Modus, Median und arithmetisches Mittel bei eingipfeligen Verteilungen
Quartile, Perzentile oder ganz einfach Quantile
Zentrale Lagemaße für klassierte Daten
Resümee zur Berechnung von zentralen Lagemaßen
Kapitel 5: Drum herum – Streuungsmaße
Die Spannweite
Der interquartile Abstand
Alles auf einen Blick: Der Boxplot
Mittlere Abweichung, Varianz und Standardabweichung
Kapitel 6: Alles in einer Zahl
Einfache statistische Kennzahlen
Verhältniszahlen
Die Konzentration mit dem Gini-Koeffizienten messen
Kapitel 7: Zusammenhangsmaße
Die Analyse von Zusammenhängen
Die Kreuztabelle
Das Chi-Quadrat
Der Kontingenzkoeffizient nach Pearson
Der Rangkorrelationskoeffizient
Alles auf einen Blick – das Streudiagramm
Die Kovarianz
Korrelationskoeffizient nach Bravais und Pearson
Kapitel 8: Es geht auch ohne die Kristallkugel – Vorhersagen mit der Regressionsanalyse
Die Regressionsfunktion
Die Regressionsgleichung interpretieren
Wie gut ist gut? Die Güte der Regressionsanalyse
Teil III: Die schließende Statistik
Kapitel 9: Nichts ist sicher, aber wahrscheinlich – die Wahrscheinlichkeitsrechnung
Wie wahrscheinlich ist die Wahrscheinlichkeit?
Wahrscheinlichkeiten finden
Wahrscheinlichkeitsregeln im Einsatz
Kombinatorik
Kapitel 10: Auf die Verteilung kommt es an – Wahrscheinlichkeitsverteilungen
Die Zufallsvariable und das Zufallsexperiment
Alles eine Frage der Funktion: Die Wahrscheinlichkeitsverteilung einer diskreten Zufallsvariablen
Die Gleichverteilung einer diskreten Zufallsvariablen
Die Verteilungsfunktion einer diskreten Zufallsvariablen
Was Sie von diskreten Zufallsvariablen erwarten können: Der Erwartungswert
Rund um den Erwartungswert: Die Varianz von diskreten Zufallsvariablen
Kapitel 11: Noch mehr Diskretion bitte – die Binomialverteilung und ihre Freunde
Entweder oder – die Binomialverteilung
Die hypergeometrische Verteilung
Die Poisson-Verteilung
Kapitel 12: Alles im Fluss: Kontinuierliche Wahrscheinlichkeitsverteilungen
Alle sind gleich und einige etwas mehr: Die Gleichverteilung
Was ist schon normal? Die Normalverteilung
Standardnormalverteilung
Kapitel 13: Vom Teil aufs Ganze schließen
Stichproben
Auswahlverfahren
Ans Limit gehen: Der zentrale Grenzwertsatz
Der Standardfehler
Mit dem Standardfehler rechnen
Kapitel 14: Schätzverfahren
Genau schätzen – die Punktschätzung
Die Schätzfunktion und ihre Qualitätsanforderungen
Mit Vertrauen rechnen – das Vertrauensintervall
Kapitel 15: These, Antithese, Hypothesentest
In Alternativen denken: Nullhypothese und Alternativhypothese
Von signifikanten und nicht signifikanten Fehlern
Eins, zwei, drei und fertig ist der Hypothesentest
Wie es nun weitergehen könnte – der Wilcoxon-Test
Teil IV: Der Top-Ten-Teil
Kapitel 16: Die zehn wichtigsten Statistikformeln
Das arithmetische Mittel
Die Standardabweichung
Der Preisindex nach Laspeyres
Der Korrelationskoeffizient
Der Regressionskoeffizient
Der Bestimmtheitskoeffizient
Die bedingte Wahrscheinlichkeit
Der Z-Wert
Die Normalverteilungsdichtefunktion
Der Standardfehler
Kapitel 17: Die zehn wichtigsten Schritte für den Praktiker
Der Start: Ein statistisches Problem
Das Thema der statistischen Untersuchung
Suchen und finden: Die Informationsrecherche vor der Erhebung
Nichts ist praktischer als eine gute Theorie
Keine Frage des guten Geschmacks: Das Untersuchungsdesign – ein Muss für jede Erhebung
Jetzt werden die Daten geerntet – die Feldphase
Die Daten für die Analyse schick machen
Die Stunde der Formeln hat geschlagen: Jetzt wird gerechnet – die Datenanalyse
Die Ergebnisse für die Praxis übersetzen
Die Ergebnisse präsentieren
Kapitel 18: Perspektiven: Zehn der wichtigsten multivariaten Konzepte im Überblick
Die multivariate Regressionsanalyse
(Multivariate) Varianzanalyse
Faktorenanalyse
Clusteranalyse
Diskriminanzanalyse
Conjoint-Analyse
Kontingenzanalyse
Korrespondenzanalyse
Multidimensionale Skalierung
Strukturgleichungsanalyse
Last but not least
Stichwortverzeichnis
End User License Agreement
Kapitel 1
Tabelle 1.1: Der Zusammenhang zwischen Statistiken und Messniveaus
Kapitel 2
Tabelle 2.1: Beispieldatensatz
Kapitel 3
Tabelle 3.1: Schulnoten und ihre Häufigkeit
Tabelle 3.2: Die Häufigkeitstabelle der Variablen »Körpergröße«
Tabelle 3.3: Tabelle 3.2 um Klassenbreite und Häufigkeitsdichte ergänzt
Tabelle 3.4: Die Gewinnentwicklung (in Millionen Euro) der Firmen ProProfit und WinWin
Kapitel 4
Tabelle 4.1: Beispieldaten zur Berechnung des geometrischen Mittels
Tabelle 4.2: Die Zeugnisnoten von neun Schülern unsortiert
Tabelle 4.3: Anwendung des Medians bei ungerader Fallzahl
Tabelle 4.4: Anwendung des Medians bei gerader Fallzahl
Tabelle 4.5: Daten zur Berechnung von Perzentilen
Tabelle 4.6: Beispieldaten zur Berechnung des Modus für klassierte Daten
Tabelle 4.7: Beispiel zur Berechnung des Medians für klassierte Daten
Tabelle 4.8: Beispiel zur Berechnung des gewichteten arithmetischen Mittels für klassierte Daten
Tabelle 4.9: Übersicht über die einzelnen zentralen Lagemaße und ihre Anwendbarkeit auf die verschiedenen Skalenniveaus
Kapitel 5
Tabelle 5.1: Daten zur Berechnung des interquartilen Abstands
Tabelle 5.2: Berechnung von arithmetischem Mittel, mittlerer absoluter Abweichung und Varianz für die Krankmeldungen an zehn Tagen
Tabelle 5.3: Berechnung der Varianz und Standardabweichung klassierter Merkmale
Tabelle 5.4: Anzahl fehlerhafter Produkte und Kündigungen in verschiedenen Monaten
Tabelle 5.5: Standardisierung: Lohn- und Gehaltsentwicklung in fünf europäischen Ländern
Kapitel 6
Tabelle 6.1: Statistische Kennzahlen zum Sterberisiko in Deutschland
Tabelle 6.2: Beispieldaten zur Berechnung von Messzahlen
Tabelle 6.3: Beispieldaten zur Berechnung der Preisindizes
Tabelle 6.4: Ausgangsdaten zur Berechnung des Gini-Koeffizienten
Tabelle 6.5: Berechnung des Gini-Koeffizienten
Kapitel 7
Tabelle 7.1: Beispiel einer Kreuztabelle
Tabelle 7.2: Beispiel zur Berechnung des Chi-Quadrats (beobachtete Häufigkeiten sind fett, zu erwartende Häufigkeiten mager)
Tabelle 7.3: Beispiel zur Berechnung des Rangkorrelationskoeffizienten
Tabelle 7.4: Beispieldaten zum Erstellen eines Streudiagramms: Lohn- und Preisentwicklung in fünf OECD-Ländern
Tabelle 7.5: Berechnung der Kovarianz
Tabelle 7.6: Ausgangsdaten zum Berechnen des Korrelationskoeffizienten
Kapitel 8
Tabelle 8.1: Beispiel zum Berechnen der Regressionsgleichung
Tabelle 8.2: Nicht erklärte Abweichungen von den geschätzten Werten
Kapitel 9
Tabelle 9.1: Wahrscheinlichkeitsbestimmung anhand empirischer Daten
Tabelle 9.2: Qualität und Pünktlichkeit
Tabelle 9.3: Verfahren zur Bestimmung der Anzahl der Möglichkeiten
Tabelle 9.4: Variationskombinationen für zwei aus fünf Elementen ohne Zurücklegen
Tabelle 9.5: Kombinationsmöglichkeiten für zwei aus fünf Elementen ohne Zurücklegen
Kapitel 10
Tabelle 10.1: Beispiele diskreter und kontinuierlicher Zufallsvariablen
Tabelle 10.2: Wahrscheinlichkeitsverteilung für die Zufallsvariable »Würfelwurf«
Tabelle 10.3: Die Werte der Verteilungsfunktion für die diskrete Zufallsvariable »Würfelwurf« an ihren Sprungstellen
Tabelle 10.4: Erwartungswert der Anzahl der täglich verkauften Produkte
Tabelle 10.5: Berechnung der Varianz für die diskrete Zufallsvariable »täglich verkaufte Produkte«
Kapitel 11
Tabelle 11.1: Ergebnisse eines Binomialexperiments »Münzwurf«
Tabelle 11.2: Wahrscheinlichkeitsverteilung anhand der Wahrscheinlichkeitsfunktion der Binomialverteilung
Tabelle 11.3: Auszug aus der Binomialwahrscheinlichkeitstabelle
Kapitel 12
Tabelle 12.1: Standardnormalverteilungstabelle
Kapitel 14
Tabelle 14.1: Ausschnitt aus der t-Tabelle
Kapitel 15
Tabelle 15.1: Formen des Hypothesentests für das arithmetische Mittel
Tabelle 15.2: Entscheidungsmöglichkeiten beim Hypothesentest
Tabelle 15.3: Die Wahl der Teststatistik beim Hypothesentest über den Populationsmittelwert
Tabelle 15.4: Übersicht – Hypothesentest für den Populationsmittelwert
Tabelle 15.5: Formen des Hypothesentests für den Anteilswert
Tabelle 15.6: Gepaarte Milch- und Kakao-Stichproben im Wilcoxon-Test
Tabelle 15.7: Die Ränge im Wilcoxon-Test müssen richtig berechnet und geordnet werden
Tabelle 15.8: Die jeweiligen kritischen Werte im Wilcoxon-Test bei kleinen Stichproben
Kapitel 1
Abbildung 1.1: Übersicht über die Teilgebiete der Statistik
Kapitel 3
Abbildung 3.1: Die Rohdaten werden ihrer Rangordnung nach in einer Häufigkeitstabelle angeordnet
Abbildung 3.2: Beispiel eines Histogramms
Abbildung 3.3: Beispiel eines Säulendiagramms
Abbildung 3.4: Beispiel eines Kuchendiagramms für das klassierte Körpergrößenmerkmal
Abbildung 3.5: Beispiel eines Liniendiagramms für die Gewinnentwicklung der Firmen ProProfit und WinWin
Kapitel 4
Abbildung 4.1: Lagemaße und Verteilungsformen
Abbildung 4.2: Histogramm mit Modus für die Gewichtsdaten
Kapitel 5
Abbildung 5.1: Verteilungen mit gleichem Mittelwert, aber verschiedenen Streuungen
Abbildung 5.2: Der Boxplot
Abbildung 5.3: Vergleichende Darstellung der Streuung für das Merkmal »Körpergröße nach Geschlecht« anhand von Boxplots
Kapitel 7
Abbildung 7.1: Zellenschema für Kreuztabellen mit Beispiel für die erste Zelle (erste Zeile und erste Spalte) in Tabelle 7.1
Abbildung 7.2: Beispiel eines Streudiagramms: Zusammenhang zwischen Lohnsteigerung X und Preissteigerung Y
Abbildung 7.3: Beispiel eines Streudiagramms bei erhöhter Fallzahl: Zusammenhang zwischen Körpergröße X und Körpergewicht Y
Kapitel 8
Abbildung 8.1: Streudiagramm mit Regressionsgerade
Abbildung 8.2: Streudiagramm mit Regressionsgerade
Kapitel 9
Abbildung 9.1: Das Venn-Diagramm für zwei einander ausschließende Ereignisse
Abbildung 9.2: Das Venn-Diagramm für drei sich gegenseitig ausschließende Ereignisse A, B und C
Abbildung 9.3: Das Venn-Diagramm stellt das Engagement der Mitarbeiter anschaulich dar.
Abbildung 9.4: Ein Venn-Diagramm für mehr als zwei sich gegenseitig überlappende Ereignisse
Abbildung 9.5: Einteilung des Ereignisraums für die Ereignisse A
1
, A
2
, A
3
und das Ereignis B
Abbildung 9.6: Ein Baumdiagramm veranschaulicht die Wahrscheinlichkeiten für alle (guten und schlechten) Taten.
Kapitel 10
Abbildung 10.1: Stabdiagramm der Wahrscheinlichkeitsverteilung der diskreten Zufallsvariablen »Würfelwurf«
Abbildung 10.2: Verteilungsfunktion eines diskreten Merkmals
Kapitel 11
Abbildung 11.1: Baumdiagramm mit Ereignissen und Binomialwahrscheinlichkeitsverteilung
Abbildung 11.2: Wahrscheinlichkeitsverteilung einer binomialverteilten Zufallsvariablen bei drei Versuchen
Kapitel 12
Abbildung 12.1: Dichtefunktion der gleichverteilten stetigen Zufallsvariablen »Zugfahrzeit«
Abbildung 12.2: Die gesuchte Wahrscheinlichkeit der stetigen Zufallsvariablen »Zugfahrzeit«
Abbildung 12.3: Lage und Form der Normalverteilung
Abbildung 12.4: Flächen unter dem Graphen der Normalverteilung
Abbildung 12.5: Flächenabschnitte unter der Standardnormalverteilung
Abbildung 12.6: Beispiel zur Bestimmung von Wahrscheinlichkeiten mithilfe der Normalverteilung. Die Wahrscheinlichkeit, dass z zwischen -1 und 3 liegt, beträgt 0,8399.
Kapitel 13
Abbildung 13.1: Das Grundprinzip des Repräsentationsschlusses
Abbildung 13.2: Stichproben und ihre Mittelwerte
Abbildung 13.3: Stichprobenmittelwertverteilung für verschiedene Merkmalsverteilungen in der Grundgesamtheit
Kapitel 14
Abbildung 14.1: Standardnormalverteilung der Stichprobenmittelwerte und Vertrauensintervalle
Abbildung 14.2: Die Dichtefunktionen der Standardnormalverteilung und t-Verteilung
Kapitel 15
Abbildung 15.1: Entscheidung über Annahme oder Ablehnung der Nullhypothese bei einem einseitigen Hypothesentest des Mittelwertes
Abbildung 15.2: Die Zusammenhänge zwischen
- und
-Fehler
Abbildung 15.3: Zweiseitiger Hypothesentest bei einer t-verteilten Teststatistik mit
Freiheitsgraden
Abbildung 15.4: Hypothesentest für Anteilswerte
Cover
Inhaltsverzeichnis
Begin Reading
C1
1
2
3
4
7
8
9
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
179
180
181
182
183
184
185
186
187
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
205
206
207
208
209
210
211
212
213
214
215
216
217
219
220
221
222
223
224
225
226
227
228
229
230
231
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
281
282
283
284
285
286
287
288
289
290
291
292
E1
Die Statistik und statistische Formeln spielen in den Wirtschafts- und Sozialwissenschaften, aber auch natürlich in den anderen Wissenschaften, ja darüber hinaus in nahezu allen privaten und beruflichen Lebensbereichen eine Rolle.
Auch wenn Sie sich dieses Buch zugelegt haben, um Ihren Statistikschein zu erwerben, werden Sie sicher auch in ganz anderen Situationen davon profitieren, glauben Sie’s mir!
Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies enthält die wichtigsten statistischen Instrumente und Formeln, die Sie im Bereich der Wirtschafts- und Sozialwissenschaften benötigen.
Es ist insbesondere für Schüler, Studierende und Lehrende aus dem Bereich der Wirtschafts- und Sozialwissenschaften konzipiert. Und da Statistik viel mit Formeln zu tun hat, wird in diesem Buch dem Verständnis und der Anwendungskompetenz der einzelnen statistischen Formeln besondere Bedeutung beigemessen. Zu jeder statistischen Formel finden Sie
eine Erläuterung des Zwecks, der Aufgabe und der Anwendungsbedingungen,
eine Beschreibung der einzelnen Symbole in der Formel,
eine Darstellung der einzelnen Arbeitsschritte zur Berechnung der Formel,
ein konkretes Anwendungsbeispiel mit vollständigem und erläutertem Lösungsweg sowie
eine Interpretation der jeweiligen Lösung beziehungsweise des Ergebnisses.
Sie sehen es schon, es ist das Anliegen von Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies, Ihnen die Statistiken und ihre Formeln nicht nur sozusagen vor die Füße zu kippen, sondern Ihnen auch nötiges Hintergrund- und Zusammenhangswissen zu vermitteln. Insbesondere durch die detaillierte Beschreibung der einzelnen Arbeitsschritte, die Sie bei der Anwendung der Formeln durchlaufen müssen, und durch die Beispiele mit ihren vollständigen Lösungswegen und Ergebnisinterpretationen wird die Voraussetzung dafür geschaffen, dass Sie die Statistiken und Formeln garantiert auch in der privaten und beruflichen Praxis erfolgreich anwenden können.
Anspruch und Ziel ist dabei aber immer:
leichte Lesbarkeit,
Verständlichkeit der Anleitungen,
praktische Anwendbarkeit und
systematische und einheitliche Darstellungsweise.
Jedes Kapitel ist so aufgebaut, dass Sie es unabhängig von den anderen lesen und bearbeiten können. Allerdings sind die Inhalte und Themen auch so aneinandergereiht, dass Sie damit am besten eine systematische Einführung und einen optimalen Einstieg in die statistischen Grundlagen erhalten.
Natürlich ist es bei dem Umfang dieses Buches nicht möglich (und das werden Sie sicherlich auch nicht erwartet haben), jedes Detail in der Statistik zu behandeln. Zum Beispiel habe ich die Zeitreihenanalyse komplett ausgelassen. Auch für eine Behandlung der kompliziertesten Statistiken und Formeln ist hier leider nicht der Platz. Dazu sind schließlich die vielen anderen dicken Statistikwälzer da.
Lassen Sie mich ein paar Vermutungen über Sie als Leser meines Buches anstellen:
Vielleicht bereiten Sie sich gerade auf eine Statistikprüfung in der Schule, in der Ausbildung oder in der Uni für das Fach Wirtschaftswissenschaften oder Sozialwissenschaften vor. Es kann auch sein, dass Sie statistische Informationen für Entscheidungen in Ihrer beruflichen Praxis benötigen oder Sie möchten einfach endlich mal die Formeln hinter den Statistiken, die Ihnen tagtäglich in Zeitungen, im Fernsehen und im Internet begegnen, kennenlernen und verstehen.
Die Aussage »Statistiken und statistische Formeln sind wirklich nur für Mathegenies oder in Zahlen verliebte Sonderlinge interessant« wäre eine durchaus törichte Annahme, wenn man sie auf den Leser von Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies beziehen würde.
Wenn Sie ein wenig Kenntnisse in der grundlegenden Schulmathematik mitbringen und ansonsten gerade begonnen haben, sich mit Statistik in Ihrem Fach, an der Hochschule oder in Ihrer beruflichen Praxis zu beschäftigen, dann ist Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies genau das richtige Buch für Sie. Aber auch wenn Sie bereits als Statistikprofi in der Lehre und Ausbildung auf dem Gebiet der Wirtschafts- und Sozialwissenschaften tätig sind, können Sie dieses Buch zur Einführung sinnvoll einsetzen. Sie sehen, selbst für richtige Profis hat es etwas anzubieten.
Wie die Statistik selbst besteht auch Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies – nach einem einführenden Teil – aus zwei großen Hauptteilen. In diesen Teilen spiegeln sich die beiden wesentlichen Gebiete oder auch das »Ying« und »Yang« der Statistik wieder: die beschreibende und die schließende Statistik. Und natürlich finden Sie in diesem Buch wie in allen Büchern der … für Dummies-Reihe auch einen Top-Ten-Teil.
Damit Sie nicht gleich ins eiskalte Wasser der statistischen Formelwelt gestoßen werden, erhalten Sie im ersten Teil erst einmal einen allgemeinen systematischen Einstieg in das Fachgebiet der Statistik. Hier werden der Zweck und die wesentlichen Aufgaben sowie der grundlegende Aufbau der Statistik vorgestellt. Damit Sie gleich kompetent informiert sind, erfahren Sie hier außerdem mehr über die Herkunft und Messung der Daten, mit denen Sie dann später Statistiken berechnen und die Ergebnisse interpretieren können.
Teil II ist dem ersten großen Teilgebiet der Statistik gewidmet: der beschreibenden Statistik. Nach einer kurzen Erläuterung der Ziele und Aufgaben der beschreibenden Statistik stelle ich Ihnen die Darstellung von statistischen Daten in Tabellen und Diagrammen vor. Dann folgt die Behandlung der wichtigsten Statistiken. Dabei handelt es sich um zentrale Lagemaße, um Streuungsmaße und Zusammenhangsmaße. Natürlich dürfen dabei auch bedeutsame statistische Kennzahlen nicht fehlen.
Um das zweite große Teilgebiet der Statistik, die schließende Statistik, geht es in Teil III. Sie lernen hier Wahrscheinlichkeiten verstehen und zu bestimmen, Wahrscheinlichkeitsverteilungen zu erkennen, zu unterscheiden und zur Berechnung von Wahrscheinlichkeiten anzuwenden. Darauf aufbauend erfahren Sie, wie Sie statistische Parameter schätzen sowie Vertrauensintervalle berechnen und sinnvoll nutzen können. Selbstverständlich erfahren Sie auch, wie Sie Hypothesen an der Realität überprüfen und testen können. So lernen Sie gleichsam alles Wichtige, was Sie unbedingt für die »Königsklasse« der Statistik im Bereich der Wirtschafts- und Sozialwissenschaften wissen müssen.
Im Top-Ten-Teil, der in keinem … für Dummies-Buch fehlen darf, finden Sie die zehn wichtigsten Formeln der Statistik noch einmal auf einen Blick. Außerdem stelle ich den Prozess von der Datengewinnung bis zur Analyse in zehn Meilensteinen dar.
Dieses Symbol kennzeichnet hilfreiche Hinweise und Tipps, die Ihnen die Arbeit mit den Formeln und der statistischen Analyse erleichtern sollen.
Dieses Symbol kennzeichnet Passagen, in denen wichtige Konzepte und Begriffe dargestellt und genauer erklärt werden. Das gibt Ihnen ein sicheres Verständnis der wichtigsten statistischen Konzepte.
Fehler sind dazu da, dass man aus ihnen lernen kann. Es erspart Ihnen aber viel Arbeit und Mühe, wenn Sie bestimmte Fehler erst gar nicht machen. Damit Sie nicht in das eine oder andere Fettnäpfchen treten, habe ich für Sie an den entsprechenden Stellen diese Warnschilder aufgestellt.
Als Newcomer fangen Sie am besten einfach am Anfang an und lesen das Buch von vorn bis hinten durch. So werden Sie systematisch in die Statistik eingeführt.
Jedes Kapitel ist aber auch für sich genommen verständlich, also springen Sie einfach in das Thema hinein, das Sie gerade beschäftigt, ganz wie Sie mögen. Viel Erfolg und Spaß dabei!
Teil I
IN DIESEM TEIL …
Gebe ich Ihnen einen kleinen Überblick über die wesentlichen Aufgaben und den Zweck der Statistik und deren Aufbau und Systematik. Ich erkläre, wo Sie die Daten und Zahlen herbekommen, auf die die statistischen Formeln angewendet werden.
Wenn Sie diese Zusammenhänge kennen, können Sie entscheiden, welche Statistik Sie am besten für welches statistische Problem nutzen.
Kapitel 1
IN DIESEM KAPITEL
Ursprünge der Statistik und ihre Bedeutung heute
Ziele und Aufgaben der Statistik
Aufbau und wesentliche Bestandteile der Statistik
Statistik wird schon so lange betrieben wie es Mathematik gibt. Ihre Wurzeln reichen bis in die Zeit der Entstehung der Schrift vor mehr als 5000 Jahren zurück. Erste Volkszählungen gab es bereits bei den alten Ägyptern vor mehr als 2000 Jahren. Heute ist die Statistik selbst aus unserem Privatleben nicht mehr wegzudenken und allgegenwärtig. Jedes Mal, wenn Sie eine Zeitung aufschlagen, werden Sie darin Tabellen, Diagramme und statistische Kennzahlen zu den verschiedensten gesellschaftlichen, wirtschaftlichen und technischen Bereichen finden. Kaum eine Nachrichtensendung wird ausgestrahlt, ohne dass darin statistische Informationen enthalten sind. Es gibt keinen gesellschaftlichen, kulturellen, naturwissenschaftlichen, volkswirtschaftlichen und auch keinen betrieblichen Bereich in Unternehmen, für den nicht Statistiken erstellt werden. Selbst in der Unterhaltung und der Freizeit ist Statistik nicht wegzudenken. Denken Sie nur an die vielen Statistiken, die Sie in jeder Sportnachrichtensendung präsentiert bekommen. Ganz offenbar benötigt man heute in allen Bereichen menschlichen Handelns statistische Kenntnisse, wenn man informiert sein möchte oder mitreden will. Warum ist das so?
Eine Antwort auf diese Frage können Sie finden, wenn Sie sich anschauen, um was es bei der Statistik geht. Statistik leitet sich aus dem lateinischen Wort »status« ab, was so viel wie Zustand, Verfassung oder Stand der Dinge meint. Antike Herrscher wollten sich bereits zu vorchristlichen Zeiten ein Bild vom Zustand ihres Staates machen und Informationen über die Verhältnisse im Lande gewinnen. Weil der Staat sich schon damals aus vielen Teilen zusammensetzte (zum Beispiel Menschen, Tieren, Weideflächen etc.), ging es darum, eine Vorstellung über den Zustand dieser »Massen« eines Staates insgesamt zu gewinnen. Die Information über die Zahl der Sklaven, Krieger, Frauen, Kinder, Rinder, Pferde, Boote, Ackerflächen etc. war für die Staatslenker von strategischer Bedeutung für ihre Entscheidungen.
Auch heute noch geht es bei der Statistik um das zahlenmäßige Erfassen, Klassifizieren, Auswerten, Analysieren und Präsentieren von Daten über Massen, Gesamtheiten oder Populationen.
Die Statistik benötigen Sie vor allem, um informierte und das heißt richtige oder bessere Entscheidungen für Probleme treffen zu können, die sich nicht auf Einzelfälle, sondern auf Gesamtheiten oder Massenerscheinungen beziehen oder von denen ganze Bevölkerungen beziehungsweise Populationen betroffen sind. Beispielsweise müssen Politiker über Gesetze entscheiden, die das Wohl von Millionen von Bürgern beeinflussen; denken Sie nur mal an die Steuergesetzgebung.
Die Anwendung der Methoden und Instrumente der Statistik finden Sie nicht nur in der Politik, Sie finden sie in allen gesellschaftlichen Bereichen. In nahezu jeder wissenschaftlichen Fachdisziplin (selbst in einem literaturwissenschaftlichen Studium) werden Sie den statistischen Methoden und Instrumenten begegnen. Die folgende Liste zeigt Ihnen Beispiele für betriebliche Einsatzgebiete für die Statistik innerhalb von Unternehmen:
Marktforschung:
Konsumentenstrukturen und Präferenzen
Produktplanung:
Wirtschaftstrends, detaillierte Verkaufsbudgets
Finanzanalysen:
Jahresberichte, Kosten- und Einnahmedaten
Vorhersagen:
Absatzentwicklung, Beschäftigungsentwicklung, Produktivitätsentwicklung
Prozess- und Qualitätskontrollen
Arbeitnehmerstatistik:
Absentismus (eine Statistik, die sich mit dem Fernbleiben von Arbeitnehmern vom Arbeitsplatz zum Beispiel aufgrund von Krankheiten beschäftigt), Personalfluktuation
Innerhalb der Statistik unterscheidet man zwei große Aufgabengebiete:
die deskriptive Statistik,
die schließende Statistik.
Beide Bereiche der Statistik informieren Sie über:
Zustände
, die eine Gesamtheit oder eine Stichprobe von statistischen Einheiten hinsichtlich bestimmter Merkmale mengenmäßig charakterisieren (zum Beispiel die Bevölkerung eines Landes bezüglich des Umfangs von Arbeitslosigkeit, Einkommen und Vermögen)
Ursachen
, Faktoren oder Gründe, die zu einem bestimmten Zustand in der Gesamtheit geführt haben (zum Beispiel warum nur wenige Personen in der Bevölkerung ein vergleichsweise deutlich höheres Einkommen haben)
Prognosen
, die sich auf die künftige Entwicklung, wie sich die Gesamtheit bezüglich der betrachteten Merkmale in Zukunft entwickeln wird, beziehen (zum Beispiel darüber, wie sich die Lücke zwischen den besser Verdienenden und der übrigen Bevölkerung verändern wird)
Techniken
, um bestimmte Zustände oder Ziele zu erreichen (zum Beispiel, dass sich die Lücke zwischen Arm und Reich in der Bevölkerung durch bessere Bildung und Qualifikation in den unteren Schichten der Gesellschaft schließen lässt)
Schlussfolgerungen
, das heißt mögliche Ansatzpunkte für weitere Hypothesen und Theorien, die aus den Daten gewonnen werden können
Die deskriptive und die schließende Statistik bilden die beiden wichtigsten Gebiete in der Statistik. Gemäß dieser Unterscheidung ist auch Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies entsprechend aufgebaut. Abbildung 1.1 fasst die statistischen Teilgebiete, wie sie auch in den Formeln und Kapiteln dieses Buches thematisiert werden, zusammen.
Abbildung 1.1: Übersicht über die Teilgebiete der Statistik
Wie schon im Namen zum Ausdruck kommt, dient Ihnen die deskriptive Statistik, die manchmal auch beschreibende Statistik genannt wird, der genauen Beschreibung von statistischen Gesamtheiten.
Die deskriptive Statistik dient dazu, anhand von Stichproben Fakten und Daten über Populationen, die auch Grundgesamtheiten genannt werden, zu sammeln, sie für die Analyse aufzubereiten, sie auszuwerten, zu analysieren und zu interpretieren sowie sie systematisch, geordnet und informativ darzustellen.
Die Beschreibung der Sie interessierenden Eigenschaften der Gesamtheit erfolgt dabei anhand von statistischen Tabellen, Diagrammen oder zusammenfassenden Zahlen (zum Beispiel welche Einkommensstruktur, welchen Altersaufbau und welchen Bildungsgrad die Bevölkerung Deutschlands am Anfang des Jahres 2013 hatte).
Die Gesamtheit, die oft auch als Grundgesamtheit, Population oder statistische Masse bezeichnet wird, ist die Gesamtzahl oder die Menge aller Objekte oder Personen beziehungsweise der »statistischen Einheiten«, über die »statistische Daten« und Informationen gewonnen werden sollen. Die Eigenschaften, nach denen die statistischen Einheiten analysiert werden sollen, heißen statistische Merkmale oder Variablen.
Lassen Sie mich diese Begriffe an einem kleinen Beispiel erörtern. Stellen Sie sich vor, Sie wären zum Beispiel an der Verteilung des durchschnittlichen Einkommens von Männern und Frauen in einer bestimmten beruflichen Position interessiert. Die Grundgesamtheit besteht in diesem Fall einfach aus allen Erwerbstätigen in dieser beruflichen Position. Jeder einzelne dieser Erwerbstätigen ist dabei eine statistische Einheit. Es werden zwei statistische Merkmale an diesen Einheiten erhoben: das durchschnittliche Einkommen und das Geschlecht. Da unterschiedliche Personen ein unterschiedliches Einkommen haben werden, ist hier auch der Begriff »Variable« sinnvoll.
Nachdem Sie die Daten gesammelt haben, geht es im nächsten Schritt darum, sie möglichst gut darzustellen, um charakteristische Strukturen innerhalb der Daten erkennen zu können.
Die Möglichkeiten, Instrumente oder Formen der Beschreibung reichen von eindimensionalen Tabellen und Diagrammen über einfache statistische Kennzahlen bis hin zu komplexen mehrdimensionalen statistischen Analysetools.
Zu den wichtigsten Instrumenten der deskriptiven Statistik zählen:
Datentabellen:
Tabellen, in denen die Daten zu den betrachteten statistischen Merkmalen systematisch zusammengefasst präsentiert werden (mehr erfahren Sie darüber in
Kapitel 3
)
Diagramme:
Daten der statistischen Merkmale in Form von Bildern anschaulich und informativ präsentieren (siehe auch
Kapitel 3
)
Zentrale Lagemaße:
Statistiken, die in einer Zahl die Werte eines statistischen Merkmals beschreiben (zum Beispiel das arithmetische Mittel, das Ihnen das durchschnittliche Einkommen des Merkmals »Bevölkerungseinkommen« mitteilt; mehr hierzu in
Kapitel 4
)
Streuungsmaße:
Statistiken, die in einer Zahl mitteilen, wie weit die einzelnen Werte eines Merkmals vom Durchschnitt entfernt liegen (wie stark zum Beispiel die einzelnen Einkommen in der Bevölkerung vom Durchschnittseinkommen entfernt sind; mehr hierzu in
Kapitel 5
)
Kennzahlen:
Zahlen, die die Werte anderer statistischer Kennzahlen zusammenfassen (zum Beispiel der Preisindex für Lebenshaltungskosten, der die Information über die Preisentwicklung vieler verschiedener Güter in einer Zahl komprimiert; mehr hierzu in
Kapitel 6
)
Zusammenhangsmaße:
statistische Maßzahlen, die auch als Koeffizienten bezeichnet werden, die die Stärke der Beziehung zwischen verschiedenen statistischen Merkmalen beschreiben (zum Beispiel inwiefern die Höhe des Einkommens von der Länge der Berufserfahrung abhängt; mehr hierzu in
Kapitel 7
)
Die zentralen Instrumente der deskriptiven Statistik, die Sie im Detail in Teil II kennenlernen, sind
Präsentation statistischer Informationen mithilfe von Diagrammen,
Zusammenfassung von Daten einzelner Merkmale beziehungsweise Variablen mithilfe zentraler Lagemaße,
Berechnung von Streuungsmaßen zur Beschreibung der Abweichung der einzelnen Werte von den zentralen Lagemaßen,
Ermittlung und Beschreibung der Beziehung zwischen einzelnen statistischen Merkmalen mithilfe von Zusammenhangsmaßen.
Die so beschriebenen und analysierten Merkmale können auf verschiedene Weise gemessen werden (zu den Messniveaus erfahren Sie mehr in Kapitel 2):
nominal
, das heißt, die möglichen Werte eines an den einzelnen statistischen Einheiten gemessenen Merkmals lassen sich nur unterscheiden
ordinal
, das heißt, die möglichen Werte eines an den einzelnen statistischen Einheiten gemessenen Merkmals lassen sich zudem in eine Rangordnung bringen
metrisch
, das heißt, die Unterschiede in den möglichen Werten eines an den einzelnen statistischen Einheiten gemessenen Merkmals lassen sich zusätzlich mithilfe genormter Messeinheiten quantifizieren beziehungsweise zahlenmäßig in ihrer Größenordnung ausdrücken
Die deskriptiven Statistiken und ihre Zuordnung zu den jeweiligen Messniveaus sehen Sie im Überblick in Tabelle 1.1. Außerdem können Sie der Tabelle entnehmen, in welchen Kapiteln die erwähnten Themen behandelt werden.
Statistiken
Skalenniveaus
Nominal
Ordinal
Metrisch
Maße der Tendenz beziehungs-weise Lagemaße
Modus
(siehe Kapitel 4)
Median
Quartile
Perzentile
(siehe Kapitel 4)
arithmetisches Mittel
gewichtetes Mittel
geometrisches Mittel
(siehe Kapitel 4)
Maße der Variabilität
nicht sinnvoll, da Zahlen nicht von Bedeutung sind und nur zur Unterscheidung der Kategorien der Merkmale dienen
Abstand
interquartiler Abstand
(siehe Kapitel 5)
mittlere Abweichung
Varianz
Standardabweichung
Variationskoeffizient
(siehe Kapitel 5)
Beziehungs-maße
Chi-Quadrat
Pearsons Kontingenz
(siehe Kapitel 7)
Spearmans Rangkorre-lation
(siehe Kapitel 7)
Bravais-Pearson-Korrelation
Kovarianz
(siehe Kapitel 7)
Regressionskoeffizient
Determinationskoeffizient
(siehe Kapitel 8)
Tabelle 1.1: Der Zusammenhang zwischen Statistiken und Messniveaus
Die Statistiken der deskriptiven Statistik sind nur für die in der Untersuchung erfassten Untersuchungseinheiten aussagekräftig und für die in die Berechnung einbezogenen Daten, das heißt, Sie können die daraus resultierenden Ergebnisse auch nur auf die analysierten Fälle und Daten beziehen und nicht auf andere Fälle übertragen.
Auch wenn Ihnen eine Stichprobe von Daten aus einer umfassenderen Gesamtheit vorliegt, können Sie statistische Ergebnisse, die Sie anhand der Methoden, Instrumente und Statistiken der deskriptiven Statistik gewonnen haben, nur auf die Daten in dieser Stichprobe beziehen und nicht auf die Gesamtheit, aus der die Stichprobe kommt. Wenn Sie das tun wollen, müssen Sie über die deskriptive Statistik hinaus auf das Instrumentarium der schließenden Statistik zurückgreifen.
Die schließende Statistik (auch Inferenzstatistik oder induktive Statistik genannt) ist neben der deskriptiven Statistik die zweite wesentliche Säule der Statistik. Sie benötigen sie zusätzlich immer dann, wenn Sie nicht alle für eine Analyse interessanten Fälle in Ihre Datenerhebung einbeziehen können. Ihnen steht somit nur ein Teil oder eine Stichprobe der Daten aus der Gesamtheit der Untersuchungseinheiten für die Analyse zur Verfügung. Sie möchten aber dennoch etwas über die Verhältnisse in der Gesamtheit aussagen.
Wählen Sie nur einen Teil der statistischen Einheiten aus der Grundgesamtheit für die statistischen Analysen aus, so handelt es sich um eine Teilerhebung beziehungsweise Stichprobe. Anhand der Ergebnisse der statistischen Analysen mit der Stichprobe wollen Sie auf die entsprechenden Werte in der betreffenden Grundgesamtheit schließen. Aus dieser Aufgabe ergibt sich auch der Name für die schließende Statistik, die auch oft als Inferenzstatistik bezeichnet wird, was aber nichts anderes bedeutet. Die Grundlage dafür, dass Sie aus den Ergebnissen einer Stichprobe einen repräsentativen Schluss auf die Verhältnisse in der Grundgesamtheit ziehen können, ist die Wahrscheinlichkeitsrechnung. Darauf bauen die statistischen Schätzverfahren und die Methoden zum Testen von Hypothesen auf.
Eine Hypothese ist eine noch nicht anhand von Daten systematisch überprüfte und analysierte oder bestätigte Behauptung, Aussage oder Vermutung.
Besonders wichtige Konzepte, Verfahren und Instrumente, die Sie in der schließenden Statistik antreffen, sind:
Zufallsexperiment:
ein Experiment, dessen mögliche Ereignisse zufällig mit einer bestimmten Wahrscheinlichkeit auftreten und daher nicht eindeutig vorhergesagt werden können (mehr hierzu in
Kapitel 10
)
Zufallsvariablen:
die bei dem Experiment betrachteten Merkmale, deren Werte zufällig auftreten (siehe
Kapitel 10
)
Wahrscheinlichkeitsverteilung:
die den möglichen Werten der Zufallsvariablen zugeordneten Wahrscheinlichkeiten (mehr hierzu in
Kapitel 11
und
Kapitel 12
)
Stichprobe:
ein Teil einer statistischen Gesamtheit; anhand der Stichprobe gewinnen Sie statistische Informationen über diese Gesamtheit (siehe dazu
Kapitel 13
)
Schätzverfahren:
ein Verfahren, mit dem Sie von den Daten beziehungsweise Ergebnissen aus einer Stichprobe auf die Verhältnisse in der statistischen Gesamtheit schließen (mehr hierzu in
Kapitel 14
)
Parameter- und Hypothesentest:
ein Test, mit dem Sie anhand der Ergebnisse aus einer Stichprobe überprüfen können, ob bestimmte Annahmen oder Hypothesen, die Sie über die Verhältnisse in der Grundgesamtheit haben, zutreffen (siehe
Kapitel 15
)
Zwei Aufgabentypen der schließenden Statistik sind besonders wichtig:
Schätzung der Werte nicht bekannter Grundgesamtheitsparameter (wie das arithmetische Mittel einer Variablen in einer Population)
Zum Beispiel können Sie die durchschnittlichen Einkommen der Männer und Frauen einer Stichprobe berechnen und mithilfe der Verfahren der schließenden Statistik auf die Durchschnittseinkommen von Männern und Frauen in der gesamten Population, aus der Sie die Stichprobe gezogen haben, schließen.
Hypothesentest über die Werte von Populationsparametern (zum Beispiel darüber, dass das arithmetische Mittel einen bestimmten Wert hat)
Ausgehend von einer Hypothese über die Durchschnittseinkommen von Männern und Frauen in der gesamten Population erheben Sie eine Stichprobe aus der Gesamtpopulation und überprüfen anhand der Daten aus der Stichprobe und mithilfe der Verfahren der schließenden Statistik, ob die Hypothese zutrifft oder nicht. Wenn Sie in unserem Beispiel die Annahme haben, dass Frauen und Männer in gleichen beruflichen Positionen das gleiche Einkommen erzielen, können Sie diese Annahme auf diese Weise »empirisch«, das heißt erfahrungsgestützt, überprüfen.
Um zuverlässig schließen zu können, benötigen Sie eine repräsentative Stichprobe von Männern und Frauen mit der betreffenden beruflichen Position sowie zuverlässige Angaben über deren Einkommen. Repräsentativ ist eine Stichprobe dann, wenn sie sozusagen ein Abbild der Grundgesamtheit ist. Eine wesentliche Bedingung dafür ist die zufällige Auswahl der Fälle in die Erhebung. Erst unter dieser Voraussetzung ist es möglich, anhand der Ergebnisse der Stichproben festzustellen, mit welcher Wahrscheinlichkeit die Hypothese der Wirklichkeit entspricht.
Die Beschränkung auf eine Stichprobe und damit der Rückgriff auf die schließende Statistik bietet sich vor allem dann an, wenn Sie
zu hohe Kosten für die Datenerhebung vermeiden wollen,
den zeitlichen Aufwand für die Datenerhebung verringern wollen und/oder
aus sachlogischen, praktischen Gründen auf eine Total- oder Gesamterhebung zugunsten einer Stichprobe verzichten müssen.
Beispielhaft für den Fall des Verzichts aus sachlogischen Gründen auf eine Vollerhebung ist die Qualitätskontrolle im Bereich der Herstellung von Produkten, in dem Sie die Haltbarkeit testen wollen. Wenn Sie alle Produkte, die Sie herstellen, einem Haltbarkeitstest zuführen würden, hätten Sie am Ende keine Produkte mehr, die Sie Ihren Kunden anbieten könnten. Es ist also praktisch gar nicht möglich, alle Produkte auf ihre Haltbarkeit hin zu testen. Natürlich würde es auch viel mehr Zeit beanspruchen und Kosten verursachen, wenn Sie statt einer repräsentativen Stichprobe alle Produkte testen wollten.
Kapitel 2
IN DIESEM KAPITEL
Vom Problem zur Fragestellung einer statistischen Untersuchung
Festlegen des Datenerhebungsdesigns: Definition der Methode, der statistischen Einheiten, des statistischen Verfahrens
Messniveaus und Variablentypen
Der Datensatz als Grundlage für statische Analysen
Die Daten, aus denen Sie mithilfe der Statistik Informationen gewinnen können, fallen nicht einfach vom Himmel. Sie können sie mithilfe der Methoden der empirischen (das heißt der systematisch auf Erfahrung beruhenden) Forschung erheben, es sei denn, jemand hat diesen Job schon für Sie erledigt und Sie brauchen nur noch auf die Daten zurückzugreifen. Die Datenerhebung selbst ist oft nur Teil eines umfassenderen statistischen Untersuchungsprojekts. Sie will gut geplant sein. Dazu müssen Sie in jedem Fall folgende Maßnahmen durchführen:
Stellen Sie den Informationsbedarf fest.
Setzen Sie die Ziele.
Legen Sie den Untersuchungsansatz fest.
Konzipieren Sie das Datenerhebungsdesign.
Eine gute Vorbereitung ist das A und O einer statistischen Untersuchung. Deshalb sollten Sie bei der Vorbereitung der Datenerhebung keine Mühen scheuen. Ausgangspunkt der Datenerhebung ist in der Regel ein Informationsbedarf, der sich aus einem praktischen oder theoretischen Problem ergibt. Erheben Sie also Ihre Daten
zielgerichtet und
zweckbestimmt.
Der Informationsbedarf führt Sie also ganz schnell zur Definition der Ziele.
Um die Ziele zu definieren, sind folgende Schritte notwendig:
Artikulieren Sie das Problem und grenzen es von anderen Problemen ab.
Leiten Sie aus dieser Ausgangssituation und Problemskizze die Ziele der Untersuchung ab.
Leiten Sie aus diesen Zielen die Fragestellungen für die Untersuchung ab.
Bevor Sie sich an die Datenerhebung machen, schauen Sie erst einmal, welche Informationen Ihnen bereits zu dem Untersuchungsthema vorliegen oder welche Sie ohne eine eigene Datenerhebung beschaffen können. Diese Informationen können Sie beispielsweise durch Internetrecherchen, Dokumentenanalysen, Literatursichtung und die Sichtung von bereits vorhandenen Untersuchungen und vorhandenen Daten gewinnen.
Sind benötigte Daten noch nicht vorhanden, müssen Sie sie erst noch erheben. Dieser Vorgang der erstmaligen Erhebung der Daten wird unter Statistikern Primärerhebung genannt und die Daten daraus werden als Primärdaten bezeichnet. Schon vorhandene Daten beziehungsweise bereits durchgeführte Erhebungen werden als Sekundärdaten oder als Sekundärerhebungen bezeichnet (so beispielsweise die Daten vom Statistischen Bundesamt und den statistischen Landesämtern). Alle Daten müssen ursprünglich natürlich irgendwann im Rahmen einer Primärerhebung gewonnen werden.
Wenn Sie die Daten selbst erheben wollen oder müssen, sollten Sie nicht sofort einfach loslegen und etwa mit einem ad hoc entworfenen Fragebogen Daten von irgendwelchen Personen erfragen, sondern sich erst einmal zurücklehnen und die nächsten Schritte sorgfältig planen. Bevor Sie die Detailplanung für die Datensammlung in Angriff nehmen, ist es für die gezielte Datengewinnung hilfreich oder in vielen Fällen sogar nötig, wenn Sie im Anschluss an die Fragestellungen als nächstes Folgendes tun:
Formulieren Sie die zentralen Aussagen, das theoretische Modell und die Hypothesen, zu denen Sie Informationen benötigen oder die Sie mit den Daten überprüfen wollen.
Bestimmen Sie die zentralen Begriffe, die Sie dabei verwenden.
Legen Sie die Grundgesamtheit fest, das heißt die Menge aller für die Fragestellung relevanten statistischen Einheiten (Untersuchungsobjekte, Fälle, Befragte etc.), an denen die Daten erhoben werden sollen.
Identifizieren Sie die statistischen Merkmale, die an den statistischen Einheiten gemessen werden sollen.
Mit der Ausformulierung des theoretischen Modells, der zentralen Aussagen und Hypothesen geben Sie genau vor, was Sie untersuchen wollen und welche Informationen Sie benötigen.
Wenn Sie die Fragestellung untersuchen wollen, ob in einer Wirtschaftsbranche die Mitarbeiter aufgrund des Geschlechts diskriminiert werden, stellen Sie zum Beispiel die Hypothese »Frauen verdienen in der Branche X im Land Z im Jahr Y durchschnittlich 30 Prozent weniger als Männer bei gleicher Tätigkeit und Qualifikation« auf.