Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies - Thomas Krickhahn - E-Book

Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies E-Book

Thomas Krickhahn

0,0
15,99 €

-100%
Sammeln Sie Punkte in unserem Gutscheinprogramm und kaufen Sie E-Books und Hörbücher mit bis zu 100% Rabatt.
Mehr erfahren.
Beschreibung

Dieses Buch enthält die wichtigsten statistischen Instrumente und Formeln, die Sie in den Wirtschafts- und Sozialwissenschaften benötigen. Besonderer Wert wird darauf gelegt, dass Sie jede einzelne Formel verstehen und anwenden können. Zu jeder Formel finden Sie deshalb eine Erläuterung der Anwendungsfälle, eine detaillierte Beschreibung der einzelnen Symbole in der Formel und der notwendigen Rechenschritte, ein Anwendungsbeispiel mit vollständigem und erläutertem Rechenweg sowie eine Interpretation des jeweiligen Ergebnisses.

Sie lesen das E-Book in den Legimi-Apps auf:

Android
iOS
von Legimi
zertifizierten E-Readern

Seitenzahl: 400

Bewertungen
0,0
0
0
0
0
0
Mehr Informationen
Mehr Informationen
Legimi prüft nicht, ob Rezensionen von Nutzern stammen, die den betreffenden Titel tatsächlich gekauft oder gelesen/gehört haben. Wir entfernen aber gefälschte Rezensionen.



Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies

Schummelseite

DIE STANDARDNORMALVERTEILUNG

In der Standardnormalverteilungstabelle dargestelltes Flächenvolumen unter der Dichtefunktion einer standardnormalverteilten Zufallsvariablen Z

Die Einträge in der Tabelle stellen die Fläche zwischen 0 und z > 0 dar. Beispielsweise umfasst die Fläche zwischen 0 und z = 1,99 insgesamt 47,67 Prozent der Fläche, das heißt, die Wahrscheinlichkeit einen z-Wert zwischen z = 0 und z = 1,99 zu erhalten, beträgt P(0 ≤ Z ≤ 1,99) = 0,4767. Genau diesen Wert können Sie direkt aus der Standardnormalverteilungstabelle entnehmen. Sie müssen dazu nur in der ersten Spalte den Wert 1,9 und in der ersten Zeile den Wert 0,09 wählen; dann können Sie die Fläche im Schnittpunkt der entsprechenden Zeile und Spalte ablesen.

STANDARDNORMALVERTEILUNGSTABELLE

Z-Werte

0

0,01

0,02

0,03

0,04

0,05

0,06

0,07

0,08

0,09

Flächenanteile unter der Standardnormalverteilung

0

0

0,004

0,008

0,012

0,016

0,0199

0,0239

0,0279

0,0319

0,0359

0,1

0,0398

0,0438

0,0478

0,0517

0,0557

0,0596

0,0636

0,0675

0,0714

0,0753

0,2

0,0793

0,0832

0,0871

0,091

0,0948

0,0987

0,1026

0,1064

0,1103

0,1141

0,3

0,1179

0,1217

0,1255

0,1293

0,1331

0,1368

0,1406

0,1443

0,148

0,1517

0,4

0,1554

0,1591

0,1628

0,1664

0,17

0,1736

0,1772

0,1808

0,1844

0,1879

 

 

 

 

 

 

 

 

 

 

 

0,5

0,1915

0,195

0,1985

0,2019

0,2054

0,2088

0,2123

0,2157

0,219

0,2224

0,6

0,2257

0,2291

0,2324

0,2357

0,2389

0,2422

0,2454

0,2486

0,2518

0,2549

0,7

0,258

0,2612

0,2642

0,2673

0,2704

0,2734

0,2764

0,2794

0,2823

0,2852

0,8

0,2881

0,291

0,2939

0,2967

0,2995

0,3023

0,3051

0,3078

0,3106

0,3133

0,9

0,3159

0,3186

0,3212

0,3238

0,3264

0,3289

0,3315

0,334

0,3365

0,3389

 

 

 

 

 

 

 

 

 

 

 

1

0,3413

0,3438

0,3461

0,3485

0,3508

0,3531

0,3554

0,3577

0,3599

0,3621

1,1

0,3643

0,3665

0,3686

0,3708

0,3729

0,3749

0,377

0,379

0,381

0,383

1,2

0,3849

0,3869

0,3888

0,3907

0,3925

0,3944

0,3962

0,398

0,3997

0,4015

1,3

0,4932

0,4049

0,4066

0,4082

0,4099

0,4115

0,4131

0,4147

0,4162

0,4177

1,4

0,4192

0,4207

0,4222

0,4236

0,4251

0,4265

0,4279

0,4292

0,4306

0,4319

 

 

 

 

 

 

 

 

 

 

 

1,5

0,4332

0,4345

0,4357

0,437

0,4382

0,4394

0,4406

0,4418

0,4429

0,4441

1,6

0,4452

0,4463

0,4474

0,4484

0,4495

0,4505

0,4515

0,4525

0,4535

0,4545

1,7

0,4554

0,4564

0,4573

0,4582

0,4591

0,4599

0,4608

0,4616

0,4625

0,4633

1,8

0,4641

0,4649

0,4656

0,4664

0,4671

0,4678

0,4686

0,4693

0,4699

0,4706

1,9

0,4713

0,4719

0,4726

0,4732

0,4738

0,4744

0,475

0,4756

0,4761

0,4767

 

 

 

 

 

 

 

 

 

 

 

2

0,4772

0,4778

0,4783

0,4788

0,4793

0,4798

0,4803

0,4808

0,4812

0,4817

2,1

0,4821

0,4826

0,483

0,4834

0,4838

0,4842

0,4846

0,485

0,4854

0,4857

2,2

0,4861

0,4864

0,4868

0,4871

0,4875

0,4878

0,4881

0,4884

0,4887

0,489

2,3

0,4893

0,4896

0,4898

0,4901

0,4904

0,4906

0,4909

0,4911

0,4913

0,4916

2,4

0,4918

0,492

0,4922

0,4925

0,4927

0,4929

0,4931

0,4932

0,4934

0,4936

 

 

 

 

 

 

 

 

 

 

 

2,5

0,4938

0,494

0,4941

0,4943

0,4945

0,4946

0,4948

0,4949

0,4951

0,4952

2,6

0,4953

0,4955

0,4956

0,4957

0,4959

0,496

0,4961

0,4962

0,4963

0,4964

2,7

0,4965

0,4966

0,4967

0,4968

0,4969

0,497

0,4971

0,4972

0,4973

0,4974

2,8

0,4974

0,4975

0,4976

0,4977

0,4977

0,4978

0,4979

0,4979

0,498

0,4981

2,9

0,4981

0,4982

0,4982

0,4983

0,4984

0,4984

0,4985

0,4985

0,4986

0,4986

 

 

 

 

 

 

 

 

 

 

 

3

0,4986

0,4987

0,4987

0,4988

0,4988

0,4989

0,4989

0,4989

0,499

0,499

DIE T-VERTEILUNG

In der t-Verteilungstabelle dargestellter Flächenbereich einer t-verteilten Zufallsvariablen tdf mit df Freiheitsgraden

Die t-Verteilung verwenden Sie statt der Standardnormalverteilung, wenn der Stichprobenumfang 30 oder weniger statistische Einheiten umfasst. Die Einträge in der t-Verteilungstabelle zeigen Ihnen die t-Werte für bestimmte Flächen beziehungsweise Wahrscheinlichkeiten, die oberhalb dieser t-Werte in den nach Freiheitsgraden unterschiedenen t-Verteilungen liegen. Wenn die Zufallsvariable t beispielsweise einer t-Verteilung mit zehn Freiheitsgraden folgt, ist die Wahrscheinlichkeit, einen größeren Wert als 1,812 zu erhalten, P(t > 1,812) = 0,05; das bedeutet gleichermaßen, dass die Fläche unter der t-Verteilung, die über dem t-Wert von 1,812 liegt, nur fünf Prozent der gesamten Fläche der t-Verteilung mit zehn Freiheitsgraden einnimmt.

T-TABELLE

Freiheitsgrade

Oberer Teil der t-Verteilung

0,01

0,005

0,1t-Werte

0,05

0,025

1

3,078

6,314

12,706

31,821

63,657

2

1,886

2,92

4,303

6,965

9,925

3

1,638

2,353

3,182

4,541

5,841

4

1,533

2,132

2,776

3,747

4,604

 

 

 

 

 

 

5

1,476

2,015

2,571

3,365

4,032

6

1,44

1,943

2,447

3,143

3,707

7

1,415

1,895

2,365

2,998

3,499

8

1,397

1,86

2,306

2,896

3,355

9

1,383

1,833

2,262

2,821

3,25

 

 

 

 

 

 

10

1,372

1,812

2,228

2,764

3,169

11

1,363

1,796

2,201

2,718

3,106

12

1,356

1,782

2,179

2,681

3,055

13

1,35

1,771

2,16

2,65

3,012

14

1,345

1,761

2,145

2,624

2,977

 

 

 

 

 

 

15

1,341

1,753

2,131

2,602

2,947

16

1,337

1,746

2,12

2,583

2,921

17

1,333

1,74

2,11

2,567

2,898

18

1,33

1,734

2,101

2,552

2,878

19

1,328

1,729

2,093

2,539

2,861

 

 

 

 

 

 

20

1,325

1,725

2,086

2,528

2,845

21

1,323

1,721

2,08

2,518

2,831

22

1,321

1,717

2,074

2,508

2,819

23

1,319

1,714

2,069

2,5

2,807

24

1,318

1,711

2,064

2,492

2,797

 

 

 

 

 

 

25

1,316

1,708

2,06

2,485

2,787

26

1,315

1,706

2,056

2,479

2,779

27

1,314

1,703

2,052

2,473

2,771

28

1,313

1,701

2,048

2,467

2,761

29

1,311

1,699

2,045

2,462

2,756

 

 

 

 

 

 

30

1,31

1,697

2,042

2,457

2,75

40

1,303

1,684

2,021

2,423

2,704

60

1,296

1,671

2

2,39

2,66

120

1,289

1,658

1,98

2,358

2,617

1,282

1,645

1,96

2,326

2,576

Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies

Bibliografische Information der Deutschen Nationalbibliothek

Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar.

2. Auflage 2019

© 2019 WILEY-VCH Verlag GmbH & Co. KGaA, Weinheim

All rights reserved including the right of reproduction in whole or in part in any form.

Alle Rechte vorbehalten inklusive des Rechtes auf Reproduktion im Ganzen oder in Teilen und in jeglicher Form.

Wiley, the Wiley logo, Für Dummies, the Dummies Man logo, and related trademarks and trade dress are trademarks or registered trademarks of John Wiley & Sons, Inc. and/or its affiliates, in the United States and other countries. Used by permission.

Wiley, die Bezeichnung »Für Dummies«, das Dummies-Mann-Logo und darauf bezogene Gestaltungen sind Marken oder eingetragene Marken von John Wiley & Sons, Inc., USA, Deutschland und in anderen Ländern.

Das vorliegende Werk wurde sorgfältig erarbeitet. Dennoch übernehmen Autoren und Verlag für die Richtigkeit von Angaben, Hinweisen und Ratschlägen sowie eventuelle Druckfehler keine Haftung.

Coverfoto: © Cifotart – stock.adobe.comKorrektur: Frauke Wilkens

Print ISBN: 978-3-527-71561-9ePub ISBN: 978-3-527-81947-8

Über den Autor

Thomas Krickhahn hat Wirtschafts- und Sozialwissenschaften studiert und an der philosophischen Fakultät der Martin-Luther-Universität in Halle-Wittenberg promoviert (1995). Er hat eine mehrjährige Erfahrung im Bereich der empirischen Wirtschaftsforschung als Forschungsassistent und wissenschaftlicher Gutachter. Auch als Dozent ist er unter anderem in den Bereichen Volkswirtschaftslehre, quantitative Methoden und Betriebswirtschaftslehre (an Weiterbildungseinrichtungen, Fachhochschulen und Universitäten) langjährig tätig. Er ist Autor mehrerer Publikationen im Bereich der wirtschafts- und sozialwissenschaftlichen Forschung und Lehre. Zurzeit ist er als wissenschaftlicher Projektleiter an der Hochschule Bonn-Rhein-Sieg und als Dozent für die Bonner Akademie (Gesellschaft für DV- und Management-Training, Bildung und Beratung mbH) tätig.

Über den Fachkorrektor

Dominik Poß studierte Volkswirtschaftslehre an der Rheinischen Friedrich-Wilhelms-Universität Bonn. Bereits während seines Studiums legte er sein Augenmerk auf das Fachgebiet Statistik und begleitete als Tutor erfolgreich zahlreiche Studenten durch die Grundvorlesungen der Statistik.

Zur Zeit ist er Doktorand an der Bonn Graduate School of Economics und beschäftigt sich am Institut für Finanzmarktökonomik und Statistik der Universität Bonn mit der Analyse von funktionalen Daten, hochdimensionalen Regressionsproblemen und der Variablenselektion.

Danksagung

Die Niederschrift von Büchern ist mit viel Zeit verbunden. Zeit die der Autor nicht seinen Nächsten widmen kann. Mein Dank gilt daher zuallererst meiner lieben Frau, Susanne Krickhahn. Die Qualität des Werks hängt nicht zuletzt auch an den Menschen, die bei der Erstellung unterstützend mitgewirkt haben. Meiner Lektorin, Frau Esther Neuendorf, und meinem Fachlektor, Herrn Dominik Poß, bin ich für die vielen wertvollen Hinweise und Korrekturen sehr dankbar.

Thomas KrickhahnBonn, im Frühjahr 2019

Inhaltsverzeichnis

Cover

Titelseite

Impressum

Über den Autor

Über den Fachkorrektor

Danksagung

Einführung

Über dieses Buch

Törichte Annahmen über den Leser

Wie dieses Buch aufgebaut ist

Symbole, die in diesem Buch verwendet werden

Wie es weitergeht

Teil I: Ein paar statistische Grundlagen

Kapitel 1: Was Statistik ist und warum sie benötigt wird

Warum Statistik?

Einsatzgebiete der Statistik

Bereiche der Statistik

Kapitel 2: Die Quellen: Woher die Daten kommen

Datenerhebung: Auf den Informationsbedarf ausgerichtet

Ziele festlegen

Untersuchungsansatz definieren

Das Datenerhebungsdesign festlegen

Der Datensatz als Grundlage für statistische Analysen

Teil II: Die beschreibende Statistik

Kapitel 3: In jeder Zeitung zu finden: Tabellen und Diagramme

Darstellung in Tabellen

Ein Diagramm sagt mehr als tausend Zahlen

Kapitel 4: Mitten drin – zentrale Lagemaße

Zentrale Lagemaße – ein Steckbrief

Das arithmetische Mittel

Das geometrische Mittel

Der Median

Median oder arithmetisches Mittel – was ist aussagekräftiger?

Der Modus

Modus, Median und arithmetisches Mittel bei eingipfeligen Verteilungen

Quartile, Perzentile oder ganz einfach Quantile

Zentrale Lagemaße für klassierte Daten

Resümee zur Berechnung von zentralen Lagemaßen

Kapitel 5: Drum herum – Streuungsmaße

Die Spannweite

Der interquartile Abstand

Alles auf einen Blick: Der Boxplot

Mittlere Abweichung, Varianz und Standardabweichung

Kapitel 6: Alles in einer Zahl

Einfache statistische Kennzahlen

Verhältniszahlen

Die Konzentration mit dem Gini-Koeffizienten messen

Kapitel 7: Zusammenhangsmaße

Die Analyse von Zusammenhängen

Die Kreuztabelle

Das Chi-Quadrat

Der Kontingenzkoeffizient nach Pearson

Der Rangkorrelationskoeffizient

Alles auf einen Blick – das Streudiagramm

Die Kovarianz

Korrelationskoeffizient nach Bravais und Pearson

Kapitel 8: Es geht auch ohne die Kristallkugel – Vorhersagen mit der Regressionsanalyse

Die Regressionsfunktion

Die Regressionsgleichung interpretieren

Wie gut ist gut? Die Güte der Regressionsanalyse

Teil III: Die schließende Statistik

Kapitel 9: Nichts ist sicher, aber wahrscheinlich – die Wahrscheinlichkeitsrechnung

Wie wahrscheinlich ist die Wahrscheinlichkeit?

Wahrscheinlichkeiten finden

Wahrscheinlichkeitsregeln im Einsatz

Kombinatorik

Kapitel 10: Auf die Verteilung kommt es an – Wahrscheinlichkeitsverteilungen

Die Zufallsvariable und das Zufallsexperiment

Alles eine Frage der Funktion: Die Wahrscheinlichkeitsverteilung einer diskreten Zufallsvariablen

Die Gleichverteilung einer diskreten Zufallsvariablen

Die Verteilungsfunktion einer diskreten Zufallsvariablen

Was Sie von diskreten Zufallsvariablen erwarten können: Der Erwartungswert

Rund um den Erwartungswert: Die Varianz von diskreten Zufallsvariablen

Kapitel 11: Noch mehr Diskretion bitte – die Binomialverteilung und ihre Freunde

Entweder oder – die Binomialverteilung

Die hypergeometrische Verteilung

Die Poisson-Verteilung

Kapitel 12: Alles im Fluss: Kontinuierliche Wahrscheinlichkeitsverteilungen

Alle sind gleich und einige etwas mehr: Die Gleichverteilung

Was ist schon normal? Die Normalverteilung

Standardnormalverteilung

Kapitel 13: Vom Teil aufs Ganze schließen

Stichproben

Auswahlverfahren

Ans Limit gehen: Der zentrale Grenzwertsatz

Der Standardfehler

Mit dem Standardfehler rechnen

Kapitel 14: Schätzverfahren

Genau schätzen – die Punktschätzung

Die Schätzfunktion und ihre Qualitätsanforderungen

Mit Vertrauen rechnen – das Vertrauensintervall

Kapitel 15: These, Antithese, Hypothesentest

In Alternativen denken: Nullhypothese und Alternativhypothese

Von signifikanten und nicht signifikanten Fehlern

Eins, zwei, drei und fertig ist der Hypothesentest

Wie es nun weitergehen könnte – der Wilcoxon-Test

Teil IV: Der Top-Ten-Teil

Kapitel 16: Die zehn wichtigsten Statistikformeln

Das arithmetische Mittel

Die Standardabweichung

Der Preisindex nach Laspeyres

Der Korrelationskoeffizient

Der Regressionskoeffizient

Der Bestimmtheitskoeffizient

Die bedingte Wahrscheinlichkeit

Der Z-Wert

Die Normalverteilungsdichtefunktion

Der Standardfehler

Kapitel 17: Die zehn wichtigsten Schritte für den Praktiker

Der Start: Ein statistisches Problem

Das Thema der statistischen Untersuchung

Suchen und finden: Die Informationsrecherche vor der Erhebung

Nichts ist praktischer als eine gute Theorie

Keine Frage des guten Geschmacks: Das Untersuchungsdesign – ein Muss für jede Erhebung

Jetzt werden die Daten geerntet – die Feldphase

Die Daten für die Analyse schick machen

Die Stunde der Formeln hat geschlagen: Jetzt wird gerechnet – die Datenanalyse

Die Ergebnisse für die Praxis übersetzen

Die Ergebnisse präsentieren

Kapitel 18: Perspektiven: Zehn der wichtigsten multivariaten Konzepte im Überblick

Die multivariate Regressionsanalyse

(Multivariate) Varianzanalyse

Faktorenanalyse

Clusteranalyse

Diskriminanzanalyse

Conjoint-Analyse

Kontingenzanalyse

Korrespondenzanalyse

Multidimensionale Skalierung

Strukturgleichungsanalyse

Last but not least

Stichwortverzeichnis

End User License Agreement

Tabellenverzeichnis

Kapitel 1

Tabelle 1.1: Der Zusammenhang zwischen Statistiken und Messniveaus

Kapitel 2

Tabelle 2.1: Beispieldatensatz

Kapitel 3

Tabelle 3.1: Schulnoten und ihre Häufigkeit

Tabelle 3.2: Die Häufigkeitstabelle der Variablen »Körpergröße«

Tabelle 3.3: Tabelle 3.2 um Klassenbreite und Häufigkeitsdichte ergänzt

Tabelle 3.4: Die Gewinnentwicklung (in Millionen Euro) der Firmen ProProfit und WinWin

Kapitel 4

Tabelle 4.1: Beispieldaten zur Berechnung des geometrischen Mittels

Tabelle 4.2: Die Zeugnisnoten von neun Schülern unsortiert

Tabelle 4.3: Anwendung des Medians bei ungerader Fallzahl

Tabelle 4.4: Anwendung des Medians bei gerader Fallzahl

Tabelle 4.5: Daten zur Berechnung von Perzentilen

Tabelle 4.6: Beispieldaten zur Berechnung des Modus für klassierte Daten

Tabelle 4.7: Beispiel zur Berechnung des Medians für klassierte Daten

Tabelle 4.8: Beispiel zur Berechnung des gewichteten arithmetischen Mittels für klassierte Daten

Tabelle 4.9: Übersicht über die einzelnen zentralen Lagemaße und ihre Anwendbarkeit auf die verschiedenen Skalenniveaus

Kapitel 5

Tabelle 5.1: Daten zur Berechnung des interquartilen Abstands

Tabelle 5.2: Berechnung von arithmetischem Mittel, mittlerer absoluter Abweichung und Varianz für die Krankmeldungen an zehn Tagen

Tabelle 5.3: Berechnung der Varianz und Standardabweichung klassierter Merkmale

Tabelle 5.4: Anzahl fehlerhafter Produkte und Kündigungen in verschiedenen Monaten

Tabelle 5.5: Standardisierung: Lohn- und Gehaltsentwicklung in fünf europäischen Ländern

Kapitel 6

Tabelle 6.1: Statistische Kennzahlen zum Sterberisiko in Deutschland

Tabelle 6.2: Beispieldaten zur Berechnung von Messzahlen

Tabelle 6.3: Beispieldaten zur Berechnung der Preisindizes

Tabelle 6.4: Ausgangsdaten zur Berechnung des Gini-Koeffizienten

Tabelle 6.5: Berechnung des Gini-Koeffizienten

Kapitel 7

Tabelle 7.1: Beispiel einer Kreuztabelle

Tabelle 7.2: Beispiel zur Berechnung des Chi-Quadrats (beobachtete Häufigkeiten sind fett, zu erwartende Häufigkeiten mager)

Tabelle 7.3: Beispiel zur Berechnung des Rangkorrelationskoeffizienten

Tabelle 7.4: Beispieldaten zum Erstellen eines Streudiagramms: Lohn- und Preisentwicklung in fünf OECD-Ländern

Tabelle 7.5: Berechnung der Kovarianz

Tabelle 7.6: Ausgangsdaten zum Berechnen des Korrelationskoeffizienten

Kapitel 8

Tabelle 8.1: Beispiel zum Berechnen der Regressionsgleichung

Tabelle 8.2: Nicht erklärte Abweichungen von den geschätzten Werten

Kapitel 9

Tabelle 9.1: Wahrscheinlichkeitsbestimmung anhand empirischer Daten

Tabelle 9.2: Qualität und Pünktlichkeit

Tabelle 9.3: Verfahren zur Bestimmung der Anzahl der Möglichkeiten

Tabelle 9.4: Variationskombinationen für zwei aus fünf Elementen ohne Zurücklegen

Tabelle 9.5: Kombinationsmöglichkeiten für zwei aus fünf Elementen ohne Zurücklegen

Kapitel 10

Tabelle 10.1: Beispiele diskreter und kontinuierlicher Zufallsvariablen

Tabelle 10.2: Wahrscheinlichkeitsverteilung für die Zufallsvariable »Würfelwurf«

Tabelle 10.3: Die Werte der Verteilungsfunktion für die diskrete Zufallsvariable »Würfelwurf« an ihren Sprungstellen

Tabelle 10.4: Erwartungswert der Anzahl der täglich verkauften Produkte

Tabelle 10.5: Berechnung der Varianz für die diskrete Zufallsvariable »täglich verkaufte Produkte«

Kapitel 11

Tabelle 11.1: Ergebnisse eines Binomialexperiments »Münzwurf«

Tabelle 11.2: Wahrscheinlichkeitsverteilung anhand der Wahrscheinlichkeitsfunktion der Binomialverteilung

Tabelle 11.3: Auszug aus der Binomialwahrscheinlichkeitstabelle

Kapitel 12

Tabelle 12.1: Standardnormalverteilungstabelle

Kapitel 14

Tabelle 14.1: Ausschnitt aus der t-Tabelle

Kapitel 15

Tabelle 15.1: Formen des Hypothesentests für das arithmetische Mittel

Tabelle 15.2: Entscheidungsmöglichkeiten beim Hypothesentest

Tabelle 15.3: Die Wahl der Teststatistik beim Hypothesentest über den Populationsmittelwert

Tabelle 15.4: Übersicht – Hypothesentest für den Populationsmittelwert

Tabelle 15.5: Formen des Hypothesentests für den Anteilswert

Tabelle 15.6: Gepaarte Milch- und Kakao-Stichproben im Wilcoxon-Test

Tabelle 15.7: Die Ränge im Wilcoxon-Test müssen richtig berechnet und geordnet werden

Tabelle 15.8: Die jeweiligen kritischen Werte im Wilcoxon-Test bei kleinen Stichproben

Illustrationsverzeichnis

Kapitel 1

Abbildung 1.1: Übersicht über die Teilgebiete der Statistik

Kapitel 3

Abbildung 3.1: Die Rohdaten werden ihrer Rangordnung nach in einer Häufigkeitstabelle angeordnet

Abbildung 3.2: Beispiel eines Histogramms

Abbildung 3.3: Beispiel eines Säulendiagramms

Abbildung 3.4: Beispiel eines Kuchendiagramms für das klassierte Körpergrößenmerkmal

Abbildung 3.5: Beispiel eines Liniendiagramms für die Gewinnentwicklung der Firmen ProProfit und WinWin

Kapitel 4

Abbildung 4.1: Lagemaße und Verteilungsformen

Abbildung 4.2: Histogramm mit Modus für die Gewichtsdaten

Kapitel 5

Abbildung 5.1: Verteilungen mit gleichem Mittelwert, aber verschiedenen Streuungen

Abbildung 5.2: Der Boxplot

Abbildung 5.3: Vergleichende Darstellung der Streuung für das Merkmal »Körpergröße nach Geschlecht« anhand von Boxplots

Kapitel 7

Abbildung 7.1: Zellenschema für Kreuztabellen mit Beispiel für die erste Zelle (erste Zeile und erste Spalte) in Tabelle 7.1

Abbildung 7.2: Beispiel eines Streudiagramms: Zusammenhang zwischen Lohnsteigerung X und Preissteigerung Y

Abbildung 7.3: Beispiel eines Streudiagramms bei erhöhter Fallzahl: Zusammenhang zwischen Körpergröße X und Körpergewicht Y

Kapitel 8

Abbildung 8.1: Streudiagramm mit Regressionsgerade

Abbildung 8.2: Streudiagramm mit Regressionsgerade

Kapitel 9

Abbildung 9.1: Das Venn-Diagramm für zwei einander ausschließende Ereignisse

Abbildung 9.2: Das Venn-Diagramm für drei sich gegenseitig ausschließende Ereignisse A, B und C

Abbildung 9.3: Das Venn-Diagramm stellt das Engagement der Mitarbeiter anschaulich dar.

Abbildung 9.4: Ein Venn-Diagramm für mehr als zwei sich gegenseitig überlappende Ereignisse

Abbildung 9.5: Einteilung des Ereignisraums für die Ereignisse A

1

, A

2

, A

3

und das Ereignis B

Abbildung 9.6: Ein Baumdiagramm veranschaulicht die Wahrscheinlichkeiten für alle (guten und schlechten) Taten.

Kapitel 10

Abbildung 10.1: Stabdiagramm der Wahrscheinlichkeitsverteilung der diskreten Zufallsvariablen »Würfelwurf«

Abbildung 10.2: Verteilungsfunktion eines diskreten Merkmals

Kapitel 11

Abbildung 11.1: Baumdiagramm mit Ereignissen und Binomialwahrscheinlichkeitsverteilung

Abbildung 11.2: Wahrscheinlichkeitsverteilung einer binomialverteilten Zufallsvariablen bei drei Versuchen

Kapitel 12

Abbildung 12.1: Dichtefunktion der gleichverteilten stetigen Zufallsvariablen »Zugfahrzeit«

Abbildung 12.2: Die gesuchte Wahrscheinlichkeit der stetigen Zufallsvariablen »Zugfahrzeit«

Abbildung 12.3: Lage und Form der Normalverteilung

Abbildung 12.4: Flächen unter dem Graphen der Normalverteilung

Abbildung 12.5: Flächenabschnitte unter der Standardnormalverteilung

Abbildung 12.6: Beispiel zur Bestimmung von Wahrscheinlichkeiten mithilfe der Normalverteilung. Die Wahrscheinlichkeit, dass z zwischen -1 und 3 liegt, beträgt 0,8399.

Kapitel 13

Abbildung 13.1: Das Grundprinzip des Repräsentationsschlusses

Abbildung 13.2: Stichproben und ihre Mittelwerte

Abbildung 13.3: Stichprobenmittelwertverteilung für verschiedene Merkmalsverteilungen in der Grundgesamtheit

Kapitel 14

Abbildung 14.1: Standardnormalverteilung der Stichprobenmittelwerte und Vertrauensintervalle

Abbildung 14.2: Die Dichtefunktionen der Standardnormalverteilung und t-Verteilung

Kapitel 15

Abbildung 15.1: Entscheidung über Annahme oder Ablehnung der Nullhypothese bei einem einseitigen Hypothesentest des Mittelwertes

Abbildung 15.2: Die Zusammenhänge zwischen

- und

-Fehler

Abbildung 15.3: Zweiseitiger Hypothesentest bei einer t-verteilten Teststatistik mit

Freiheitsgraden

Abbildung 15.4: Hypothesentest für Anteilswerte

Guide

Cover

Inhaltsverzeichnis

Begin Reading

Pages

C1

1

2

3

4

7

8

9

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

66

67

68

69

70

71

72

73

74

75

76

77

78

79

80

81

82

83

84

85

86

87

88

89

90

91

92

93

94

95

96

97

98

99

100

101

102

103

104

105

106

107

108

109

110

111

112

113

114

115

116

117

118

119

120

121

122

123

124

125

126

127

128

129

130

131

132

133

135

136

137

138

139

140

141

142

143

144

145

146

147

148

149

150

151

152

153

154

155

156

157

158

159

160

161

162

163

164

165

166

167

168

169

170

171

172

173

174

175

176

177

179

180

181

182

183

184

185

186

187

189

190

191

192

193

194

195

196

197

198

199

200

201

202

203

205

206

207

208

209

210

211

212

213

214

215

216

217

219

220

221

222

223

224

225

226

227

228

229

230

231

233

234

235

236

237

238

239

240

241

242

243

244

245

246

247

248

249

250

251

252

253

254

255

256

257

258

259

260

261

262

263

264

265

266

267

268

269

270

271

272

273

274

275

276

277

278

279

281

282

283

284

285

286

287

288

289

290

291

292

E1

Einführung

Die Statistik und statistische Formeln spielen in den Wirtschafts- und Sozialwissenschaften, aber auch natürlich in den anderen Wissenschaften, ja darüber hinaus in nahezu allen privaten und beruflichen Lebensbereichen eine Rolle.

Auch wenn Sie sich dieses Buch zugelegt haben, um Ihren Statistikschein zu erwerben, werden Sie sicher auch in ganz anderen Situationen davon profitieren, glauben Sie’s mir!

Über dieses Buch

Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies enthält die wichtigsten statistischen Instrumente und Formeln, die Sie im Bereich der Wirtschafts- und Sozialwissenschaften benötigen.

Es ist insbesondere für Schüler, Studierende und Lehrende aus dem Bereich der Wirtschafts- und Sozialwissenschaften konzipiert. Und da Statistik viel mit Formeln zu tun hat, wird in diesem Buch dem Verständnis und der Anwendungskompetenz der einzelnen statistischen Formeln besondere Bedeutung beigemessen. Zu jeder statistischen Formel finden Sie

eine Erläuterung des Zwecks, der Aufgabe und der Anwendungsbedingungen,

eine Beschreibung der einzelnen Symbole in der Formel,

eine Darstellung der einzelnen Arbeitsschritte zur Berechnung der Formel,

ein konkretes Anwendungsbeispiel mit vollständigem und erläutertem Lösungsweg sowie

eine Interpretation der jeweiligen Lösung beziehungsweise des Ergebnisses.

Sie sehen es schon, es ist das Anliegen von Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies, Ihnen die Statistiken und ihre Formeln nicht nur sozusagen vor die Füße zu kippen, sondern Ihnen auch nötiges Hintergrund- und Zusammenhangswissen zu vermitteln. Insbesondere durch die detaillierte Beschreibung der einzelnen Arbeitsschritte, die Sie bei der Anwendung der Formeln durchlaufen müssen, und durch die Beispiele mit ihren vollständigen Lösungswegen und Ergebnisinterpretationen wird die Voraussetzung dafür geschaffen, dass Sie die Statistiken und Formeln garantiert auch in der privaten und beruflichen Praxis erfolgreich anwenden können.

Anspruch und Ziel ist dabei aber immer:

leichte Lesbarkeit,

Verständlichkeit der Anleitungen,

praktische Anwendbarkeit und

systematische und einheitliche Darstellungsweise.

Jedes Kapitel ist so aufgebaut, dass Sie es unabhängig von den anderen lesen und bearbeiten können. Allerdings sind die Inhalte und Themen auch so aneinandergereiht, dass Sie damit am besten eine systematische Einführung und einen optimalen Einstieg in die statistischen Grundlagen erhalten.

Natürlich ist es bei dem Umfang dieses Buches nicht möglich (und das werden Sie sicherlich auch nicht erwartet haben), jedes Detail in der Statistik zu behandeln. Zum Beispiel habe ich die Zeitreihenanalyse komplett ausgelassen. Auch für eine Behandlung der kompliziertesten Statistiken und Formeln ist hier leider nicht der Platz. Dazu sind schließlich die vielen anderen dicken Statistikwälzer da.

Törichte Annahmen über den Leser

Lassen Sie mich ein paar Vermutungen über Sie als Leser meines Buches anstellen:

Vielleicht bereiten Sie sich gerade auf eine Statistikprüfung in der Schule, in der Ausbildung oder in der Uni für das Fach Wirtschaftswissenschaften oder Sozialwissenschaften vor. Es kann auch sein, dass Sie statistische Informationen für Entscheidungen in Ihrer beruflichen Praxis benötigen oder Sie möchten einfach endlich mal die Formeln hinter den Statistiken, die Ihnen tagtäglich in Zeitungen, im Fernsehen und im Internet begegnen, kennenlernen und verstehen.

Die Aussage »Statistiken und statistische Formeln sind wirklich nur für Mathegenies oder in Zahlen verliebte Sonderlinge interessant« wäre eine durchaus törichte Annahme, wenn man sie auf den Leser von Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies beziehen würde.

Wenn Sie ein wenig Kenntnisse in der grundlegenden Schulmathematik mitbringen und ansonsten gerade begonnen haben, sich mit Statistik in Ihrem Fach, an der Hochschule oder in Ihrer beruflichen Praxis zu beschäftigen, dann ist Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies genau das richtige Buch für Sie. Aber auch wenn Sie bereits als Statistikprofi in der Lehre und Ausbildung auf dem Gebiet der Wirtschafts- und Sozialwissenschaften tätig sind, können Sie dieses Buch zur Einführung sinnvoll einsetzen. Sie sehen, selbst für richtige Profis hat es etwas anzubieten.

Wie dieses Buch aufgebaut ist

Wie die Statistik selbst besteht auch Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies – nach einem einführenden Teil – aus zwei großen Hauptteilen. In diesen Teilen spiegeln sich die beiden wesentlichen Gebiete oder auch das »Ying« und »Yang« der Statistik wieder: die beschreibende und die schließende Statistik. Und natürlich finden Sie in diesem Buch wie in allen Büchern der … für Dummies-Reihe auch einen Top-Ten-Teil.

Teil I: Ein paar statistische Grundlagen

Damit Sie nicht gleich ins eiskalte Wasser der statistischen Formelwelt gestoßen werden, erhalten Sie im ersten Teil erst einmal einen allgemeinen systematischen Einstieg in das Fachgebiet der Statistik. Hier werden der Zweck und die wesentlichen Aufgaben sowie der grundlegende Aufbau der Statistik vorgestellt. Damit Sie gleich kompetent informiert sind, erfahren Sie hier außerdem mehr über die Herkunft und Messung der Daten, mit denen Sie dann später Statistiken berechnen und die Ergebnisse interpretieren können.

Teil II: Die beschreibende Statistik

Teil II ist dem ersten großen Teilgebiet der Statistik gewidmet: der beschreibenden Statistik. Nach einer kurzen Erläuterung der Ziele und Aufgaben der beschreibenden Statistik stelle ich Ihnen die Darstellung von statistischen Daten in Tabellen und Diagrammen vor. Dann folgt die Behandlung der wichtigsten Statistiken. Dabei handelt es sich um zentrale Lagemaße, um Streuungsmaße und Zusammenhangsmaße. Natürlich dürfen dabei auch bedeutsame statistische Kennzahlen nicht fehlen.

Teil III: Die schließende Statistik

Um das zweite große Teilgebiet der Statistik, die schließende Statistik, geht es in Teil III. Sie lernen hier Wahrscheinlichkeiten verstehen und zu bestimmen, Wahrscheinlichkeitsverteilungen zu erkennen, zu unterscheiden und zur Berechnung von Wahrscheinlichkeiten anzuwenden. Darauf aufbauend erfahren Sie, wie Sie statistische Parameter schätzen sowie Vertrauensintervalle berechnen und sinnvoll nutzen können. Selbstverständlich erfahren Sie auch, wie Sie Hypothesen an der Realität überprüfen und testen können. So lernen Sie gleichsam alles Wichtige, was Sie unbedingt für die »Königsklasse« der Statistik im Bereich der Wirtschafts- und Sozialwissenschaften wissen müssen.

Teil IV: Der Top-Ten-Teil

Im Top-Ten-Teil, der in keinem … für Dummies-Buch fehlen darf, finden Sie die zehn wichtigsten Formeln der Statistik noch einmal auf einen Blick. Außerdem stelle ich den Prozess von der Datengewinnung bis zur Analyse in zehn Meilensteinen dar.

Symbole, die in diesem Buch verwendet werden

Dieses Symbol kennzeichnet hilfreiche Hinweise und Tipps, die Ihnen die Arbeit mit den Formeln und der statistischen Analyse erleichtern sollen.

Dieses Symbol kennzeichnet Passagen, in denen wichtige Konzepte und Begriffe dargestellt und genauer erklärt werden. Das gibt Ihnen ein sicheres Verständnis der wichtigsten statistischen Konzepte.

Fehler sind dazu da, dass man aus ihnen lernen kann. Es erspart Ihnen aber viel Arbeit und Mühe, wenn Sie bestimmte Fehler erst gar nicht machen. Damit Sie nicht in das eine oder andere Fettnäpfchen treten, habe ich für Sie an den entsprechenden Stellen diese Warnschilder aufgestellt.

Wie es weitergeht

Als Newcomer fangen Sie am besten einfach am Anfang an und lesen das Buch von vorn bis hinten durch. So werden Sie systematisch in die Statistik eingeführt.

Jedes Kapitel ist aber auch für sich genommen verständlich, also springen Sie einfach in das Thema hinein, das Sie gerade beschäftigt, ganz wie Sie mögen. Viel Erfolg und Spaß dabei!

Teil I

Ein paar statistische Grundlagen

IN DIESEM TEIL …

Gebe ich Ihnen einen kleinen Überblick über die wesentlichen Aufgaben und den Zweck der Statistik und deren Aufbau und Systematik. Ich erkläre, wo Sie die Daten und Zahlen herbekommen, auf die die statistischen Formeln angewendet werden.

Wenn Sie diese Zusammenhänge kennen, können Sie entscheiden, welche Statistik Sie am besten für welches statistische Problem nutzen.

Kapitel 1

Was Statistik ist und warum sie benötigt wird

IN DIESEM KAPITEL

Ursprünge der Statistik und ihre Bedeutung heute

Ziele und Aufgaben der Statistik

Aufbau und wesentliche Bestandteile der Statistik

Statistik wird schon so lange betrieben wie es Mathematik gibt. Ihre Wurzeln reichen bis in die Zeit der Entstehung der Schrift vor mehr als 5000 Jahren zurück. Erste Volkszählungen gab es bereits bei den alten Ägyptern vor mehr als 2000 Jahren. Heute ist die Statistik selbst aus unserem Privatleben nicht mehr wegzudenken und allgegenwärtig. Jedes Mal, wenn Sie eine Zeitung aufschlagen, werden Sie darin Tabellen, Diagramme und statistische Kennzahlen zu den verschiedensten gesellschaftlichen, wirtschaftlichen und technischen Bereichen finden. Kaum eine Nachrichtensendung wird ausgestrahlt, ohne dass darin statistische Informationen enthalten sind. Es gibt keinen gesellschaftlichen, kulturellen, naturwissenschaftlichen, volkswirtschaftlichen und auch keinen betrieblichen Bereich in Unternehmen, für den nicht Statistiken erstellt werden. Selbst in der Unterhaltung und der Freizeit ist Statistik nicht wegzudenken. Denken Sie nur an die vielen Statistiken, die Sie in jeder Sportnachrichtensendung präsentiert bekommen. Ganz offenbar benötigt man heute in allen Bereichen menschlichen Handelns statistische Kenntnisse, wenn man informiert sein möchte oder mitreden will. Warum ist das so?

Warum Statistik?

Eine Antwort auf diese Frage können Sie finden, wenn Sie sich anschauen, um was es bei der Statistik geht. Statistik leitet sich aus dem lateinischen Wort »status« ab, was so viel wie Zustand, Verfassung oder Stand der Dinge meint. Antike Herrscher wollten sich bereits zu vorchristlichen Zeiten ein Bild vom Zustand ihres Staates machen und Informationen über die Verhältnisse im Lande gewinnen. Weil der Staat sich schon damals aus vielen Teilen zusammensetzte (zum Beispiel Menschen, Tieren, Weideflächen etc.), ging es darum, eine Vorstellung über den Zustand dieser »Massen« eines Staates insgesamt zu gewinnen. Die Information über die Zahl der Sklaven, Krieger, Frauen, Kinder, Rinder, Pferde, Boote, Ackerflächen etc. war für die Staatslenker von strategischer Bedeutung für ihre Entscheidungen.

Auch heute noch geht es bei der Statistik um das zahlenmäßige Erfassen, Klassifizieren, Auswerten, Analysieren und Präsentieren von Daten über Massen, Gesamtheiten oder Populationen.

Die Statistik benötigen Sie vor allem, um informierte und das heißt richtige oder bessere Entscheidungen für Probleme treffen zu können, die sich nicht auf Einzelfälle, sondern auf Gesamtheiten oder Massenerscheinungen beziehen oder von denen ganze Bevölkerungen beziehungsweise Populationen betroffen sind. Beispielsweise müssen Politiker über Gesetze entscheiden, die das Wohl von Millionen von Bürgern beeinflussen; denken Sie nur mal an die Steuergesetzgebung.

Einsatzgebiete der Statistik

Die Anwendung der Methoden und Instrumente der Statistik finden Sie nicht nur in der Politik, Sie finden sie in allen gesellschaftlichen Bereichen. In nahezu jeder wissenschaftlichen Fachdisziplin (selbst in einem literaturwissenschaftlichen Studium) werden Sie den statistischen Methoden und Instrumenten begegnen. Die folgende Liste zeigt Ihnen Beispiele für betriebliche Einsatzgebiete für die Statistik innerhalb von Unternehmen:

Marktforschung:

Konsumentenstrukturen und Präferenzen

Produktplanung:

Wirtschaftstrends, detaillierte Verkaufsbudgets

Finanzanalysen:

Jahresberichte, Kosten- und Einnahmedaten

Vorhersagen:

Absatzentwicklung, Beschäftigungsentwicklung, Produktivitätsentwicklung

Prozess- und Qualitätskontrollen

Arbeitnehmerstatistik:

Absentismus (eine Statistik, die sich mit dem Fernbleiben von Arbeitnehmern vom Arbeitsplatz zum Beispiel aufgrund von Krankheiten beschäftigt), Personalfluktuation

Bereiche der Statistik

Innerhalb der Statistik unterscheidet man zwei große Aufgabengebiete:

die deskriptive Statistik,

die schließende Statistik.

Beide Bereiche der Statistik informieren Sie über:

Zustände

, die eine Gesamtheit oder eine Stichprobe von statistischen Einheiten hinsichtlich bestimmter Merkmale mengenmäßig charakterisieren (zum Beispiel die Bevölkerung eines Landes bezüglich des Umfangs von Arbeitslosigkeit, Einkommen und Vermögen)

Ursachen

, Faktoren oder Gründe, die zu einem bestimmten Zustand in der Gesamtheit geführt haben (zum Beispiel warum nur wenige Personen in der Bevölkerung ein vergleichsweise deutlich höheres Einkommen haben)

Prognosen

, die sich auf die künftige Entwicklung, wie sich die Gesamtheit bezüglich der betrachteten Merkmale in Zukunft entwickeln wird, beziehen (zum Beispiel darüber, wie sich die Lücke zwischen den besser Verdienenden und der übrigen Bevölkerung verändern wird)

Techniken

, um bestimmte Zustände oder Ziele zu erreichen (zum Beispiel, dass sich die Lücke zwischen Arm und Reich in der Bevölkerung durch bessere Bildung und Qualifikation in den unteren Schichten der Gesellschaft schließen lässt)

Schlussfolgerungen

, das heißt mögliche Ansatzpunkte für weitere Hypothesen und Theorien, die aus den Daten gewonnen werden können

Die deskriptive und die schließende Statistik bilden die beiden wichtigsten Gebiete in der Statistik. Gemäß dieser Unterscheidung ist auch Statistik für Wirtschafts- und Sozialwissenschaftler für Dummies entsprechend aufgebaut. Abbildung 1.1 fasst die statistischen Teilgebiete, wie sie auch in den Formeln und Kapiteln dieses Buches thematisiert werden, zusammen.

Abbildung 1.1: Übersicht über die Teilgebiete der Statistik

Die deskriptive oder beschreibende Statistik

Wie schon im Namen zum Ausdruck kommt, dient Ihnen die deskriptive Statistik, die manchmal auch beschreibende Statistik genannt wird, der genauen Beschreibung von statistischen Gesamtheiten.

Die deskriptive Statistik dient dazu, anhand von Stichproben Fakten und Daten über Populationen, die auch Grundgesamtheiten genannt werden, zu sammeln, sie für die Analyse aufzubereiten, sie auszuwerten, zu analysieren und zu interpretieren sowie sie systematisch, geordnet und informativ darzustellen.

Die Beschreibung der Sie interessierenden Eigenschaften der Gesamtheit erfolgt dabei anhand von statistischen Tabellen, Diagrammen oder zusammenfassenden Zahlen (zum Beispiel welche Einkommensstruktur, welchen Altersaufbau und welchen Bildungsgrad die Bevölkerung Deutschlands am Anfang des Jahres 2013 hatte).

Die Gesamtheit, die oft auch als Grundgesamtheit, Population oder statistische Masse bezeichnet wird, ist die Gesamtzahl oder die Menge aller Objekte oder Personen beziehungsweise der »statistischen Einheiten«, über die »statistische Daten« und Informationen gewonnen werden sollen. Die Eigenschaften, nach denen die statistischen Einheiten analysiert werden sollen, heißen statistische Merkmale oder Variablen.

Lassen Sie mich diese Begriffe an einem kleinen Beispiel erörtern. Stellen Sie sich vor, Sie wären zum Beispiel an der Verteilung des durchschnittlichen Einkommens von Männern und Frauen in einer bestimmten beruflichen Position interessiert. Die Grundgesamtheit besteht in diesem Fall einfach aus allen Erwerbstätigen in dieser beruflichen Position. Jeder einzelne dieser Erwerbstätigen ist dabei eine statistische Einheit. Es werden zwei statistische Merkmale an diesen Einheiten erhoben: das durchschnittliche Einkommen und das Geschlecht. Da unterschiedliche Personen ein unterschiedliches Einkommen haben werden, ist hier auch der Begriff »Variable« sinnvoll.

Nachdem Sie die Daten gesammelt haben, geht es im nächsten Schritt darum, sie möglichst gut darzustellen, um charakteristische Strukturen innerhalb der Daten erkennen zu können.

Die Möglichkeiten, Instrumente oder Formen der Beschreibung reichen von eindimensionalen Tabellen und Diagrammen über einfache statistische Kennzahlen bis hin zu komplexen mehrdimensionalen statistischen Analysetools.

Instrumente der Statistik

Zu den wichtigsten Instrumenten der deskriptiven Statistik zählen:

Datentabellen:

Tabellen, in denen die Daten zu den betrachteten statistischen Merkmalen systematisch zusammengefasst präsentiert werden (mehr erfahren Sie darüber in

Kapitel 3

)

Diagramme:

Daten der statistischen Merkmale in Form von Bildern anschaulich und informativ präsentieren (siehe auch

Kapitel 3

)

Zentrale Lagemaße:

Statistiken, die in einer Zahl die Werte eines statistischen Merkmals beschreiben (zum Beispiel das arithmetische Mittel, das Ihnen das durchschnittliche Einkommen des Merkmals »Bevölkerungseinkommen« mitteilt; mehr hierzu in

Kapitel 4

)

Streuungsmaße:

Statistiken, die in einer Zahl mitteilen, wie weit die einzelnen Werte eines Merkmals vom Durchschnitt entfernt liegen (wie stark zum Beispiel die einzelnen Einkommen in der Bevölkerung vom Durchschnittseinkommen entfernt sind; mehr hierzu in

Kapitel 5

)

Kennzahlen:

Zahlen, die die Werte anderer statistischer Kennzahlen zusammenfassen (zum Beispiel der Preisindex für Lebenshaltungskosten, der die Information über die Preisentwicklung vieler verschiedener Güter in einer Zahl komprimiert; mehr hierzu in

Kapitel 6

)

Zusammenhangsmaße:

statistische Maßzahlen, die auch als Koeffizienten bezeichnet werden, die die Stärke der Beziehung zwischen verschiedenen statistischen Merkmalen beschreiben (zum Beispiel inwiefern die Höhe des Einkommens von der Länge der Berufserfahrung abhängt; mehr hierzu in

Kapitel 7

)

Die zentralen Instrumente der deskriptiven Statistik, die Sie im Detail in Teil II kennenlernen, sind

Präsentation statistischer Informationen mithilfe von Diagrammen,

Zusammenfassung von Daten einzelner Merkmale beziehungsweise Variablen mithilfe zentraler Lagemaße,

Berechnung von Streuungsmaßen zur Beschreibung der Abweichung der einzelnen Werte von den zentralen Lagemaßen,

Ermittlung und Beschreibung der Beziehung zwischen einzelnen statistischen Merkmalen mithilfe von Zusammenhangsmaßen.

Datenmessung mit Niveau

Die so beschriebenen und analysierten Merkmale können auf verschiedene Weise gemessen werden (zu den Messniveaus erfahren Sie mehr in Kapitel 2):

nominal

, das heißt, die möglichen Werte eines an den einzelnen statistischen Einheiten gemessenen Merkmals lassen sich nur unterscheiden

ordinal

, das heißt, die möglichen Werte eines an den einzelnen statistischen Einheiten gemessenen Merkmals lassen sich zudem in eine Rangordnung bringen

metrisch

, das heißt, die Unterschiede in den möglichen Werten eines an den einzelnen statistischen Einheiten gemessenen Merkmals lassen sich zusätzlich mithilfe genormter Messeinheiten quantifizieren beziehungsweise zahlenmäßig in ihrer Größenordnung ausdrücken

Die deskriptiven Statistiken und ihre Zuordnung zu den jeweiligen Messniveaus sehen Sie im Überblick in Tabelle 1.1. Außerdem können Sie der Tabelle entnehmen, in welchen Kapiteln die erwähnten Themen behandelt werden.

Statistiken

Skalenniveaus

Nominal

Ordinal

Metrisch

Maße der Tendenz beziehungs-weise Lagemaße

Modus

(siehe Kapitel 4)

Median

Quartile

Perzentile

(siehe Kapitel 4)

arithmetisches Mittel

gewichtetes Mittel

geometrisches Mittel

(siehe Kapitel 4)

Maße der Variabilität

nicht sinnvoll, da Zahlen nicht von Bedeutung sind und nur zur Unterscheidung der Kategorien der Merkmale dienen

Abstand

interquartiler Abstand

(siehe Kapitel 5)

mittlere Abweichung

Varianz

Standardabweichung

Variationskoeffizient

(siehe Kapitel 5)

Beziehungs-maße

Chi-Quadrat

Pearsons Kontingenz

(siehe Kapitel 7)

Spearmans Rangkorre-lation

(siehe Kapitel 7)

Bravais-Pearson-Korrelation

Kovarianz

(siehe Kapitel 7)

Regressionskoeffizient

Determinationskoeffizient

(siehe Kapitel 8)

Tabelle 1.1: Der Zusammenhang zwischen Statistiken und Messniveaus

Die Statistiken der deskriptiven Statistik sind nur für die in der Untersuchung erfassten Untersuchungseinheiten aussagekräftig und für die in die Berechnung einbezogenen Daten, das heißt, Sie können die daraus resultierenden Ergebnisse auch nur auf die analysierten Fälle und Daten beziehen und nicht auf andere Fälle übertragen.

Auch wenn Ihnen eine Stichprobe von Daten aus einer umfassenderen Gesamtheit vorliegt, können Sie statistische Ergebnisse, die Sie anhand der Methoden, Instrumente und Statistiken der deskriptiven Statistik gewonnen haben, nur auf die Daten in dieser Stichprobe beziehen und nicht auf die Gesamtheit, aus der die Stichprobe kommt. Wenn Sie das tun wollen, müssen Sie über die deskriptive Statistik hinaus auf das Instrumentarium der schließenden Statistik zurückgreifen.

Die schließende Statistik oder Inferenzstatistik

Die schließende Statistik (auch Inferenzstatistik oder induktive Statistik genannt) ist neben der deskriptiven Statistik die zweite wesentliche Säule der Statistik. Sie benötigen sie zusätzlich immer dann, wenn Sie nicht alle für eine Analyse interessanten Fälle in Ihre Datenerhebung einbeziehen können. Ihnen steht somit nur ein Teil oder eine Stichprobe der Daten aus der Gesamtheit der Untersuchungseinheiten für die Analyse zur Verfügung. Sie möchten aber dennoch etwas über die Verhältnisse in der Gesamtheit aussagen.

Wählen Sie nur einen Teil der statistischen Einheiten aus der Grundgesamtheit für die statistischen Analysen aus, so handelt es sich um eine Teilerhebung beziehungsweise Stichprobe. Anhand der Ergebnisse der statistischen Analysen mit der Stichprobe wollen Sie auf die entsprechenden Werte in der betreffenden Grundgesamtheit schließen. Aus dieser Aufgabe ergibt sich auch der Name für die schließende Statistik, die auch oft als Inferenzstatistik bezeichnet wird, was aber nichts anderes bedeutet. Die Grundlage dafür, dass Sie aus den Ergebnissen einer Stichprobe einen repräsentativen Schluss auf die Verhältnisse in der Grundgesamtheit ziehen können, ist die Wahrscheinlichkeitsrechnung. Darauf bauen die statistischen Schätzverfahren und die Methoden zum Testen von Hypothesen auf.

Eine Hypothese ist eine noch nicht anhand von Daten systematisch überprüfte und analysierte oder bestätigte Behauptung, Aussage oder Vermutung.

Instrumente der schließenden Statistik

Besonders wichtige Konzepte, Verfahren und Instrumente, die Sie in der schließenden Statistik antreffen, sind:

Zufallsexperiment:

ein Experiment, dessen mögliche Ereignisse zufällig mit einer bestimmten Wahrscheinlichkeit auftreten und daher nicht eindeutig vorhergesagt werden können (mehr hierzu in

Kapitel 10

)

Zufallsvariablen:

die bei dem Experiment betrachteten Merkmale, deren Werte zufällig auftreten (siehe

Kapitel 10

)

Wahrscheinlichkeitsverteilung:

die den möglichen Werten der Zufallsvariablen zugeordneten Wahrscheinlichkeiten (mehr hierzu in

Kapitel 11

und

Kapitel 12

)

Stichprobe:

ein Teil einer statistischen Gesamtheit; anhand der Stichprobe gewinnen Sie statistische Informationen über diese Gesamtheit (siehe dazu

Kapitel 13

)

Schätzverfahren:

ein Verfahren, mit dem Sie von den Daten beziehungsweise Ergebnissen aus einer Stichprobe auf die Verhältnisse in der statistischen Gesamtheit schließen (mehr hierzu in

Kapitel 14

)

Parameter- und Hypothesentest:

ein Test, mit dem Sie anhand der Ergebnisse aus einer Stichprobe überprüfen können, ob bestimmte Annahmen oder Hypothesen, die Sie über die Verhältnisse in der Grundgesamtheit haben, zutreffen (siehe

Kapitel 15

)

Aufgaben der schließenden Statistik

Zwei Aufgabentypen der schließenden Statistik sind besonders wichtig:

Schätzung der Werte nicht bekannter Grundgesamtheitsparameter (wie das arithmetische Mittel einer Variablen in einer Population)

Zum Beispiel können Sie die durchschnittlichen Einkommen der Männer und Frauen einer Stichprobe berechnen und mithilfe der Verfahren der schließenden Statistik auf die Durchschnittseinkommen von Männern und Frauen in der gesamten Population, aus der Sie die Stichprobe gezogen haben, schließen.

Hypothesentest über die Werte von Populationsparametern (zum Beispiel darüber, dass das arithmetische Mittel einen bestimmten Wert hat)

Ausgehend von einer Hypothese über die Durchschnittseinkommen von Männern und Frauen in der gesamten Population erheben Sie eine Stichprobe aus der Gesamtpopulation und überprüfen anhand der Daten aus der Stichprobe und mithilfe der Verfahren der schließenden Statistik, ob die Hypothese zutrifft oder nicht. Wenn Sie in unserem Beispiel die Annahme haben, dass Frauen und Männer in gleichen beruflichen Positionen das gleiche Einkommen erzielen, können Sie diese Annahme auf diese Weise »empirisch«, das heißt erfahrungsgestützt, überprüfen.

Um zuverlässig schließen zu können, benötigen Sie eine repräsentative Stichprobe von Männern und Frauen mit der betreffenden beruflichen Position sowie zuverlässige Angaben über deren Einkommen. Repräsentativ ist eine Stichprobe dann, wenn sie sozusagen ein Abbild der Grundgesamtheit ist. Eine wesentliche Bedingung dafür ist die zufällige Auswahl der Fälle in die Erhebung. Erst unter dieser Voraussetzung ist es möglich, anhand der Ergebnisse der Stichproben festzustellen, mit welcher Wahrscheinlichkeit die Hypothese der Wirklichkeit entspricht.

Gründe für Stichproben und schließende Statistik

Die Beschränkung auf eine Stichprobe und damit der Rückgriff auf die schließende Statistik bietet sich vor allem dann an, wenn Sie

zu hohe Kosten für die Datenerhebung vermeiden wollen,

den zeitlichen Aufwand für die Datenerhebung verringern wollen und/oder

aus sachlogischen, praktischen Gründen auf eine Total- oder Gesamterhebung zugunsten einer Stichprobe verzichten müssen.

Beispielhaft für den Fall des Verzichts aus sachlogischen Gründen auf eine Vollerhebung ist die Qualitätskontrolle im Bereich der Herstellung von Produkten, in dem Sie die Haltbarkeit testen wollen. Wenn Sie alle Produkte, die Sie herstellen, einem Haltbarkeitstest zuführen würden, hätten Sie am Ende keine Produkte mehr, die Sie Ihren Kunden anbieten könnten. Es ist also praktisch gar nicht möglich, alle Produkte auf ihre Haltbarkeit hin zu testen. Natürlich würde es auch viel mehr Zeit beanspruchen und Kosten verursachen, wenn Sie statt einer repräsentativen Stichprobe alle Produkte testen wollten.

Kapitel 2

Die Quellen: Woher die Daten kommen

IN DIESEM KAPITEL

Vom Problem zur Fragestellung einer statistischen Untersuchung

Festlegen des Datenerhebungsdesigns: Definition der Methode, der statistischen Einheiten, des statistischen Verfahrens

Messniveaus und Variablentypen

Der Datensatz als Grundlage für statische Analysen

Die Daten, aus denen Sie mithilfe der Statistik Informationen gewinnen können, fallen nicht einfach vom Himmel. Sie können sie mithilfe der Methoden der empirischen (das heißt der systematisch auf Erfahrung beruhenden) Forschung erheben, es sei denn, jemand hat diesen Job schon für Sie erledigt und Sie brauchen nur noch auf die Daten zurückzugreifen. Die Datenerhebung selbst ist oft nur Teil eines umfassenderen statistischen Untersuchungsprojekts. Sie will gut geplant sein. Dazu müssen Sie in jedem Fall folgende Maßnahmen durchführen:

Stellen Sie den Informationsbedarf fest.

Setzen Sie die Ziele.

Legen Sie den Untersuchungsansatz fest.

Konzipieren Sie das Datenerhebungsdesign.

Datenerhebung: Auf den Informationsbedarf ausgerichtet

Eine gute Vorbereitung ist das A und O einer statistischen Untersuchung. Deshalb sollten Sie bei der Vorbereitung der Datenerhebung keine Mühen scheuen. Ausgangspunkt der Datenerhebung ist in der Regel ein Informationsbedarf, der sich aus einem praktischen oder theoretischen Problem ergibt. Erheben Sie also Ihre Daten

zielgerichtet und

zweckbestimmt.

Der Informationsbedarf führt Sie also ganz schnell zur Definition der Ziele.

Ziele festlegen

Um die Ziele zu definieren, sind folgende Schritte notwendig:

Artikulieren Sie das Problem und grenzen es von anderen Problemen ab.

Leiten Sie aus dieser Ausgangssituation und Problemskizze die Ziele der Untersuchung ab.

Leiten Sie aus diesen Zielen die Fragestellungen für die Untersuchung ab.

Untersuchungsansatz definieren

Bevor Sie sich an die Datenerhebung machen, schauen Sie erst einmal, welche Informationen Ihnen bereits zu dem Untersuchungsthema vorliegen oder welche Sie ohne eine eigene Datenerhebung beschaffen können. Diese Informationen können Sie beispielsweise durch Internetrecherchen, Dokumentenanalysen, Literatursichtung und die Sichtung von bereits vorhandenen Untersuchungen und vorhandenen Daten gewinnen.

Sind benötigte Daten noch nicht vorhanden, müssen Sie sie erst noch erheben. Dieser Vorgang der erstmaligen Erhebung der Daten wird unter Statistikern Primärerhebung genannt und die Daten daraus werden als Primärdaten bezeichnet. Schon vorhandene Daten beziehungsweise bereits durchgeführte Erhebungen werden als Sekundärdaten oder als Sekundärerhebungen bezeichnet (so beispielsweise die Daten vom Statistischen Bundesamt und den statistischen Landesämtern). Alle Daten müssen ursprünglich natürlich irgendwann im Rahmen einer Primärerhebung gewonnen werden.

Wenn Sie die Daten selbst erheben wollen oder müssen, sollten Sie nicht sofort einfach loslegen und etwa mit einem ad hoc entworfenen Fragebogen Daten von irgendwelchen Personen erfragen, sondern sich erst einmal zurücklehnen und die nächsten Schritte sorgfältig planen. Bevor Sie die Detailplanung für die Datensammlung in Angriff nehmen, ist es für die gezielte Datengewinnung hilfreich oder in vielen Fällen sogar nötig, wenn Sie im Anschluss an die Fragestellungen als nächstes Folgendes tun:

Formulieren Sie die zentralen Aussagen, das theoretische Modell und die Hypothesen, zu denen Sie Informationen benötigen oder die Sie mit den Daten überprüfen wollen.

Bestimmen Sie die zentralen Begriffe, die Sie dabei verwenden.

Legen Sie die Grundgesamtheit fest, das heißt die Menge aller für die Fragestellung relevanten statistischen Einheiten (Untersuchungsobjekte, Fälle, Befragte etc.), an denen die Daten erhoben werden sollen.

Identifizieren Sie die statistischen Merkmale, die an den statistischen Einheiten gemessen werden sollen.

Mit der Ausformulierung des theoretischen Modells, der zentralen Aussagen und Hypothesen geben Sie genau vor, was Sie untersuchen wollen und welche Informationen Sie benötigen.

Wenn Sie die Fragestellung untersuchen wollen, ob in einer Wirtschaftsbranche die Mitarbeiter aufgrund des Geschlechts diskriminiert werden, stellen Sie zum Beispiel die Hypothese »Frauen verdienen in der Branche X im Land Z im Jahr Y durchschnittlich 30 Prozent weniger als Männer bei gleicher Tätigkeit und Qualifikation« auf.