Inferenzstatistik - Mark Stemmler - E-Book

Inferenzstatistik E-Book

Mark Stemmler

0,0

Beschreibung

Welche Schlüsse kann man ziehen, wenn man bei einer Stichprobe von 20 depressiven Personen nach Psychotherapie eine Verringerung der Symptome beobachtet? Dass Psychotherapie effektiv ist? Kann man das Ergebnis tatsächlich als signifikante Veränderung interpretieren oder war es einfach Zufall? Ein wesentliches Ziel der empirischen Forschung ist, generalisierbare Aussagen über Sachverhalte, die man anhand einer Stichprobe gefunden hat, zu treffen. Um dabei voreilige, falsche Schlussfolgerungen zu vermeiden, nutzt man die Inferenzstatistik. Dieses Buch bietet mit einer Vielzahl von Beispielen eine anschauliche Einführung in deren Logik und stellt zentrale Verfahren der Hypothesenprüfung dar. Der Leser erhält so ein Verständnis für grundlegende Prinzipien der Inferenzstatistik, auf deren Basis später auch komplexere Anwendungen gut nachvollzogen werden können.

Sie lesen das E-Book in den Legimi-Apps auf:

Android
iOS
von Legimi
zertifizierten E-Readern
Kindle™-E-Readern
(für ausgewählte Pakete)

Seitenzahl: 188

Veröffentlichungsjahr: 2025

Das E-Book (TTS) können Sie hören im Abo „Legimi Premium” in Legimi-Apps auf:

Android
iOS
Bewertungen
0,0
0
0
0
0
0
Mehr Informationen
Mehr Informationen
Legimi prüft nicht, ob Rezensionen von Nutzern stammen, die den betreffenden Titel tatsächlich gekauft oder gelesen/gehört haben. Wir entfernen aber gefälschte Rezensionen.



Grundriss der Psychologie

Herausgegeben von Bernd Leplow und Maria von Salisch

Begründet von Herbert Selg und Dieter Ulich

Diese Taschenbuchreihe orientiert sich konsequent an den Erfordernissen des Bachelorstudiums, in dem die Grundlagen psychologischen Fachwissens gelegt werden. Jeder Band präsentiert sein Gebiet knapp, übersichtlich und verständlich!

Eine Übersicht aller lieferbaren und im Buchhandel angekündigten Bände der Reihe finden Sie unter:

https://shop.kohlhammer.de/grundriss-psychologie

Die Autoren

Prof. Mark Stemmler und Dr. Martin Schmucker, Lehrstuhl für Psychologische Diagnostik, Methodenlehre und Rechtspsychologie der Friedrich-Alexander-Universität Erlangen-Nürnberg.

Mark StemmlerMartin Schmucker

Inferenzstatistik

Verlag W. Kohlhammer

Dieses Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwendung außerhalb der engen Grenzen des Urheberrechts ist ohne Zustimmung des Verlags unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Übersetzungen und für die Einspeicherung und Verarbeitung in elektronischen Systemen.

Pharmakologische Daten verändern sich ständig. Verlag und Autoren tragen dafür Sorge, dass alle gemachten Angaben dem derzeitigen Wissensstand entsprechen. Eine Haftung hierfür kann jedoch nicht übernommen werden. Es empfiehlt sich, die Angaben anhand des Beipackzettels und der entsprechenden Fachinformationen zu überprüfen. Aufgrund der Auswahl häufig angewendeter Arzneimittel besteht kein Anspruch auf Vollständigkeit.

Die Wiedergabe von Warenbezeichnungen, Handelsnamen und sonstigen Kennzeichen berechtigt nicht zu der Annahme, dass diese frei benutzt werden dürfen. Vielmehr kann es sich auch dann um eingetragene Warenzeichen oder sonstige geschützte Kennzeichen handeln, wenn sie nicht eigens als solche gekennzeichnet sind.

Es konnten nicht alle Rechtsinhaber von Abbildungen ermittelt werden. Sollte dem Verlag gegenüber der Nachweis der Rechtsinhaberschaft geführt werden, wird das branchenübliche Honorar nachträglich gezahlt.

Dieses Werk enthält Hinweise/Links zu externen Websites Dritter, auf deren Inhalt der Verlag keinen Einfluss hat und die der Haftung der jeweiligen Seitenanbieter oder -betreiber unterliegen. Zum Zeitpunkt der Verlinkung wurden die externen Websites auf mögliche Rechtsverstöße überprüft und dabei keine Rechtsverletzung festgestellt. Ohne konkrete Hinweise auf eine solche Rechtsverletzung ist eine permanente inhaltliche Kontrolle der verlinkten Seiten nicht zumutbar. Sollten jedoch Rechtsverletzungen bekannt werden, werden die betroffenen externen Links soweit möglich unverzüglich entfernt.

1. Auflage 2025

Alle Rechte vorbehalten© W. Kohlhammer GmbH, StuttgartGesamtherstellung: W. Kohlhammer GmbH, Heßbrühlstr. 69, 70565 [email protected]

Print:ISBN 978-3-17-023439-0

E-Book-Formate:pdf:ISBN 978-3-17-032455-8epub:ISBN 978-3-17-032456-5

Geleitwort

Erkenntnisse der Psychologie werden täglich in den Medien transportiert. Junge Erwachsene drängeln sich um einen Studienplatz in diesem Fach. Denn die meisten Fragen der Gesellschaft von Morgen sind nicht ohne die Erkenntnisse dieser Wissenschaft des menschlichen »Erlebens und Verhaltens« zu beantworten. Großbaustellen wie der Umgang mit Pandemien und Kriegsereignissen, die Bewältigung von Digitalisierung und Globalisierung oder der gesellschaftliche Umbau in Richtung Nachhaltigkeit lassen sich im Grunde nur mit dem Wissen über die individuellen und sozialen Mechanismen des Verhaltens und Erlebens, der Analyse ihrer Entstehungsbedingungen und der Entwicklung von Veränderungen auf individueller und Gruppenebene sinnvoll bearbeiten. Psychologie ist zugleich – so eine Analyse der Zitiermuster in über 7000 natur- und sozialwissenschaftlichen Fachzeitschriften – eine von sieben »hub sciences«, (in etwa »Schlüsselwissenschaften«), welche die Debatte zur Gewinnung wissenschaftlicher Einsichten bereichert und enge Verbindungen zu einer Vielzahl von Nachbardisziplinen unterhält: Dazu zählen u. a. die Neurowissenschaft mit der Neuropsychopharmakologie, Psychiatrie, Gerontologie und die anderen Gebiete der Medizin ebenso wie die Gesundheitswissenschaft (»Public Health«), Konfliktforschung, die Sozial-‍, Bildungs-‍, Kommunikations-‍, Sport-‍, Rechts- und Wirtschaftswissenschaften, die Forensik sowie Marktforschung. Oft übersehen, aber nicht weniger von Bedeutung, sind die eher technisch orientierten Fächer wie beispielsweise die Ingenieurs-‍, Luft- und Raumfahrt-‍, Verkehrs- und Arbeitspsychologie (mit »Mensch-Maschine-Systemen«/»Human Factors«). Auch die Umwelt- und Architekturpsychologie, Raum- und Stadtplanung sowie die methodischen Anwendungsfelder der Diagnostik, Intervention, Evaluation und Sozialforschung kommen nicht ohne spezifisch psychologisches Wissen aus.

Das Studium der Psychologie erfolgt in Bachelor- und Masterstudiengängen, die auf Modulen basieren. Diese sind in sich abgeschlossen und bauen oft aufeinander auf. Sie sind jeweils mit Lehr- und Lernzielen versehen und spezifizieren, welche Themen und Methoden in ihnen zu behandeln sind. Aus diesen Angaben leiten sich Art, Umfang und Thematik der Modulprüfungen ab. Die Bände der Reihe Grundriss der Psychologie orientieren sich stark am Lehrgebiet des Bachelorstudiums Psychologie. Seit Einführung der Bachelor-Masterstudiengänge sind jedoch eine Fülle von eigenständigen Bachelor- und Masterausbildungen mit Psychologiebezug hinzugekommen. Auch für diese Wissensgebiete stellt die Grundrissreihe das notwendige psychologische Basiswissen zur Verfügung.

Da im Bachelorstudium die Grundlagen des psychologischen Fachwissens gelegt werden, ist es uns ein Anliegen, dass sich jeder Band der Reihe Grundriss der Psychologie ohne Rückgriff auf Wissen aus anderen Teilgebieten der Psychologie lesen lässt. Jeder Band der Grundrissreihe orientiert sich an einem der Module, welche die Deutsche Gesellschaft für Psychologie (DGPs) für die Psychologieausbildung ausgearbeitet hat. Damit steht den Studierenden ein breites Grundwissen zur Verfügung, welches die wichtigsten Gebiete aus dem vielfältigen Spektrum der Psychologie verlässlich abdeckt. Dieses ermöglicht den Übergang u. a. auf den darauf aufbauenden Masterstudiengang der Psychologie und den neuen »Psychotherapiemaster«.

Zugleich können Angehörige anderer Berufe, in denen menschliches Verhalten und Erleben Entscheidungsabläufe beeinflusst, von einem fundierten Grundwissen in Psychologie profitieren. Neben Tätigkeiten in den bereits genannten Gebieten betrifft das eine vom Fachjournalismus und allen Medienberufen über den Erziehungs- und Gesundheitsbereich, die Wirtschaft, Produktgestaltung und das Marketing bis hin zu den Angehörigen des Justizsystems, der Polizei und des Militärs, allen Managementfunktionen und Führungskräften der Politik reichende Bandbreite. Bei ethisch vertretbarer Anwendung stellt die wissenschaftliche Psychologie mithin Methoden und Erkenntnisse zur Verfügung, über die sich gesellschaftliche Entwicklungen positiv verändern lassen. Damit kann in einer enormen Zahl auch nicht-klassisch psychologischer Studiengänge und Anwendungsfelder vom Wissen eines Bachelors in Psychologie profitiert werden. Deshalb auch sind die einzelnen Bände so gestaltet, dass sie psychologisches Grundlagenwissen voraussetzungsfrei vermitteln.

So wünschen wir den Leserinnen und Lesern dieser Bände der Reihe Grundriss der Psychologie vielfältige Einsichten und Erfolge in der praktischen Umsetzung psychologischen Wissens!

Maria von SalischBernd Leplow

Vorwort

Dieses Buch zur Inferenzstatistik orientiert sich an den Zielen der Kohlhammer-Reihe Grundriss der Psychologie, welche sich wiederum an den Modulen im Bachelor-Studium der Psychologie orientiert, wie sie von der Deutschen Gesellschaft für Psychologie (DGPs) im Jahr 2005 für die Neugestaltung der Psychologieausbildung vorgeschlagen wurden. Die Inferenzstatistik wird an den deutschsprachigen Hochschulen im Psychologiestudium typischerweise nach einer Einführung in die deskriptive Statistik und Wahrscheinlichkeitstheorie behandelt, meist als »Statistik II« im zweiten Fachsemester des Bachelorstudiums. Auf diese Inhalte und dieses Niveau ist dieses Lehrbuch ausgerichtet. Der Inhalt ist auch für Nebenfach-Studierende beispielsweise der Pädagogik, Politikwissenschaft und Soziologie attraktiv.

Im Gegensatz zu einem Lehrbuch über die beschreibende oder deskriptive Statistik, bei dem man lernt wie man Stichproben und deren Kennwerte korrekt darstellt, werden in der Inferenzstatistik Verfahren behandelt, die Aussagen über die hinter der Stichprobe stehenden Grundgesamtheit ermöglichen sollen, sei es, dass Populationsparameter geschätzt werden oder Hypothesen überprüft werden. Im gesamten Buch geht es darum, von den Befunden oder Verhältnissen in einer Stichprobe auf die Verhältnisse in der Grundgesamtheit zu schließen (daher der Name schließende bzw. Inferenz- oder induktive Statistik).

Die beiden Autoren haben langjährige Erfahrungen in der Lehre von Psychologie-Studierenden (auf dem Bachelor- und Master-Level). Der Inhalt und Aufbau orientiert sich genau am Lernniveau der Bachelor-Studierenden. Die Inhalte dieses Buches wurden mit dem Ziel erarbeitet, zugleich interessant sowie leicht verständlich zu sein. Jedes Kapitel enthält eine Reihe von hilfreichen didaktischen Elementen, die auch zum Selbststudium geeignet sind. Statistische Begriffe werden in kurzen Erklär-Kästchen anschaulich eingeführt bzw. definiert. Alle statistischen Tests oder Verfahren werden anhand von einfachen Rechenbeispielen, die mit dem Taschenrechner nachvollzogen werden können, erklärt und beschrieben.

Kapitel 1 behandelt die Grundlagen der Inferenzstatistik. Zunächst geht es um die wichtige Unterscheidung zwischen Stichprobe und Grundgesamtheit (auch Population genannt). Danach werden einige grundlegende Überlegungen eingeführt, wie man mit Hilfe von wahrscheinlichkeitstheoretischen Überlegungen von der Stichprobe auf die Grundgesamtheit schließt. Dazu gehören wichtige Begriffe wie Stichprobenkennwerteverteilung und Standardfehler, die in diesem Kapitel eingeführt werden.

Kapitel 2 behandelt die Methoden und Kriterien der Schätzung von Bedingungen in der Grundgesamtheit (d. h. der Schätzung von Parametern). Hier steht die Intervallschätzung im Vordergrund.

Die Beschreibung der Grundlagen der statistischen Hypothesenprüfung erfolgt im dritten Kapitel. Dazu gehören die Erstellung und Prüfung von (einseitigen oder zweiseitigen) Null- und Alternativhypothesen, die Fehler 1. und 2. Art sowie das Signifikanzniveau und die Irrtumswahrscheinlichkeit. Ferner geht es in diesem Kapitel um die wichtige Unterscheidung zwischen Signifikanz und Wahrheit sowie um Teststärke und die optimale Stichprobengröße.

Das »Hypothesentesten«, beginnt ab dem vierten Kapitel. Dieses beschäftigt sich mit der Prüfung von Unterschiedshypothesen. Hier werden systematisch und »rezeptbuchartig« parametrische und nonparametrische Verfahren zur Prüfung von Mittelwerten, Varianzen und Häufigkeitsverteilungen vorgestellt. Es kommen verschiedene t-Tests zur Sprache (für unabhängige und abhängige Stichproben). Daneben werden Verfahren für ordinalskalierte Variablen eingeführt (Mann-Whitney-U-Test, Wilcoxon-Test), Testverfahren zur Prüfung von Verteilungsvoraussetzungen sowie 2-Verfahren zur Analyse von Häufigkeiten betrachtet. Die Analyse von Mittelwerten wird im anschließenden Kapitel 5 zur Varianzanalyse auf Situationen mit mehr als zwei Stichproben verallgemeinert und es werden die wichtigsten Varianten vorgestellt (z. B. querschnittliche Varianzanalysen und Varianzanalysen mit Messwiederholung).

Im abschließenden Kapitel 6 wird auf die Prüfung von Zusammenhangshypothesen mit Schwerpunkt auf die statistische Absicherung der linearen Regression und der Produkt-Moment-Korrelation eingegangen.

So ergibt sich ein breites Fundament an inferenzstatistischen Grundlagen sowie spezifischen Anwendungsfällen. Diese sollen zum Ersten den sicheren Umgang mit häufig auftretenden statistischen Fragestellungen ermöglichen. Zum Zweiten soll damit eine Basis geschaffen werden, um sich auch weitergehende inferenzstatistische Verfahren schnell aneignen zu können.

Uns ist bewusst, dass wahrscheinlich viele Studierende das Fach Psychologie nicht wegen, sondern trotz der Statistik wählen. Dennoch hoffen wir, dass Sie nicht nur die Vorgehensweisen der Inferenzstatistik verstehen und anzuwenden lernen, sondern dass ein oder andere Mal (vielleicht mit Überraschung) feststellen, dass es Ihnen Spaß macht und Ihr Interesse angeregt wurde. Wir wünschen Ihnen an dieser Stelle von ganzem Herzen viel Erfolg im Studium, möge dieses Buch signifikant dazu beitragen!

An dieser Stelle möchten wir unseren Dank an den Kohlhammer Verlag aussprechen, für dessen große Geduld und Unterstützung. Großen Dank auch an Harry Schneider von rsr-design in Guntersblum am Rhein für die Gestaltung der Abbildungen und Tabellen sowie unseren Statistiktutoren Mariele Dienesch und David Roth für ihre Anmerkungen zum Manuskript.

Mark Stemmler und Martin Schmucker, Erlangen im Winter 2024/25

1 Grundlagen der Inferenzstatistik

1.1 Ziel der Inferenzstatistik

Lernziele

Die grundlegende Problemstellung der Inferenzstatistik ist, von Daten, die an Stichproben gewonnen wurden, auf die Gegebenheiten in der Grundgesamtheit zu schließen (daher auch schließende Statistik). Die Stichprobe stellt einen möglichst repräsentativen Ausschnitt der Grundgesamtheit dar. Sie spiegelt die Gegebenheiten der Grundgesamtheit aber nicht exakt wider, sondern fehlerbelastet (Stichprobenfehler). Mittels der Inferenzstatistik lässt sich abschätzen, wie gut auf Basis der Stichprobe auf die Grundgesamtheit geschlossen werden kann.

Mit den Methoden der deskriptiven Statistik werden empirische Daten, die an Stichproben gewonnen wurden, durch zusammenfassende Kennwerte, grafische oder tabellarische Darstellungen beschrieben. Auf diese Weise können Verteilungseigenschaften von umfangreichen Einzeldaten ökonomisch und leicht fassbar dargestellt werden.

In der Wissenschaft geht es aber meist darum, allgemeingültige Aussagen zu treffen. Das heißt, dass das eigentliche Ziel nicht darin besteht, die Stichprobe darzustellen, sondern auf Basis der Stichprobendaten Aussagen zu treffen, die über diese hinausgehen: Es geht darum, die Stichprobenergebnisse auf die Grundgesamtheit zu verallgemeinern. Man spricht daher im Gegensatz zur beschreibenden oder deskriptiven Statistik auch von der schließenden Statistik oder Inferenzstatistik, da auf Basis einer relativ kleinen Menge von Untersuchungseinheiten (Stichprobe) auf alle potentiellen Untersuchungseinheiten (Grundgesamtheit) geschlossen werden soll.

1.2 Stichprobe und Grundgesamtheit

Definition: Grundgesamtheit und Stichprobe

Unter der Grundgesamtheit (auch: Population) versteht man die Gesamtmenge aller potentiellen Untersuchungseinheiten. Eine Stichprobe ist ein Ausschnitt aus der Grundgesamtheit. Bei der Stichprobenziehung werden nach bestimmten Methoden aus der Population Untersuchungseinheiten ausgewählt, die im Rahmen der Datenerhebung tatsächlich untersucht werden und die Population möglichst gut repräsentieren sollen.

Je nachdem über welche Grundgesamtheit man Aussagen treffen will, kann diese breiter (z. B. alle Menschen) oder enger definiert sein (z. B. alle in Deutschland lebenden Menschen oder alle Psychologiestudierenden an deutschen Hochschulen).

In aller Regel ist die Population zu groß, um sie vollständig zu untersuchen. Es wäre z. B. unrealistisch, alle in Deutschland lebenden Menschen untersuchen zu wollen (selbst wenn man nur eine Minute pro Person bräuchte, wäre man damit fast 150 Jahre beschäftigt – und zwar 24 h/Tag, 7 Tage/Woche, ohne zu schlafen oder Pausen zu machen). Stattdessen untersucht man lediglich einen Teil der Grundgesamtheit, eine sogenannte Stichprobe.

1.2.1 Stichprobenkennwerte und Populationsparameter

Stichprobendaten lassen sich mit Hilfe von Stichprobenkennwerten darstellen. So gibt das arithmetische Mittel () den durchschnittlichen Wert einer Variablen über alle Untersuchungsteilnehmer an. In gleicher Weise gibt es auch in der Population einen Durchschnittswert (μ; ausgesprochen: »mü«). Um statistische Kennwerte, die sich auf eine Stichprobe beziehen, und statistische Parameter, die sich auf die Grundgesamtheit beziehen, schnell unterscheiden zu können, kennzeichnet man diese bei Stichproben mit lateinischen Buchstaben. Wenn es dagegen um die Beschreibung von Grundgesamtheiten geht, zieht man griechische Buchstaben heran (▸ Tab. 1.1).

Tab. 1.1:Abkürzungen für Stichprobenkennwerte und Populationsparameter

Stichprobenkennwert

Populationsparameter

Arithmetischer Mittelwert

μ

Varianz

s2

σ2

Korrelation

r

ρ

Wahrscheinlichkeit

p

Wenn nun das Ziel der Inferenzstatistik darin besteht, mittels Stichprobendaten auf die Grundgesamtheit zu schließen, so liegt es nahe, die Stichprobenkennwerte zu nutzen, um auf die Populationsparameter zu schließen. Und genau dies tut man auch. Je besser die Stichprobe die zugrundeliegende Population abbildet, desto exakter lassen sich über die Stichprobenkennwerte die Populationsparameter abschätzen. Aber die Stichprobendaten sind nie ein exaktes Abbild der Population. Man muss immer damit rechnen, dass sie mehr oder weniger fehlerbehaftet sind. Daraus ergibt sich auch, dass Stichprobenkennwerte die jeweiligen Populationsparameter nicht exakt abbilden, sondern mehr oder weniger stark davon abweichen können. Sie können das leicht selbst ausprobieren:

1.3 Stichprobenkennwerteverteilung

Abb. 1.1:Verteilung der Mittelwerte bei n =10 Würfelwürfen

Man könnte das Beispiel auch mit anderen Kennwerten wiederholen (z. B. könnte man die Standardabweichungen bestimmen etc.). Eines würde immer gleichbleiben: Die resultierenden Kennwerte schwanken mehr oder weniger stark um den »wahren« Wert in der Population, den Populationsparameter. Die resultierende Verteilung bezeichnen wir als Stichprobenkennwerteverteilung (oft auch verkürzt: Stichprobenverteilung; englisch: sampling distribution). Je größer die Schwankungen sind, desto ungenauer ist die Schätzung des Populationsparameters durch den Stichprobenkennwert und desto vorsichtiger müssen wir sein, wenn wir auf Basis der Stichprobendaten Aussagen über die Grundgesamtheit treffen wollen.

Es wäre hilfreich, wenn wir angeben könnten, wie ungenau unsere Aussagen über die Population sind, d. h., wie groß die Schwankungen der Stichprobenkennwerteverteilung sind. Ein Kennwert, der bereits aus der deskriptiven Statistik bekannt ist, um die Schwankungen der Einzelwerte auszudrücken, ist die Standardabweichung. In äquivalenter Weise können die Schwankungen der Stichprobenkennwerte durch die Standardabweichung der Stichprobenkennwerteverteilung quantifiziert werden. Da es sich um einen besonderen Fall handelt, hat die Standardabweichung der Stichprobenkennwerteverteilung einen besonderen Namen: Sie wird als Standardfehler bezeichnet.

Definition: Standardfehler

Der Standardfehler (englisch: standard error [SE]) ist die Standardabweichung der Kennwerteverteilung von gleichgroßen Zufallsstichproben einer Grundgesamtheit.

1.3.1 Standardfehler des Mittelwerts

Ein in der empirischen Forschung sehr häufiger Anwendungsfall betrifft Aussagen über den Mittelwert einer Variablen (Populationsparameter μ). Der Stichprobenmittelwert ist ein erwartungstreuer Schätzer des Populationsparameters μ (▸ Kap. 2) μ. Wie im Beispiel mit den 10 Würfelwürfen gesehen, verschätzt der Stichprobenmittelwert den Populationsparameter mehr oder weniger stark und es ergeben sich Schwankungen, so dass sich als Stichprobenkennwerteverteilung die Verteilung der Mittelwerte ergibt. Diese Variabilität der Mittelwerte wird durch den Standardfehler des Mittelwerts () ausgedrückt. Dieser bestimmt sich auf einfache Weise als:

Wie groß der Standardfehler des Mittelwertes ist, hängt also lediglich von zwei Faktoren ab: der Varianz des Merkmals in der Population (σ2) sowie der Größe der Stichprobe n:

Je größer die Stichprobe ist, an der man den Stichprobenmittelwert ermittelt hat, desto kleiner ist der Standardfehler und vice versa. Im theoretischen Fall einer unendlich großen Stichprobe geht der Standardfehler daher gegen 0. Realistischer gedacht: Je größer die Stichprobe ist, desto genauer sind die Aussagen, die man aus den Stichprobendaten in Bezug auf die Populationsverhältnisse treffen kann. Große Stichproben sind also in der Inferenzstatistik hilfreich, da sie bessere Schätzungen ermöglichen.

IQ-Werte sind so normiert, dass sie in der Normalbevölkerung einen Mittelwert von und eine Streuung von haben.1 Bei einer Stichprobenerhebung mit würde sich demnach eine Stichprobenkennwerteverteilung des Mittelwerts mit einem Standardfehler von ergeben.

Ein Problem bei der praktischen Bestimmung des Standardfehlers liegt darin, dass die dafür benötigte Populationsvarianz σ2 in der Regel gar nicht bekannt ist. Dementsprechend muss die Varianz und in der Folge der Standardfehler aus den Stichprobendaten geschätzt werden. Um zu verdeutlichen, dass es sich hier um einen geschätzten Standardfehler handelt, bezeichnet man ihn mit dem lateinischen Buchstaben. Die Bestimmung erfolgt auf der Basis der Stichprobenvarianz . Die so bestimmte Stichprobenvarianz ist wiederum ein erwartungstreuer Schätzer der Populationsvarianz, so dass sich für den Standardfehler des Mittelwerts ergibt:

1.3.2 Besondere Stichprobenkonstellationen

Die dargestellte Bestimmung des Standardfehlers bezieht sich auf den »Normalfall«, dass eine Zufallsstichprobe aus einer (theoretisch unendlich) großen Grundgesamtheit gezogen wurde. Es gibt Stichprobenkonstellationen, bei denen die Repräsentativität erhöht ist, sei es, weil die Grundgesamtheit im Vergleich zur Stichprobengröße relativ klein ist (finite Grundgesamtheit) oder bestimmte Strategien bei der Stichprobenziehung angewendet wurden, um die Repräsentativität zu verbessern, z. B. die Ziehung einer geschichteten Stichprobe. Auf diese beiden Sonderfälle soll im Folgenden eingegangen werden, da der Standardfehler in diesen Konstellationen gegenüber einer »normalen« Zufallsstichprobe geringer ausfällt.

Finite Grundgesamtheiten

Wenn die Grundgesamtheit in ihrer Größe (N) beschränkt ist, so ergibt sich die Situation, dass eine Stichprobenerhebung mit der Größe n nahe an eine Vollerhebung kommen kann. Das hat zur Folge, dass Stichproben, die von der Population extrem abweichen, unwahrscheinlicher werden. Dies kann bei der Bestimmung des Standardfehlers Berücksichtigung finden, indem eine sogenannte Endlichkeitskorrektur vorgenommen wird:

Man sieht, dass der Standardfehler sichtbar niedriger ausfällt. Die Endlichkeitskorrektur fällt aber nur ins Gewicht, wenn die Population relativ klein ist bzw. die Stichprobengröße der Gesamtpopulation relativ nahekommt. Als Faustregel lässt sich sagen, dass man bei N/n > 100 darauf verzichten kann und stattdessen den unkorrigierten Standardfehler bestimmt.

Geschichtete Stichproben

Wenn man die Grundgesamtheit in verschiedene Teilmengen aufteilt (z. B. die Bewohner der BRD nach den Bundesländern oder Studierende nach den Studienfächern etc.) und nun in den jeweiligen Schichten getrennt Stichproben zieht, deren Größe den Anteil in der Grundgesamtheit widerspiegelt, dann spricht man von einer geschichteten Stichprobe. Der Vorteil einer geschichteten Stichprobe gegenüber einer einfachen Zufallsstichprobe ist, dass die Repräsentativität der Stichprobe steigt, weil sichergestellt ist, dass die Stichprobe in Bezug auf die Schichtungsvariable exakt der Population entspricht. Kennwerte einer sinnvoll geschichteten Stichprobe liefern deswegen bessere Schätzwerte als ungeschichtete Stichproben und dies kann man bei der Bestimmung des Standardfehlers berücksichtigen. Die entsprechende Formel lautet:

Dabei wird die Variabilität des erfassten Merkmals, die die Fehleranfälligkeit bei der Stichprobenziehung bedingt (s2), um den Anteil reduziert, der sich über die Unterschiedlichkeit in den Stufen der Schichtungsvariablen ergeben würde (, weil diese ja korrekt (und fehlerfrei) repräsentiert ist). Bei handelt es sich um die Varianz der Mittelwerte über die verschiedenen Schichten:

Beispiel

Um die Zufriedenheit mit dem öffentlichen Nahverkehr in der Bevölkerung abzuschätzen, wurde eine Stichprobe von N