Komplexe regressionsanalytische Verfahren - Matthias Rudolf - E-Book

Komplexe regressionsanalytische Verfahren E-Book

Matthias Rudolf

0,0
42,99 €

oder
-100%
Sammeln Sie Punkte in unserem Gutscheinprogramm und kaufen Sie E-Books und Hörbücher mit bis zu 100% Rabatt.
Mehr erfahren.
Beschreibung

Für die Auswertung empirischer Untersuchungen werden oftmals spezialisierte Verfahren benötigt, die sich für bestimmte Datenmuster und Fragestellungen eignen. Dieses Lehrbuch wendet sich an alle, die einen Einstieg in komplexe regressionsanalytische Methoden und deren praktische Umsetzung suchen. Dabei werden wichtige Fragen beantwortet, die sich häufig bei der Auswertung komplexer Daten stellen: Wie wertet man Daten hierarchisch geordneter Ebenen aus? Wie werden Datenanalysen durchgeführt, wenn die Kriteriumsvariablen nicht normalverteilt oder kategorial sind? Wie geht man bei regressionsanalytischen Untersuchungen mit Messwiederholungen oder mit sehr vielen Prädiktoren vor? Folgende Verfahren werden im Buch thematisiert: Verallgemeinerte lineare Modelle, verallgemeinerte Schätzgleichungen, Mehrebenenmodelle, ordinale und multinomiale logistische Regression, kanonische Korrelation, Ridge-Regression, Regression mit partiellen kleinsten Quadraten. Alle im Text verwendeten Beispieldatensätze, kommentierte R-Skripte sowie kommentierte SPSS-Syntax-Dateien aller Analysen sind online verfügbar.

Das E-Book können Sie in Legimi-Apps oder einer beliebigen App lesen, die das folgende Format unterstützen:

EPUB
Bewertungen
0,0
0
0
0
0
0
Mehr Informationen
Mehr Informationen
Legimi prüft nicht, ob Rezensionen von Nutzern stammen, die den betreffenden Titel tatsächlich gekauft oder gelesen/gehört haben. Wir entfernen aber gefälschte Rezensionen.



Matthias Rudolf

Diana Vogel-Blaschka

Komplexe regressionsanalytische Verfahren

Eine praxisorientierte Einführung mit Anwendungsbeispielen in R und SPSS

Dr. rer. nat. Matthias Rudolf, geb. 1959. 1978–1983 Studium der Mathematik. 1989 Promotion. 1983–1999 wissenschaftlicher Mitarbeiter am Wissenschaftsbereich Physiologie bzw. am Institut für Humanbiologie und Biopsychologie der TU Dresden. Seit 1999 wissenschaftlicher Mitarbeiter am Institut für Allgemeine Psychologie, Biopsychologie und Methoden der Psychologie der TU Dresden. Forschungsschwerpunkte: Komplexe multivariate Verfahren in der Psychologie, Analyse physiologischer Zeitreihen, psychometrische Fragebogenentwicklung. Lehrinhalte: Multivariate Statistik, Biostatistik, Statistische Datenanalyse mit SPSS bzw. mit R.

Dipl.-Psych. Diana Vogel-Blaschka, geb. 1989. 2009–2015 Studium der Psychologie in Dresden, 2015–2022 Doktorandin und wissenschaftliche Mitarbeiterin an der Professur für Methoden der Psychologie und kognitive Modellierung, seit 2019 freiberufliche Methoden- und Statistikberaterin. Arbeitsschwerpunkte: Effektbasierte Handlungskontrolle, kognitive Modellierung und komplexe multivariate Verfahren in der Psychologie. Lehrinhalte: Statistik, Statistische Datenanalyse mit R, Einführung in die Methoden der Psychologie, Stichproben und Versuchsplanung.

Informationen und Zusatzmaterialien zu diesem Buch finden Sie unter https://elibrary.hogrefe.com/psychlehrbuchplus

Copyright-Hinweis:

Das E-Book einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulässig und strafbar.

Der Nutzer verpflichtet sich, die Urheberrechte anzuerkennen und einzuhalten.

Hogrefe Verlag GmbH & Co. KG

Merkelstraße 3

37085 Göttingen

Deutschland

Tel. +49 551 999 50 0

Fax +49 551 999 50 111

[email protected]

www.hogrefe.de

Umschlagabbildung: © iStock.com by Getty Images / SolStock

Satz: ARThür Grafik-Design & Kunst, Weimar

Format: EPUB

1. Auflage 2023

© 2023 Hogrefe Verlag GmbH & Co. KG, Göttingen

(E-Book-ISBN [PDF] 978-3-8409-2908-3; E-Book-ISBN [EPUB] 978-3-8444-2908-4)

ISBN 978-3-8017-2908-0

https://doi.org/10.1026/02908-000

Nutzungsbedingungen:

Der Erwerber erhält ein einfaches und nicht übertragbares Nutzungsrecht, das ihn zum privaten Gebrauch des E-Books und all der dazugehörigen Dateien berechtigt.

Der Inhalt dieses E-Books darf von dem Kunden vorbehaltlich abweichender zwingender gesetzlicher Regeln weder inhaltlich noch redaktionell verändert werden. Insbesondere darf er Urheberrechtsvermerke, Markenzeichen, digitale Wasserzeichen und andere Rechtsvorbehalte im abgerufenen Inhalt nicht entfernen.

Der Nutzer ist nicht berechtigt, das E-Book – auch nicht auszugsweise – anderen Personen zugänglich zu machen, insbesondere es weiterzuleiten, zu verleihen oder zu vermieten.

Das entgeltliche oder unentgeltliche Einstellen des E-Books ins Internet oder in andere Netzwerke, der Weiterverkauf und/oder jede Art der Nutzung zu kommerziellen Zwecken sind nicht zulässig.

Das Anfertigen von Vervielfältigungen, das Ausdrucken oder Speichern auf anderen Wiedergabegeräten ist nur für den persönlichen Gebrauch gestattet. Dritten darf dadurch kein Zugang ermöglicht werden. Davon ausgenommen sind Materialien, die eindeutig als Vervielfältigungsvorlage vorgesehen sind (z. B. Fragebögen, Arbeitsmaterialien).

Die Übernahme des gesamten E-Books in eine eigene Print- und/oder Online-Publikation ist nicht gestattet. Die Inhalte des E-Books dürfen nur zu privaten Zwecken und nur auszugsweise kopiert werden.

Diese Bestimmungen gelten gegebenenfalls auch für zum E-Book gehörende Download-Materialien.

Zitierfähigkeit: Dieses EPUB beinhaltet Seitenzahlen zwischen senkrechten Strichen (Beispiel: |1|), die den Seitenzahlen der gedruckten Ausgabe und des E-Books im PDF-Format entsprechen.

Inhaltsverzeichnis

Komplexe regressionsanalytische Verfahren

Vorwort

Kapitel 1  Verallgemeinerte lineare Modelle

1.1  Einleitung und Fragestellungen

1.2  Grundlagen verallgemeinerter linearer Modelle

1.2.1  Verteilungen in verallgemeinerten linearen Modellen

1.2.2  Linkfunktionen

1.2.3  Schätzung der Parameter und Beurteilung der Modellgüte

1.3  Beispiele verallgemeinerter linearer Modelle

1.3.1  Poisson-Regression mit einem dichotomen Prädiktor

1.3.2  Poisson-Regression mit einem metrischen Prädiktor

1.3.3  Gamma-Regression mit zwei Prädiktoren

1.4  Anwendung in R

1.4.1  Poisson-Regression mit einem dichotomen Prädiktor

1.4.2  Poisson-Regression mit einem metrischen Prädiktor

1.4.3  Gamma-Regression mit zwei Prädiktoren

1.5  Anwendung in SPSS

1.5.1  Poisson-Regression mit einem dichotomen Prädiktor

1.5.2  Poisson-Regression mit einem metrischen Prädiktor

1.5.3  Gamma-Regression mit zwei Prädiktoren

1.6  Inhalt der Website

Kapitel 2  Modelle verallgemeinerter Schätzgleichungen

2.1  Einleitung und Fragestellungen

2.2  Grundlagen der Modelle verallgemeinerter Schätzgleichungen

2.2.1  Verteilungen und Linkfunktionen

2.2.2  Korrelationsstrukturen

2.2.3  Schätzung der Parameter und Beurteilung der Modellgüte

2.2.4  Einordnung und Grenzen des Verfahrens

2.3  Beispiele von Modellen verallgemeinerter Schätzgleichungen

2.3.1  Lineare Regressionsanalyse mit Messwiederholungen

2.3.2  Poisson-Regression bei Clusterstrukturen

2.4  Anwendung in R

2.4.1  Lineare Regressionsanalyse mit Messwiederholungen

2.4.2  Poisson-Regression bei Clusterstrukturen

2.5  Anwendung in SPSS

2.5.1  Lineare Regressionsanalyse mit Messwiederholungen

2.5.2  Poisson-Regression bei Clusterstrukturen

2.6  Inhalt der Website

Kapitel 3  Mehrebenenmodelle

3.1  Einleitung und Fragestellungen

3.2  Hierarchische lineare Modelle

3.2.1  Besonderheiten hierarchischer Datenstrukturen

3.2.2  Von der linearen Regression zum hierarchischen linearen Modell

3.3  Wichtige hierarchische lineare Modelle

3.3.1  Nullmodell und Intraklassenkorrelation

3.3.2  Mehrebenenmodelle mit Level-2-Prädiktoren bezüglich der Konstante

3.3.3  Mehrebenenmodelle mit Level-1-Prädiktoren

3.3.4  Mehrebenenmodelle mit Interaktionen zwischen den Ebenen

3.4  Zentrale Aspekte der Analyse hierarchischer linearer Modelle

3.4.1  Parameterschätzung, Varianzaufklärung, Tests und Modellgüte

3.4.2  Zentrierung und Kovarianzstrukturen

3.4.3  Voraussetzungen, Einordnung und Grenzen des Verfahrens

3.5  Hierarchische verallgemeinerte lineare Modelle

3.6  Beispiele für hierarchische lineare Modelle

3.6.1  Nullmodell

3.6.2  Modell mit Level-2-Prädiktor bezüglich der Konstante

3.6.3  Modell mit Level-1-Prädiktor

3.6.4  Modell mit Interaktionen zwischen den Ebenen

3.7  Beispiel eines Mehrebenenmodells mit dichotomem Kriterium

3.8  Anwendung in R

3.8.1  Hierarchische lineare Modelle

3.8.2  Mehrebenenmodell mit dichotomem Kriterium

3.9  Anwendung in SPSS

3.9.1  Hierarchische lineare Modelle

3.9.2  Mehrebenenmodell mit dichotomem Kriterium

3.10  Inhalt der Website

Kapitel 4  Multinomiale logistische Regression

4.1  Einleitung und Fragestellung

4.2  Grundlagen des Verfahrens

4.2.1  Modell der multinomialen Regression

4.2.2  Schätzung der Koeffizienten

4.2.3  Prüfung der Modellgüte und Test einzelner Effekte

4.2.4  Voraussetzungen und Einordnung des Verfahrens

4.3  Anwendungsbeispiel

4.4  Anwendung in R

4.5  Anwendung in SPSS

4.6  Inhalt der Website

Kapitel 5  Ordinale Regression

5.1  Einleitung und Fragestellung

5.2  Grundlagen des Verfahrens

5.2.1  Modell der ordinalen Regression

5.2.2  Schätzung der Koeffizienten

5.2.3  Prüfung der Modellgüte und Test einzelner Effekte

5.2.4  Voraussetzungen und Einordnung des Verfahrens

5.3  Anwendungsbeispiel

5.4  Anwendung in R

5.5  Anwendung in SPSS

5.6  Inhalt der Website

Kapitel 6  Kanonische Korrelation

6.1  Einleitung und Fragestellung

6.2  Grundlagen des Verfahrens

6.2.1  Allgemeine Vorgehensweise

6.2.2  Kenngrößen und statistische Tests

6.2.3  Einordnung des Verfahrens und Anwendungsempfehlungen

6.3  Anwendungsbeispiel

6.4  Anwendung in R

6.5  Anwendung in SPSS

6.6  Inhalt der Website

Kapitel 7  Regression der partiellen kleinsten Quadrate

7.1  Einleitung und Fragestellung

7.2  Grundlagen des Verfahrens

7.2.1  Multiple lineare Regression und Multikollinearität

7.2.2  Hauptkomponentenregression

7.2.3  Grundprinzip der Regression der partiellen kleinsten Quadrate

7.2.4  Berechnung der PkQ-Komponenten

7.2.5  Merkmalsselektionsmethoden und Validierung

7.2.6  Bewertung des Verfahrens

7.3  Anwendungsbeispiel

7.4  Anwendung in R

7.5  Anwendung in SPSS

7.6  Inhalt der Website

Kapitel 8  Ridge-Regression

8.1  Einleitung und Fragestellung

8.2  Grundlagen des Verfahrens

8.2.1  Multiple lineare Regression und Multikollinearität

8.2.2  Prinzip der Ridge-Regression

8.2.3  Vergleich mit der Regression der partiellen kleinsten Quadrate

8.2.4  Einordnung des Verfahrens und Anwendungsempfehlungen

8.3  Anwendungsbeispiel

8.4  Anwendung in R

8.5  Anwendung in SPSS

8.6  Inhalt der Website

Anhang

Inhalt der Website

Literatur

Sachregister

|9|Vorwort

Durch die Möglichkeiten moderner Statistik-Software gibt es heute viele Wege, komplexe statistische Methoden praktisch anwenden zu können. Allerdings ist dabei einerseits das Verständnis komplexer Methoden nicht einfach, andererseits bereitet es oft Probleme, die Methoden sachgerecht mit der zur Verfügung stehenden Software umzusetzen.

Mit unserem Lehrbuch wollen wir helfen, beide Schwierigkeiten zu verringern und gleichzeitig die notwendige Brücke zwischen den jeweiligen Verfahren und ihrer praktischen Umsetzung schlagen. Wir möchten Forschenden und Studierenden aus empirischen Wissenschaften einen gut nachvollziehbaren Einstieg in komplexe regressionsanalytische Modelle bieten und sie zur praktischen Umsetzung dieser Modelle in eigenen Forschungsvorhaben mit den Statistik-Programmen R und SPSS befähigen. Studierende unterschiedlicher Studiengänge können das Buch sowohl als Begleitlektüre zu entsprechenden Statistik-Veranstaltungen als auch als ergänzende Lektüre zum Selbststudium nutzen.

Themenauswahl und inhaltlicher Aufbau

Das vorliegende Buch baut auf der Kenntnis grundlegender multivariater Verfahren wie der multiplen linearen Regressionsanalyse, der binären logistischen Regressionsanalyse und der Faktorenanalyse auf (siehe z. B. Rudolf & Buse, 2020) und stellt auf dieser Grundlage komplexe regressionsanalytische Verfahren vor, die in der praktischen Anwendung große Bedeutung haben. Dabei kann das Buch in drei Inhaltsbereiche unterteilt werden.

Im ersten Inhaltsbereich (Kapitel 1 – 3) werden Methoden vorgestellt, die ausgehend vom allgemeinen linearen Modell ein breites Spektrum an wichtigen und oft angewendeten Modellen und Verfahren umfassen. Die behandelten Modelle umfassen verallgemeinerte lineare Modelle, in denen die Kriteriumsvariable unterschiedliche stetige und diskrete Verteilungen aufweisen kann, sowie Modelle verallgemeinerter Schätzgleichungen, bei denen darüber hinaus korrelierte Beobachtungen berücksichtigt werden können. Besonders ausführlich werden die in empirischen Wissenschaften sehr verbreiteten Mehrebenenmodelle vorgestellt, mit denen detaillierte Auswertungen von Daten möglich sind, die auf hierarchisch strukturierten Ebenen erhoben werden.

Im zweiten Inhaltsbereich (Kapitel 4 und 5) werden mit der multinomialen logistischen und der ordinalen Regression Vorgehensweisen beschrieben, die die Analyse von Kriteriumsvariablen ermöglichen, die nominal skaliertes bzw. ordinales Datenniveau mit mehr als zwei Kategorien aufweisen.

|10|Der dritte Inhaltsbereich (Kapitel 6 – 8) befasst sich mit Modellen, in denen viele, oft korrelierende Merkmale untersucht werden können. Dabei steht bei der kanonischen Korrelationsanalyse die Untersuchung der Zusammenhänge von zwei Merkmalsmengen im Vordergrund. Mit der Regression der partiellen kleinsten Quadrate und mit der Ridge-Regression werden Vorgehensweisen beschrieben, mit denen die Modellierung der Abhängigkeit einer Kriteriumsvariablen von Prädiktorvariablen möglich ist, auch wenn korrelierte Prädiktoren einbezogen werden.

Statistik-Software R und SPSS

Für die Beschreibung der Umsetzung der vorgestellten Modelle haben wir die Statistik-Programmpakete R und IBM SPSS Statistics (kurz: SPSS) ausgewählt, die in den empirischen Wissenschaften besondere Bedeutung haben.

SPSS ist die seit vielen Jahren oft benutzte Standardsoftware in unterschiedlichen Wissenschaftsdisziplinen. Das Programmpaket umfasst ein großes Spektrum statistischer Verfahren und ist relativ einfach zu nutzen, sodass es auch von Forschenden und Studierenden effektiv eingesetzt werden kann, die nicht regelmäßig komplexe Datenauswertungen durchzuführen haben. Für die Darstellungen in diesem Buch stand uns SPSS bis zur Version 28 zu Verfügung.

R ist im Unterschied zu SPSS eine frei verfügbare Software, die in den vergangenen Jahren starke Verbreitung erfahren hat. Zwar ist die Einarbeitung komplizierter als bei SPSS, aber R ist durch die Einbindung einer eigenen Programmiersprache eine sehr flexible Anwendung mit vielfältigen Möglichkeiten. Neue statistische Methoden werden in der Regel zunächst in R umgesetzt und zur Verfügung gestellt, weshalb der Umfang der in R zur Verfügung stehenden Verfahren in vielen inhaltlichen Bereichen größer ist als in SPSS. Da die Entwicklung von R sehr dynamisch ist, haben wir zu jedem Verfahren passende R-Pakete ausgewählt, auf umfassende Vergleiche aktuell verfügbarer R-Pakete für die behandelten Verfahren jedoch weitgehend verzichtet. Bei der Darstellung einzelner Pakete haben wir uns auf die für das jeweilige Verfahren wichtigen Funktionen konzentriert und sind auf grafische Möglichkeiten in der Regel nicht eingegangen. Grundkenntnisse der Programmierung mit R werden in jedem Kapitel vorausgesetzt. R ist besonders für diejenigen zu empfehlen, die sich kontinuierlich mit statistischen Datenanalysen beschäftigen oder die neu entwickelte statistische Verfahren anwenden möchten.

Didaktische Herangehensweise

Das wichtigste Ziel dieses Buches besteht darin, Forschenden und Studierenden sowohl den inhaltlichen Einstieg in die komplexen Verfahren als auch deren Umsetzung mit der Statistik-Software zu erleichtern. Gleichzeitig soll die Grundlage |11|für notwendiges detaillierteres Literaturstudium vor Datenauswertungen in eigenen Forschungsvorhaben gelegt werden.

Bei der Beschreibung der Modelle und Vorgehensweisen haben wir großen Wert darauf gelegt, alle Überlegungen und Abläufe nachvollziehbar und anschaulich darzustellen. Wir haben in allen Kapiteln einfache Datenbeispiele mit gezielt simulierten Daten und inhaltlichem Hintergrund in die Beschreibung der Methoden einbezogen. Die gleichen Datenbeispiele werden benutzt, um die Anwendung der Verfahren in den beiden Statistik-Paketen ausführlich zu demonstrieren. Daraus ergibt sich erwünschte Redundanz, da die gleichen Ergebnisse sowohl in den einführenden Abhandlungen als auch in den Abschnitten zu R und zu SPSS wiederkehren. Auf diese Weise wird der Bezug der Theorie der Verfahren zu den Ergebnissen der Software deutlich und die Anwendung der Programmpakete erleichtert. Um die Beschreibungen dennoch kurz und verständlich zu halten, befindet sich die Interpretation der Ergebnisse jeweils in der einführenden Abhandlung zum Datenbeispiel und wird nicht noch einmal in den Abschnitten zu R und SPSS erläutert. Gelegentlich ergeben sich minimale Unterschiede in den Auswertungen mit R und mit SPSS, was an Unterschieden der verwendeten Algorithmen oder an Rundungseffekten liegen kann. Inhaltlich stammen die gewählten Beispiele aus Teilgebieten der Psychologie. Sie sind allgemein verständlich und lassen sich problemlos auf andere Disziplinen übertragen.

Auf der Hogrefe-Webseite zum Buch stehen alle verwendeten Datensätze sowie R-Skripte und SPSS-Syntax-Dateien der durchgeführten Beispielrechnungen zur Verfügung. Die Datensätze liegen dabei im SPSS-Format vor und können so auch in R eingelesen und verarbeitet werden.

Danksagung

Im Vorfeld der Arbeit an diesem Buch haben wir eine Vielzahl von methodisch-statistischen Diplom-, Master- und Bachelorarbeiten an der Fakultät Psychologie der TU Dresden betreut. Einige dieser Qualifizierungsarbeiten werden im Buch einbezogen und sind im Literaturverzeichnis erwähnt. Alle Arbeiten haben sich methodisch mit der Darstellung und der Anwendung der im Buch vorgestellten Verfahren beschäftigt. Ein wichtiges Ziel bestand jeweils darin, aus Sicht der Studierenden gut nachvollziehbare Beschreibungen der Verfahren und ihrer Anwendung zu erzeugen. Aus den Arbeiten und in den Diskussionen mit den Studierenden haben wir viele Anregungen für gut verständliche Darstellungen der komplexen Modelle erhalten. Im vorliegenden Buch haben wir auf Beispiele aus den Qualifizierungsarbeiten Bezug genommen und teilweise unveränderte oder modifizierte Daten und entsprechende Auswertungsschritte aus diesen Arbeiten verwendet. Wir danken allen Studierenden für ihr Interesse an den methodischen Themen, für die immer interessanten Diskussionen und dafür, dass sie uns die Nutzung ihrer Daten gestattet haben.

|12|Dr. Wiltrud Kuhlisch hat viele Verbesserungs- und Präzisierungsvorschläge aus mathematisch-statistischer Sicht eingebracht. Kontinuierlich hat uns Peggy Wehner in inhaltlichen und gestalterischen Fragen unterstützt. Dr. Fabian Baum, Dr. Denise Dörfel, René Dutschke, Dr. Jens Helmert, Dr. Philipp Kruse, Dr. Marcus Möschl, Stephan Mende, Stephanie Richter, Sebastian Rudolf, Martin Schoemann und Dr. Ulrike Senftleben haben Kapitel des Buches Korrektur gelesen und uns viele wichtige Hinweise gegeben. Marlon Esmeyer, Judith Herbers, Viviane Lange, Josephine Thoss und Vincent Zipper haben uns als studentische Hilfskräfte unter anderem bei der Erstellung des Literaturverzeichnisses, bei der Literaturrecherche, bei der Gestaltung von Abbildungen oder bei der Suche nach Schreib- und formalen Fehlern sehr geholfen. Frank Leonhardt hat uns jederzeit bei technischen Problemen unterstützt.

Ihnen allen danken wir sehr herzlich.

Wir bedanken uns bei Prof. Stefan Scherbaum für die stetige Unterstützung unseres Vorhabens und bei unseren Familien für ihre Unterstützung und für ihr Verständnis.

Sehr herzlich bedanken wir uns beim Hogrefe Verlag, speziell bei Frau Kathrin Rothauge und Herrn Peter Schmidt, für die sehr angenehme, verständnisvolle und konstruktive Zusammenarbeit.

Dresden, im Winter 2022

Matthias Rudolf und Diana Vogel-Blaschka