Bonus-Lektion: Prüfung der Voraussetzungen und Transformationen
|
|
- Damian Hoch
- vor 7 Jahren
- Abrufe
Transkript
1 Seite 1 von 8 Bonus-Lektion: Prüfung der Voraussetzungen und Transformationen Ziel dieser Lektion: Du weißt, wie Du die einzelnen Voraussetzungen für die Signifikanztests und komplexeren Modelle prüfen kannst und kennst Datentransformationen. Inhalt: B1 Die Normalverteilung B2 Linearität B3 Varianzhomogenität B4 Sphärizität B5 Ausreißer B6 Homoskedastizität der Residuen B7 Unabhängigkeit der Residuen B8 Keine Multikollinearität B9 Log-Linearität B10 Proportionalität der Hazards B11 Transformationen Zusammenfassung Umsetzungsaufgabe Für die Auswahl der passenden Testverfahren ist es wichtig zu wissen, ob die einzelnen Voraussetzungen erfüllt sind. Besonders wichtig ist dabei die Normalverteilungsprüfung. Aber auch andere Voraussetzungen werden in einzelnen Methoden verlangt. Hier erkläre ich Dir, was jeweils mit dieser Voraussetzung gemeint ist und wie Du sie prüfen kannst. Bei manchen nicht erfüllten Voraussetzungen kann eine Transformation Abhilfe schaffen. Deshalb findest Du im letzten Abschnitt dieser Lektion das Kapitel zur Transformation.
2 Seite 2 von 8 B1 Die Normalverteilung Daten sind normalverteilt, wenn Sie einer Glockenkurve folgen. Wenn Normalverteilung geprüft wird geht es darum, die Abweichungen von der Normalverteilung zu untersuchen. Dafür gibt es zwei Begriffe, die bei der Beschreibung dieser Abweichung nützlich sind: Schiefe (Skew) und Excess (Kurtosis). Schiefe (Skew) Die Schiefe gibt dabei an, ob die Verteilung symmetrisch ist oder nicht. Eine positive Schiefe beschreibt dabei rechtsschiefe Daten (links steil, rechts schief), vergleiche rote Kurve in Abb. 1. Hier gibt es viele kleine Werte in den Daten. Eine negative Schiefe beschreibt linksschiefe Daten (links schief, rechts steil), vergleiche Abb. 2. Hier kommen viele große Werte vor und weniger kleine Werte. Abb. 1: Linkssteile, rechtsschiefe Verteilung mit positiver Schiefe Abb. 2: Rechtssteile, linksschiefe Verteilung mit negativer Schiefe Excess (Kurtosis) Der Exzess gibt dagegen die Wölbung an und beschreibt, ob die Verteilung im Gegensatz zur Normalverteilung spitz oder abgeflacht ist. Eine spitze Verteilung hat einen positiven Exzess. Hier liegen dann mehr Beobachtungen als gewöhnlich in den Enden der Verteilung, weshalb diese auch heavy-tailed genannt wird, vergleiche Abb. 3. Ein negativer Exzess beschreibt eine abgeflachte Verteilung. Eine solche Verteilung hat im Vergleich zur Normalverteilung dünne Enden (thin-tailed), vergleiche Abb. 4.
3 Seite 3 von 8 Abb. 3: Spitze Verteilung mit dicken Enden und positivem Exzess Abb. 4: Flache Verteilung mit flachen Enden und negativem Exzess Tests auf Normalverteilung Für die Prüfung, ob eine metrische Variable normalverteilt ist, können so genannte Normalverteilungstests verwendet werden. Zwei bekannte Normalverteilungstests sind der Shapiro-Wilk-Test und der Kolmogorov- Smirnoff-Test. Diese Tests prüfen, ob die Variable einer Normalverteilung folgt. Die Nullhypothese, die hier geprüft wird ist Es liegt Normalverteilung vor. Als Ergebnis liefert der Test einen p-wert. Ist der kleiner als 0,05, so sagt man, das Testergebnis ist signifikant. Das bedeutet, dass die Nullhypothese abgelehnt wird. Hier heißt das also, dass der Test sagt, dass keine Normalverteilung vorliegt. Wenn der p-wert größer als 0,05 ist bedeutet das, dass die Nullhypothese nicht abgelehnt wird. In dem Fall sagt der Test uns also, dass Normalverteilung vorliegt. Die Interpretation der Normalverteilungstests nochmals zusammengefasst: p < 0,05 keine Normalverteilung p 0,05 Normalverteilung Das Problem der Normalverteilungstests ist, dass sie bei größeren Fallzahlen zu streng sind (=die Normalverteilung zu oft ablehnen) und bei kleineren Fallzahlen zu liberal (=die Normalverteilung zu oft bestätigen). Deshalb empfehle ich immer auch die im Folgenden beschriebene Methode der Normalverteilungsdiagramme anzuwenden. Normalverteilungsdiagramme Neben der oben beschriebenen Verwendung von Tests kann die Verteilung auch mittels Normalverteilungsdiagrammen (Q-Q-Diagramme, Quantil-Plots) überprüft werden. Dabei wird für die zu untersuchende Variable eine Grafik
4 erstellt, die eine Diagonale Gerade enthält und in der die Quantile der Normalverteilung gegen die Quantile der untersuchten Variable als Punkte angetragen sind. Es ergibt sich eine Grafik, in der die Punkte mehr oder weniger gut der diagonalen Geraden folgen, vergleiche Abb. 5. Seite 4 von 8 Abb. 5: Q-Q-Diagramm. Die Punkte folgen gut der Geraden. Die Daten sind demnach annähernd normalverteilt. Liegen die Punkte gut entlang der Geraden, so sind die Daten annähernd normalverteilt. Liegen sie deutlich entfernt oder machen sie einen großen Bogen, dann sind die Daten nicht normalverteilt. B2 Linearität Linearität wird in der Pearson-Korrelation und in der linearen Regression als Voraussetzung genannt. Damit ist gemeint, dass die beiden metrischen Variablen nicht nicht-linear zusammen hängen, dass man also keine Kurve im Zusammenhang der beiden erkennt. Das prüfst Du, indem Du Dir das Streudiagramm der beiden Variablen ansiehst. Wenn man am ehesten eine Gerade und keine Kurve als Trend hineinlegen würde, dann ist die Voraussetzung der Linearität erfüllt. In der linearen Regression machst Du dieses Streudiagramm für jeden
5 Seite 5 von 8 metrischen Prädiktor. Zusätzlich kannst Du hier auch das Streudiagramm der standardisierten Residuen gegen die vorhergesagten Werte betrachten. Wenn die Punktwolke hier wild streut und kein Trend zu sehen ist, ist die Voraussetzung der Linearität erfüllt. Definition Residuen: Residuen sind die Abweichungen vom Modell, auch als 'Fehler' bezeichnet. B3 Varianzhomogenität Varianzhomogenität ist eine Voraussetzung im t-test und in der ANOVA. Varianzhomogenität bedeutet, dass sich die Streuungen in den Gruppen (Varianzen) nicht extrem unterscheiden. Das kannst Du z.b. mit dem Levene- Test prüfen. Er prüft die Nullhypothese Die Varianzen unterscheiden sich nicht. Ist der p-wert des Levene-Tests kleiner als 0,05, liegt keine Varianzhomogenität vor. Ist der p-wert größer oder gleich 0,05, so liegt Varianzhomogenität vor. B4 Sphärizität Sphärizität ist eine Voraussetzung der Messwiederholungs-ANOVA und bedeutet, dass die Differenzen der einzelnen Messwiederholungen gleiche Varianzan haben. Prüfen kannst Du das mit dem Mauchly-Test. Ist der p-wert des Mauchly-Tests signifikant (p<0,05), so liegt keine Sphärizität vor. Ist der p- Wert größer oder gleich 0,05, so liegt Sphärizität vor. B5 Ausreißer Ausreißer sind in vielen vor allem den komplexeren statitischen Modellen ein Problem. Deshalb sollten die Daten auf Ausreißer geprüft werden. Dies kann auf unterschiedliche Weise geschehen: Grafische Untersuchung der einzelnen metrischen Variablen mit Boxplots Grafische Untersuchung der Kombination von jeweils zwei metrischen Variablen mit Streudiagrammen. Betrachten der standardisierten Residuen in komplexeren Modellen (Werte größer 3 oder kleiner -3 gelten als Ausreißer) B6 Homoskedastizität der Residuen In der linearen Regression ist die Homoskedastizität der Residuen eine Voraussetzung. Sie liegt vor, wenn die Residuen für alle Werte der AV gleich streuen. Das lässt sich am besten mit dem Streudiagramm der standardisierten Residuen gegen die vorhergesagten Werte untersuchen. Wenn die Punktwolke hier wild streut und keine Trichterform zu sehen ist, ist die Voraussetzung der Homoskedastizität der Residuen erfüllt.
6 B7 Unabhängigkeit der Residuen Seite 6 von 8 Unabhängigkeit der Residuen ist für viele komplexere Modelle eine Voraussetzung. Meist ist sie allein schon durch das Studiendesign gegeben indem keine Mehrfachmessungen in den Modellen verwendet werden. Überprüft werden kann sie in der linearen Regression beispielsweise mit dem Durbin-Watson-Test. Liegt der Wert hier nahe an 2 (mindestens zwischen 1 und 3), so gibt es kein Problem mit abhängigen Residuen. B8 Keine Multikollinearität Multikollinearität liegt dann vor, wenn unabhängige Variablen in einem Modell zu stark zusammen hängen. Für die mehrfaktoriellen Modelle ist es Voraussetzung, dass für die metrischen UVs keine Multikollinearität vorlieg. Dies kann mit folgenden Bedingungen geprüft werden: die Korrelationskoeffizienten für alle metrischen UVs sind kleiner als 0,8, der Varianz-Inflations-Faktor (VIF) ist kleiner als 5 (mindestens kleiner als 10), der größte Konditionsindex ist kleiner als 30. Wenn diese Bedingungen erfüllt sind, gibt es keine Probleme mit Multikollinearität. B9 Log-Linearität Für die logistische Regression gilt die Log-Linearität der metrischen Prädiktoren mit der AV als Voraussetzung. Das bedeutet, dass die metrischen Prädiktoren einen linearen Zusammenhang zur Logit-Funktion der AV aufweisen. Geprüft wird das durch Rechnen zusätzlicher logistischer Regressionsmodelle für jeden metrischen Prädiktor mit folgendem Aufbau: AV: dichotome AV aus dem eigentlich interessierenden Modell Prädiktoren: auf Log-Linearität zu untersuchender metrischer Prädiktor, Logtransformation dieses metrischen Prädiktors und Interaktion zwischen metrischem Prädiktor und seiner Logtransformation. Wenn die Interaktion im Modell nicht signifikant wird (p 0,05), so ist die Log- Linearität gegeben. B10 Proportionalität der Hazards Die Proportionalität der Hazards wird in der Cox-Regression verlangt. Für einen Gruppenfaktor kann dies grafisch überprüft werden, indem die
7 Seite 7 von 8 Überlebenskurven (Kaplan-Meier-Kurven) gruppiert betrachtet werden. Zeigen sie einen ähnlich geformten Verlauf, so liegt Proportionalität der Hazards vor. B11 Transformation Eine Transformation der metrischen Variablen kann bei einigen dieser Voraussetzungen helfen, sie zu erfüllen. Es gibt keine grundsätzliche Regel, welche Transformation wann passt. Du musst hier nach dem Prinzip von Trial-and-Error vorgehen. Du probierst also einfach eine Transformation nach der anderen aus. Das heißt, 1. Du transformierst Deine Variable mit der ausgewählten Formel. Dazu erstellst Du eine neue Variable im Datensatz, berechnet aus der alten Variable mit der ausgewählten Formel. 2. Dann prüfst Du die Voraussetzung, z.b. Normalverteilung oder Linearirät. 3. Wenn das Ergebnis passt, die neue Variable also die Voraussetzungen erfüllt, rechnest Du die folgende Analysen (insbesondere die Signifikanztests) mit dieser neuen Variablen weiter. 4. Wenn nicht, suchst Du Dir eine neue Formel aus und probierst diese aus, beginnst also wieder oben bei 1. Damit Du bei der Auswahl der Transformation nicht völlig im Nebel stocherst, gebe ich Dir in der folgenden Tabelle die gängigsten Transformationen mit den Einsatzgebieten als Übersicht. Damit kannst Du leichter auswählen, mit welcher Art von Transformation Du das Ausprobieren startest. Transformation Formel Verwendung mit dem Logarithums (Logtransformation) mit der Wurzelfunktion log(x) wurzel(x) Positive Schiefe, positive Kurtosis, ungleiche Varianzen, Nicht-Linearität Positive Schiefe, positive Kurtosis, ungleiche Varianzen, Nicht-Linearität mit dem Kehrwert 1/x Positive Schiefe, positive Kurtosis, ungleiche Varianzen Reverse-Score (jeden Wert vom größten Wert abziehen) maximum - x diese Transformation wird mit obigen kombiniert, um z.b. negative Schiefe zu bereinigen, Beispiel: log(maximum - x) Diese Transformation wird vorgeschalten, wenn die Variable negative Werte oder Nuller enthält, damit Addieren einer Konstanten x + a anschließend eine der obigen Transformationen angewandt werden kann. Beispiel: 1/(x + a) Tabelle: Transformatonen und ihre Verwende. In Klammern sind für die Verwendung jeweils die Einsatzgebiete angegeben, die für die Normalverteilung nicht relevant sind aber unter Umständen später relevant werden können.
8 Seite 8 von 8 Zusammenfassung Normalverteilung wird geprüft mit Normalverteilungstests oder Normalverteilungsdiagrammen Linearität wird geprüft mittels Streudiagramm Varianzhomogenität wird geprüft mittels Levene-Test Sphärizität wird geprüft mittels Mauchly-Test Ausreißer werden kontrolliert mittels Boxplots, Streudiagrammen oder Betrachten der standardisierten Residuen Homoskedastizität wird geprüft mittels Streudiagramm der Residuen gegen die vorhergesaten Werte Unabhängigkeit der Residuen wird geprüft mittels Durbin-Watson-Test Multikollinearität wird ausgeschlossen über Korrelationskoeffizienten, Varianz-Inflations-Faktor und Konditionsindex Log-Linearität wird geprüft mittels Interaktionsterm des Prädiktors mit seiner Logtransformation Proportionalität der Hazards wird geprüft über ähnlichen Kurvenverlauf der Kaplan-Meier-Kurven Transformationen metrischer Variablen können helfen, die Voraussetzungen zu erfüllen Umsetzungsaufgabe für Dich: Notieren im Arbeitsblatt Fragestellung und Hypothesen zu den jeweiligen Analysemethoden die Methoden, die Du zur Voraussetzungsprüfung benötigst.
3. Lektion: Deskriptive Statistik
Seite 1 von 5 3. Lektion: Deskriptive Statistik Ziel dieser Lektion: Du kennst die verschiedenen Methoden der deskriptiven Statistik und weißt, welche davon für Deine Daten passen. Inhalt: 3.1 Deskriptive
Mehr5. Lektion: Einfache Signifikanztests
Seite 1 von 7 5. Lektion: Einfache Signifikanztests Ziel dieser Lektion: Du ordnest Deinen Fragestellungen und Hypothesen die passenden einfachen Signifikanztests zu. Inhalt: 5.1 Zwei kategoriale Variablen
Mehr» S C H R I T T - F Ü R - S C H R I T T - A N L E I T U N G «M U L T I P L E L I N E A R E R E G R E S S I O N M I T S P S S / I B M Daniela Keller
» SCHRITT-FÜR-SCHRITTANLEITUNG«MULTIPLE LINEARE REGRESSION MIT SPSS/IBM Daniela Keller Daniela Keller - MULTIPLE LINEARE REGRESSION MIT SPSS/IBM Impressum 2016 Statistik und Beratung Dipl.-Math. Daniela
MehrHypothesentests mit SPSS
Beispiel für eine einfache Regressionsanalyse (mit Überprüfung der Voraussetzungen) Daten: bedrohfb_v07.sav Hypothese: Die Skalenwerte auf der ATB-Skala (Skala zur Erfassung der Angst vor terroristischen
MehrEinführung in die Statistik für Politikwissenschaftler Sommersemester 2011
Einführung in die Statistik für Politikwissenschaftler Sommersemester 2011 Es können von den Antworten alle, mehrere oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort (ohne Auslassungen
MehrDiagnostik von Regressionsmodellen (1)
Diagnostik von Regressionsmodellen (1) Bei Regressionsanalysen sollte immer geprüft werden, ob das Modell angemessen ist und ob die Voraussetzungen eines Regressionsmodells erfüllt sind. Das Modell einer
MehrVorlesung: Multivariate Statistik für Psychologen
Vorlesung: Multivariate Statistik für Psychologen 7. Vorlesung: 05.05.2003 Agenda 2. Multiple Regression i. Grundlagen ii. iii. iv. Statistisches Modell Verallgemeinerung des Stichprobenmodells auf Populationsebene
MehrInhaltsverzeichnis. Über die Autoren Einleitung... 21
Inhaltsverzeichnis Über die Autoren.... 7 Einleitung... 21 Über dieses Buch... 21 Was Sie nicht lesen müssen... 22 Törichte Annahmen über den Leser... 22 Wie dieses Buch aufgebaut ist... 23 Symbole, die
MehrStatistik. Jan Müller
Statistik Jan Müller Skalenniveau Nominalskala: Diese Skala basiert auf einem Satz von qualitativen Attributen. Es existiert kein Kriterium, nach dem die Punkte einer nominal skalierten Variablen anzuordnen
MehrInhaltsverzeichnis. 1 Über dieses Buch Zum Inhalt dieses Buches Danksagung Zur Relevanz der Statistik...
Inhaltsverzeichnis 1 Über dieses Buch... 11 1.1 Zum Inhalt dieses Buches... 13 1.2 Danksagung... 15 2 Zur Relevanz der Statistik... 17 2.1 Beispiel 1: Die Wahrscheinlichkeit, krank zu sein, bei einer positiven
MehrFH- Management & IT. Constantin von Craushaar FH-Management & IT Statistik Angewandte Statistik (Übungen)
FH- Management & IT Folie 1 Rückblick Häufigkeiten berechnen Mittelwerte berechnen Grafiken ausgeben Grafiken anpassen und als Vorlage abspeichern Variablenoperationen Fälle vergleichen Fälle auswählen
MehrFerienkurse Mathematik Sommersemester 2009
Ferienkurse Mathematik Sommersemester 2009 Statistik: Grundlagen 1.Aufgabenblatt mit praktischen R-Aufgaben Aufgabe 1 Lesen Sie den Datensatz kid.weights aus dem Paket UsingR ein und lassen sie die Hilfeseite
Mehr1. Einfache lineare Regression: Eine metrische AV, eine metrische oder dichotome UV
Regressionsanalyse 1. Einfache lineare Regression: Eine metrische AV, eine metrische oder dichotome UV 2. Multiple Regression: Eine metrische AV, mehrere metrische oder dichotome UVs 3. Ausblick: Logistische
MehrOnline Statistik-Coaching
Online Statistik-Coaching Modul 3 Statistisches Testen - Auswahl der passenden Methode - Durchführung mit SPSS - Interpretation und Darstellung Dipl.-Math. Daniela Keller www.statistik-und-beratung.de
MehrTeil: lineare Regression
Teil: lineare Regression 1 Einführung 2 Prüfung der Regressionsfunktion 3 Die Modellannahmen zur Durchführung einer linearen Regression 4 Dummyvariablen 1 Einführung o Eine statistische Methode um Zusammenhänge
MehrDie Funktion f wird als Regressionsfunktion bezeichnet.
Regressionsanalyse Mit Hilfe der Techniken der klassischen Regressionsanalyse kann die Abhängigkeit metrischer (intervallskalierter) Zielgrößen von metrischen (intervallskalierten) Einflussgrößen untersucht
MehrDeskription, Statistische Testverfahren und Regression. Seminar: Planung und Auswertung klinischer und experimenteller Studien
Deskription, Statistische Testverfahren und Regression Seminar: Planung und Auswertung klinischer und experimenteller Studien Deskriptive Statistik Deskriptive Statistik: beschreibende Statistik, empirische
MehrTesten von Unterschiedshypothesen mit parametrischen Verfahren Der t-test
Schäfer A & Schöttker-Königer T, Statistik und quantitative Methoden für (2015) Arbeitsblatt 1 SPSS Kapitel 5 Seite 1 Testen von Unterschiedshypothesen mit parametrischen Verfahren Der t-test Im Folgenden
MehrLösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1. LÖSUNG 9A a.
LÖSUNG 9A a. Lösungen zu Janssen/Laatz, Statistische Datenanalyse mit SPSS 1 Das Regressionsmodell soll nur für Büropersonal angewendet werden Management- und Bewachungspersonal (MIND =0) soll nicht einbezogen
MehrWas dieses E-Book enthält
Was dieses E-Book enthält Dieses E-Book möchte Dir die Grundlagen der statistischen Datenanalyse vermitteln. Es werden die Grundbegriffe geklärt und Du wirst Schritt für Schritt angeleitet, die passende
MehrMathematische und statistische Methoden II
Methodenlehre e e Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-206) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden II Dr. Malte Persike
MehrStatistik II: Signifikanztests /2
Medien Institut : Signifikanztests /2 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Korrelation 2. Exkurs: Kausalität 3. Regressionsanalyse 4. Key Facts 2 I
MehrGlossar Statistik 2. Bivariate Verfahren: zwei nummerische Merkmale
Glossar Statistik 2 Bivariate Verfahren: zwei nummerische Merkmale Streudiagramm - Datenpaare (X, Y) als Punkte auf einem zweidimensionale Diagramm (Ordinate: Y, Abszisse: X) Lineare Regression - Optimierungsproblem
Mehr7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17
7. Lösungen weitere Übungsaufgaben Statistik für Ingenieure WiSe 16/17 1. Aufgabe: a) Grundgesamtheit sind alle Reifen aus der Produktion von Langstone aus dem Monat März der entsprechenden Reifentypen.
MehrSommersemester Marktforschung
Dipl.-Kfm. Sascha Steinmann Universität Siegen Lehrstuhl für Marketing steinmann@marketing.uni-siegen.de Sommersemester 2010 Marktforschung Übungsaufgaben zu den Themen 3-6 mit Lösungsskizzen Aufgabe 1:
MehrStatistik II. IV. Hypothesentests. Martin Huber
Statistik II IV. Hypothesentests Martin Huber 1 / 22 Übersicht Weitere Hypothesentests in der Statistik 1-Stichproben-Mittelwert-Tests 1-Stichproben-Varianz-Tests 2-Stichproben-Tests Kolmogorov-Smirnov-Test
MehrEinführung in die Statistik für Politikwissenschaftler Wintersemester 2011/2012
Einführung in die Statistik für Politikwissenschaftler Wintersemester 2011/2012 Es können von den Antwortmöglichkeiten alle, mehrere, eine oder keine Antwort(en) richtig sein. Nur bei einer korrekten Antwort
MehrStatistik-Klausur A WS 2009/10
Statistik-Klausur A WS 2009/10 Name: Vorname: Immatrikulationsnummer: Studiengang: Hiermit erkläre ich meine Prüfungsfähigkeit vor Beginn der Prüfung. Unterschrift: Dauer der Klausur: Erlaubte Hilfsmittel:
MehrStatistik II Übung 4: Skalierung und asymptotische Eigenschaften
Statistik II Übung 4: Skalierung und asymptotische Eigenschaften Diese Übung beschäftigt sich mit der Skalierung von Variablen in Regressionsanalysen und mit asymptotischen Eigenschaften von OLS. Verwenden
MehrRegressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/
Regressionsmodelle mit Anwendungen in der Versicherungs- und Finanzwirtschaft Probeklausur Wintersemester 2017/2018 06.12.2018 BITTE LESERLICH IN DRUCKBUCHSTABEN AUSFÜLLEN Nachname:...................................................................
MehrInhaltsverzeichnis. Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden
Inhaltsverzeichnis Teil 1 Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist Spaß 3 Warum Statistik? 3 Checkpoints 4 Daten 4 Checkpoints 7 Skalen - lebenslang wichtig bei der Datenanalyse
MehrStatistische Methoden in den Umweltwissenschaften
Statistische Methoden in den Umweltwissenschaften Korrelationsanalysen Kreuztabellen und χ²-test Themen Korrelation oder Lineare Regression? Korrelationsanalysen - Pearson, Spearman-Rang, Kendall s Tau
MehrInformationen zur KLAUSUR am
Wiederholung und Fragen 1 Informationen zur KLAUSUR am 24.07.2009 Raum: 032, Zeit : 8:00 9:30 Uhr Bitte Lichtbildausweis mitbringen! (wird vor der Klausur kontrolliert) Erlaubte Hilfsmittel: Alle Unterlagen,
MehrFranz Kronthaler. Statistik angewandt. Datenanalyse ist (k)eine Kunst. mit dem R Commander. A Springer Spektrum
Franz Kronthaler Statistik angewandt Datenanalyse ist (k)eine Kunst mit dem R Commander A Springer Spektrum Inhaltsverzeichnis Teil I Basiswissen und Werkzeuge, um Statistik anzuwenden 1 Statistik ist
MehrVergleich von Parametern zweier Stichproben
Vergleich von Parametern zweier Stichproben Vergleich von Mittelwerten bei gebundenen Stichproben Vergleich von Mittelwerten bei unabhängigen Stichproben Vergleich von Varianzen bei unabhängigen Stichproben
MehrMultiple Regression III
Multiple Regression III Werner Brannath VO Biostatistik im WS 2006/2007 Inhalt Überprüfung der Modellannahmen Residuen-Plot Normal-Q-Q-Plot Cook s Distanz-Plot Maßnahmen bei Abweichungen von Modellannahmen
MehrInstitut für Soziologie Christian Ganser. Methoden 2. Regressionsanalyse II: Lineare multiple Regression
Institut für Soziologie Christian Ganser Methoden 2 Regressionsanalyse II: Lineare multiple Regression Inhalt 1. Anwendungsbereich 2. Vorgehensweise bei multipler linearer Regression 3. Beispiel 4. Modellannahmen
MehrSchweizer Statistiktage, Aarau, 18. Nov. 2004
Schweizer Statistiktage, Aarau, 18. Nov. 2004 Qualitative Überprüfung der Modellannahmen in der linearen Regressionsrechnung am Beispiel der Untersuchung der Alterssterblichkeit bei Hitzeperioden in der
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrStatistische Messdatenauswertung
Roland Looser Statistische Messdatenauswertung Praktische Einführung in die Auswertung von Messdaten mit Excel und spezifischer Statistik-Software für naturwissenschaftlich und technisch orientierte Anwender
MehrAnnahmen des linearen Modells
Annahmen des linearen Modells Annahmen des linearen Modells zusammengefasst A1: Linearer Zusammenhang: y = 0 + 1x 1 + 2x 2 + + kx k A2: Zufallsstichprobe, keine Korrelation zwischen Beobachtungen A3: Erwartungswert
MehrStatistik II Übung 3: Hypothesentests
Statistik II Übung 3: Hypothesentests Diese Übung beschäftigt sich mit der Anwendung diverser Hypothesentests (zum Beispiel zum Vergleich der Mittelwerte und Verteilungen zweier Stichproben). Verwenden
MehrInstrument zur Untersuchung eines linearen Zusammenhangs zwischen zwei (oder mehr) Merkmalen.
Gliederung Grundidee Einfaches lineares Modell KQ-Methode (Suche nach der besten Geraden) Einfluss von Ausreißern Güte des Modells (Bestimmtheitsmaß R²) Multiple Regression Noch Fragen? Lineare Regression
MehrStatistik II (Sozialwissenschaften)
Dr. Hans-Otfried Müller Institut für Mathematische Stochastik Fachrichtung Mathematik Technische Universität Dresden http://www.math.tu-dresden.de/sto/mueller/ Statistik II (Sozialwissenschaften) 2. Konsultationsübung,
MehrVorlesung: Multivariate Statistik für Psychologen
Vorlesung: Multivariate Statistik für Psychologen 2. Vorlesung: 10.04.2003 Agenda 1. Organisatorisches 2. Datenbehandlung i. Unverfälschte Daten ii. Unverfälschte Korrelationen iii. Missing Data iv. Ausreißer
MehrEs können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden.
Teil III: Statistik Alle Fragen sind zu beantworten. Es können keine oder mehrere Antworten richtig sein. Eine Frage ist NUR dann richtig beantwortet, wenn ALLE richtigen Antworten angekreuzt wurden. Wird
MehrHerzlich willkommen zur Vorlesung Statistik. Streuungsmaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung
FB 1 W. Ludwig-Mayerhofer Statistik 1 Herzlich willkommen zur Vorlesung Statistik smaße oder die Unterschiedlichkeit der Daten nebst kurzen Ausführungen zu Schiefe und Wölbung FB 1 W. Ludwig-Mayerhofer
MehrStatistik und Wahrscheinlichkeitsrechnung
Statistik und Wahrscheinlichkeitsrechnung 3. Vorlesung Dr. Jochen Köhler 1 Inhalte der heutigen Vorlesung Ziel: Daten Modellbildung Probabilistisches Modell Wahrscheinlichkeit von Ereignissen Im ersten
MehrZiel der linearen Regression
Regression 1 Ziel der linearen Regression Bei der linearen Regression wird untersucht, in welcher Weise eine abhängige metrische Variable durch eine oder mehrere unabhängige metrische Variablen durch eine
MehrDas harmonische Mittel
Das harmonische Mittel x H := 1 1 n n 1 x i Das harmonische Mittel entspricht dem Mittel durch Transformation t 1 t Beispiel: x 1,..., x n Geschwindigkeiten, mit denen konstante Wegstrecken l zurückgelegt
MehrSchätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO
Schätzen und Testen von Populationsparametern im linearen Regressionsmodell PE ΣO 4. Dezember 2001 Generalisierung der aus Stichprobendaten berechneten Regressionsgeraden Voraussetzungen für die Generalisierung
MehrEinführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten Von Prof. Dr. Rainer Schlittgen 4., überarbeitete und erweiterte Auflage Fachbereich Materialwissenschaft! der Techn. Hochschule Darmstadt
Mehr4.1. Verteilungsannahmen des Fehlers. 4. Statistik im multiplen Regressionsmodell Verteilungsannahmen des Fehlers
4. Statistik im multiplen Regressionsmodell In diesem Kapitel wird im Abschnitt 4.1 zusätzlich zu den schon bekannten Standardannahmen noch die Annahme von normalverteilten Residuen hinzugefügt. Auf Basis
MehrModul G.1 WS 07/08: Statistik
Modul G.1 WS 07/08: Statistik 10.01.2008 1 2 Test Anwendungen Der 2 Test ist eine Klasse von Verfahren für Nominaldaten, wobei die Verteilung der beobachteten Häufigkeiten auf zwei mehrfach gestufte Variablen
Mehra) Man bestimme ein 95%-Konfidenzintervall für den Anteil der Wahlberechtigten, die gegen die Einführung dieses generellen
2) Bei einer Stichprobe unter n=800 Wahlberechtigten gaben 440 an, dass Sie gegen die Einführung eines generellen Tempolimits von 100km/h auf Österreichs Autobahnen sind. a) Man bestimme ein 95%-Konfidenzintervall
MehrForschungsstatistik I
Prof. Dr. G. Meinhardt 6. Stock, Taubertsberg R. 06-06 (Persike) R. 06-31 (Meinhardt) Sprechstunde jederzeit nach Vereinbarung Forschungsstatistik I Dr. Malte Persike persike@uni-mainz.de http://psymet03.sowi.uni-mainz.de/
MehrStatistik II: Signifikanztests /1
Medien Institut : Signifikanztests /1 Dr. Andreas Vlašić Medien Institut (0621) 52 67 44 vlasic@medien-institut.de Gliederung 1. Noch einmal: Grundlagen des Signifikanztests 2. Der chi 2 -Test 3. Der t-test
MehrMathematische und statistische Methoden I
Prof. Dr. G. Meinhardt Statistik & Mathematische und statistische Methoden I Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung Wallstr. 3, 6. Stock, Raum 06-206 Dr. Malte Persike persike@uni-mainz.de
MehrStatistische Datenanalyse mit R, Statistische Tests. Dr. Andrea Denecke Leibniz Universität IT-Services
Statistische Datenanalyse mit R, Statistische Tests Dr. Andrea Denecke Leibniz Universität IT-Services Testdatensätze In R kann man auf viele Testdatensätze zurückgreifen: Die Eingabe von try(data(package
MehrTEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN
TEIL 12: BIVARIATE ANALYSE FÜR METRISCH SKALIERTE VARIABLEN GLIEDERUNG Bivariate Analyse für metrisch skalierte Variablen Grundlagen Streudiagramme und Visualisierungen von Zusammenhängen Positive lineare
MehrKategoriale und metrische Daten
Kategoriale und metrische Daten Johannes Hain Lehrstuhl für Mathematik VIII Statistik 1/14 Übersicht Abhängig von der Anzahl der Ausprägung der kategorialen Variablen unterscheidet man die folgenden Szenarien:
Mehrsimple lineare Regression kurvilineare Regression Bestimmtheitsmaß und Konfidenzintervall
Regression Korrelation simple lineare Regression kurvilineare Regression Bestimmtheitsmaß und Konfidenzintervall Zusammenhänge zw. Variablen Betrachtet man mehr als eine Variable, so besteht immer auch
MehrSozialwissenschaftliche Fakultät der Universität Göttingen. Sommersemester 2009, Statistik mit SPSS
Sommersemester 2009, Statistik mit SPSS 26. August 2009 26. August 2009 Statistik Dozentin: mit Anja SPSS Mays 1 Bivariate Datenanalyse, Überblick bis Freitag heute heute Donnerstag Donnerstag Freitag
MehrHypothesentests mit SPSS. Beispiel für einen t-test
Beispiel für einen t-test Daten: museum-f-v04.sav Hypothese: Als Gründe, in ein Museum zu gehen, geben mehr Frauen als Männer die Erweiterung der Bildung für Kinder an. Dies hängt mit der Geschlechtsrolle
MehrStatistische Datenanalyse mit R, Korrelation und Regression. Dr. Andrea Denecke Leibniz Universität IT-Services
Statistische Datenanalyse mit R, Korrelation und Regression Dr. Andrea Denecke Leibniz Universität IT-Services Korrelationsanalyse Eine Korrelationsanalyse soll herausfinden Ob ein linearer Zusammenhang
MehrMusterlösung. Modulklausur Multivariate Verfahren
Musterlösung Modulklausur 31821 Multivariate Verfahren 25. September 2015 Aufgabe 1 (15 Punkte) Kennzeichnen Sie die folgenden Aussagen zur Regressionsanalyse mit R für richtig oder F für falsch. F Wenn
MehrEigene MC-Fragen SPSS. 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist
Eigene MC-Fragen SPSS 1. Zutreffend auf die Datenerfassung und Datenaufbereitung in SPSS ist [a] In der Variablenansicht werden für die betrachteten Merkmale SPSS Variablen definiert. [b] Das Daten-Editor-Fenster
MehrUE Angewandte Statistik Termin 4 Gruppenvergleichstests
UE Angewandte Statistik Termin 4 Gruppenvergleichstests Martina Koller Institut für Pflegewissenschaft SoSe 2015 INHALT 1 Allgemeiner Überblick... 1 2 Normalverteilung... 2 2.1 Explorative Datenanalyse...
MehrSeminar zur Energiewirtschaft:
Seminar zur Energiewirtschaft: Ermittlung der Zahlungsbereitschaft für erneuerbare Energien bzw. bessere Umwelt Vladimir Udalov 1 Modelle mit diskreten abhängigen Variablen 2 - Ausgangssituation Eine Dummy-Variable
MehrKenngrößen von Zufallsvariablen
Kenngrößen von Zufallsvariablen Die Wahrscheinlichkeitsverteilung kann durch die sogenannten Kenngrößen beschrieben werden, sie charakterisieren sozusagen die Verteilung. Der Erwartungswert Der Erwartungswert
MehrStatistik II Übung 2: Multivariate lineare Regression
Statistik II Übung 2: Multivariate lineare Regression Diese Übung beschäftigt sich mit dem Zusammenhang zwischen Flugpreisen und der Flugdistanz, dem Passagieraufkommen und der Marktkonzentration. Verwenden
MehrUnivariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66
Univariate Häufigkeitsverteilungen Kühnel, Krebs 2001: Statistik für die Sozialwissenschaften, S.41-66 Gabriele Doblhammer: Empirische Sozialforschung Teil II, SS 2004 1/19 Skalenniveaus Skalenniveau Relation
MehrEmpirische Analysen mit dem SOEP
Empirische Analysen mit dem SOEP Methodisches Lineare Regressionsanalyse & Logit/Probit Modelle Kurs im Wintersemester 2007/08 Dipl.-Volksw. Paul Böhm Dipl.-Volksw. Dominik Hanglberger Dipl.-Volksw. Rafael
MehrErmitteln Sie auf 2 Dezimalstellen genau die folgenden Kenngrößen der bivariaten Verteilung der Merkmale Weite und Zeit:
1. Welche der folgenden Kenngrößen, Statistiken bzw. Grafiken sind zur Beschreibung der Werteverteilung des Merkmals Konfessionszugehörigkeit sinnvoll einsetzbar? A. Der Modalwert. B. Der Median. C. Das
MehrTrim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, :34 P.M. Page 11. Über die Übersetzerin 9. Einleitung 19
Trim Size: 176mm x 240mm Lipow ftoc.tex V1 - March 9, 2016 6:34 P.M. Page 11 Inhaltsverzeichnis Über die Übersetzerin 9 Einleitung 19 Was Sie hier finden werden 19 Wie dieses Arbeitsbuch aufgebaut ist
MehrMerkmalstypen Univ.-Prof. Dr. rer. nat. et med. habil. Andreas Faldum
1 Merkmalstypen Quantitativ: Geordnete Werte, Vielfache einer Einheit Stetig: Prinzipiell sind alle Zwischenwerte beobachtbar Beispiele: Gewicht, Größe, Blutdruck Diskret: Nicht alle Zwischenwerte sind
Mehr9 Faktorenanalyse. Wir gehen zunächst von dem folgenden Modell aus (Modell der Hauptkomponentenanalyse): Z = F L T
9 Faktorenanalyse Ziel der Faktorenanalyse ist es, die Anzahl der Variablen auf wenige voneinander unabhängige Faktoren zu reduzieren und dabei möglichst viel an Information zu erhalten. Hier wird davon
MehrEinführung in die Statistik
Einführung in die Statistik Analyse und Modellierung von Daten von Prof. Dr. Rainer Schlittgen Universität Hamburg 12., korrigierte Auflage Oldenbourg Verlag München Inhaltsverzeichnis 1 Statistische Daten
MehrINFERENZSTATISTISCHE AUSSAGEN FÜR LAGEMAßE UND STREUUNGSMAßE. Inferenzstatistik für Lagemaße Inferenzstatistik für Streuungsmaße
DAS THEMA: INFERENZSTATISTIK III INFERENZSTATISTISCHE AUSSAGEN FÜR LAGEMAßE UND STREUUNGSMAßE Inferenzstatistik für Lagemaße Inferenzstatistik für Streuungsmaße Inferenzstatistik für Lagemaße Standardfehler
MehrLösung 1. die 1 angeben. Alternativ kann man auch. Variable berechnen wählen und dann die Summe von Q2_6 und Q2_7 wählen.
SPSS Kurs Lösungen Lösung 1 2) Erstellen Sie eine neue Variable Ausland, diese soll die Summe der im Ausland bereisten Städte (Paris, Madrid) wider spiegeln. z.b. über Transformieren Werte in Fällen zählen
MehrStatistische Tests (Signifikanztests)
Statistische Tests (Signifikanztests) [testing statistical hypothesis] Prüfen und Bewerten von Hypothesen (Annahmen, Vermutungen) über die Verteilungen von Merkmalen in einer Grundgesamtheit (Population)
MehrStatistik Prüfung 24. Jänner 2008
Statistik Prüfung 24. Jänner 2008 February 10, 2008 Es ist immer nur EINE Antwort richtig, bei falsch beantworteten Fragen gibt es KEINEN Punktabzug. Werden mehrere Antworten bei einer Frage angekreuzt,
Mehr6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale
6 Korrelations- und Regressionsanalyse: Zusammenhangsanalyse stetiger Merkmale 397 6.1 Korrelationsanalyse Jetzt betrachten wir bivariate Merkmale (X, Y ), wobei sowohl X als auch Y stetig bzw. quasi-stetig
MehrWeitere Lagemaße: Quantile/Perzentile I
3 Auswertung von eindimensionalen Daten Lagemaße 3.3 Weitere Lagemaße: Quantile/Perzentile I Für jeden Median x med gilt: Mindestens 50% der Merkmalswerte sind kleiner gleich x med und ebenso mindestens
MehrStatistik im Klartext Für Psychologen, Wirtschaftsund Sozialwissenschaftler. Fabian Heimsch Rudolf Niederer Peter Zöfel
Statistik im Klartext Für Psychologen, Wirtschaftsund Sozialwissenschaftler 2., aktualisierte und erweiterte Aulage Fabian Heimsch Rudolf Niederer Peter Zöfel Statistik im Klartext - PDF Inhaltsverzeichnis
MehrMathematische und statistische Methoden I
Prof. Dr. G. Meinhardt 6. Stock, Wallstr. 3 (Raum 06-06) Sprechstunde jederzeit nach Vereinbarung und nach der Vorlesung. Mathematische und statistische Methoden I Dr. Malte Persike persike@uni-mainz.de
MehrStatistik I für Betriebswirte Vorlesung 4
Statistik I für Betriebswirte Vorlesung 4 Prof. Dr. Hans-Jörg Starkloff TU Bergakademie Freiberg Institut für Stochastik 25. April 2016 Prof. Dr. Hans-Jörg Starkloff Statistik I für Betriebswirte Vorlesung
MehrUwe Hassler. Statistik im. Bachelor-Studium. Eine Einführung. für Wirtschaftswissenschaftler. ^ Springer Gabler
Uwe Hassler Statistik im Bachelor-Studium Eine Einführung für Wirtschaftswissenschaftler ^ Springer Gabler 1 Einführung 1 2 Beschreibende Methoden univariater Datenanalyse 5 2.1 Grundbegriffe 5 2.2 Häufigkeitsverteilungen
MehrMehrfache Lineare Regression 1/9
Mehrfache Lineare Regression 1/9 Ziel: In diesem Fallbeispiel soll die Durchführung einer mehrfachen linearen Regressionsanalyse auf der Basis vorhandener Prozessdaten (Felddaten) beschrieben werden. Nach
MehrParametrische vs. Non-Parametrische Testverfahren
Parametrische vs. Non-Parametrische Testverfahren Parametrische Verfahren haben die Besonderheit, dass sie auf Annahmen zur Verteilung der Messwerte in der Population beruhen: die Messwerte sollten einer
MehrAnalyse eines mehrdimensionalen Datensatzes unterstützt durch Xplo- Re
Claudia Kegel Analyse eines mehrdimensionalen Datensatzes unterstützt durch Xplo- Re Hausarbeit zur Vorlesung Einführung in die Softwareumgebung XploRe im WS1998/99 1 Inhaltsverzeichnis 1. EINLEITUNG 1
MehrStatistik. R. Frühwirth. Statistik. VO Februar R. Frühwirth Statistik 1/536
fru@hephy.oeaw.ac.at VO 142.090 http://tinyurl.com/tu142090 Februar 2010 1/536 Übersicht über die Vorlesung Teil 1: Deskriptive Teil 2: Wahrscheinlichkeitsrechnung Teil 3: Zufallsvariable Teil 4: Parameterschätzung
Mehr