Example: bachelor of science

Kommentierte Formelsammlung multivariater …

Kommentierte Formelsammlungmultivariater statistischer VerfahrenProf. Dr. Irene R lerProf. Dr. Albrecht UngererInhaltsverzeichnisiInhaltsverzeic hnisVerfahren im berblickivBeispieldatensatz11 Multiple lineare Regressionsanalyse2 Regressionsmodell in der Stichprobe ..2Ma zahlen der Regressionsanalyse in der Stichprobe ..3 Sch tzmodell ..4 Sch tzer ..4 Konfidenzintervalle ..5 Testverfahren ..5 Ergebnisseite der Regressionsanalyse mit WinSTAT ..72 Varianzanalyse ..9 Das Modell in der Stichprobe ..9Ma zahl der einfaktoriellen Varianzanalyse in der Stichprobe .. 10 Sch tzmodell .. 11 Sch tzer .. 11 Testverfahren .. 12 Ergebnisseite der einfaktoriellen Varianzanalyse mit WinSTAT .. Varianzanalyse .. 15 Das Modell in der Stichprobe.

Multivariate statistische Verfahren im Überblick iv Multivariate statistische Verfahren im Überblick Verfahren Voraussetzungen Ziele wichtige Maßzahlen Testverfahren

Tags:

  Verfahren

Information

Domain:

Source:

Link to this page:

Please notify us if you found a problem with this document:

Other abuse

Transcription of Kommentierte Formelsammlung multivariater …

1 Kommentierte Formelsammlungmultivariater statistischer VerfahrenProf. Dr. Irene R lerProf. Dr. Albrecht UngererInhaltsverzeichnisiInhaltsverzeic hnisVerfahren im berblickivBeispieldatensatz11 Multiple lineare Regressionsanalyse2 Regressionsmodell in der Stichprobe ..2Ma zahlen der Regressionsanalyse in der Stichprobe ..3 Sch tzmodell ..4 Sch tzer ..4 Konfidenzintervalle ..5 Testverfahren ..5 Ergebnisseite der Regressionsanalyse mit WinSTAT ..72 Varianzanalyse ..9 Das Modell in der Stichprobe ..9Ma zahl der einfaktoriellen Varianzanalyse in der Stichprobe .. 10 Sch tzmodell .. 11 Sch tzer .. 11 Testverfahren .. 12 Ergebnisseite der einfaktoriellen Varianzanalyse mit WinSTAT .. Varianzanalyse .. 15 Das Modell in der Stichprobe.

2 15Ma zahlen der zweifaktoriellen Varianzanalyse in der Stichprobe .. 18 Sch tzmodell .. 18 Sch tzer .. 19 Testverfahren .. 19 Ergebnisseite der zweifaktoriellen Varianzanalyse mit WinSTAT .. 203 Diskriminanzanalyse21 Das Stichprobenmodell von Fisher .. 21Ma zahlen der Diskriminanzanalyse in der Stichprobe .. 24 Klassifikation mit der quadrierten euklidischen Distanz .. 25 Das Maximum-Likelihood-Sch tzmodell f r Normalverteilung .. 25 Sch tzer .. 25 Klassifikation nach der Maximum-Likelihood-Regel .. 26 Testverfahren .. 26 Klassifikation mit der Mahalanobis-Distanz .. 26 Klassifikation mit den Fisher schen Klassifizierungsfunktionen .. 27 Klassifikation nach Bayes .. 27 Bewertung der Klassifikation.

3 29 Ergebnisseite der Diskriminanzanalyse mit WinSTAT .. 30 Multivariate statistische VerfahrenR ler/UngererInhaltsverzeichnisii4 Faktorenanalyse33 Daten- und Korrelationsmatrix .. 34 Hauptachsentransformation .. 34 Hauptkomponentenmethode .. 37Ma zahlen der Hauptkomponentenanalyse .. 39 Ergebnisseite der Hauptkomponentenanalyse mit WinSTAT .. 42 Kommunalit tensch tzung .. 42 Hauptachsentransformation .. 42 Hauptachsenmethode .. 43 Ergebnisseite der Hauptachsenanalyse mit WinSTAT .. 43 Kriterien zur Bestimmung der Anzahl der Faktoren .. 44 Interpretation und Rotation der Faktoren .. 45 Methoden zur Bestimmung der Rotationsmatrix .. 46 Interpretation der rotierten Faktoren .. 47 Interpretation der Faktorwerte.

4 475 Clusteranalyse49 Datenmatrix metrischer Merkmale .. 49 Distanzma e f r metrische Merkmale .. 50 hnlichkeitsma f r metrische Merkmale .. 51 Datenmatrix nominaler bin rer Merkmale .. 52 hnlichkeitsma e f r nominale bin re Merkmale .. 52 Datenmatrix nominaler bin rer oder mehrstufiger Merkmale .. 54 hnlichkeitsma e f r nominale bin re oder mehrstufige Merkmale .. 54 Datenmatrix ordinaler Merkmale .. 55 hnlichkeitsma e f r ordinale Merkmale .. 55 Distanzma e f r Merkmale mit unterschiedlichem Skalenniveau .. 55 Fusionierungsalgorithmen .. 57 Hierarchische agglomerative verfahren .. 57 Ablauf agglomerativer verfahren .. 57 Methoden der Clusterfusionierung .. 58 Rekursive Berechnung der Clusterdistanzen.

5 59 Dendrogramm .. 59 Ergebnisseite der agglomerativen Clusteranalyse mit WinSTAT .. 606 Data Mining62 Der CHAID-Algorithmus von Clementine (SPSS) .. 62 Der C&RT-Algorithmus von Clementine (SPSS) .. 63 Data Mining des Beispieldatensatzes mit Clementine von SPSS .. 63 Ergebnis einer CHAID-Analyse .. 63 Ergebnis einer C&RT-Analyse .. 64 Multivariate statistische VerfahrenR ler/UngererInhaltsverzeichnisiiiAnhang: Tafeln zu einigen wichtigen Verteilungen69A Standardnormalverteilung .. 69Bt-Verteilung .. 70C Chi-Quadrat-Verteilung .. 71DF-Verteilung .. 72 Multivariate statistische VerfahrenR ler/UngererMultivariate statistische verfahren im berblickivMultivariate statistische verfahren im berblickVerfahrenVoraussetzungenZielewic htige Ma zahlenTestverfahrenMultiplelineareRegres si-onsana-lyseEine metrische zu erkl -rende VariableYund meh-rere metrische erkl rendeVariablenX1.

6 ,Xkmiteinem Beobachtungsvek-toryund einer rung der Varianz vonY. Prognose vonYf rein Objektjmitxj=(x1j,..,xk j)durch Einset-zen vonxjin die Regressi-onsfunktion Beurteilung derG te der Regressionin der Stichprobe:Bestimmtheitsma Beurteilung derG te der Regressionin der Grundgesamt-heit: Overall-F-Testundt-Test f r ein-zelne Varianzana-lyse: Eine metrische zuerkl rende VariableYundeine nominale erkl rendeVariable, sog. Faktor,Xmit einer ErgebnismatrixderBeobachtungswertevonYf r die Faktorstufendes rung der Varianz vonY. Prognose vonYf r einObjektjmit der Faktorstu-fegdurch Bestimmung desarithmetischen Beurteilung desEinflusses des Fak-torsXaufYin derStichprobe:Eta-Quadrat-Koeffizient Beurteilung desEinflusses des Fak-torsXaufYin Varianz-analyse: Eine metrischezuerkl rendeVariableYund zwei nominaleerkl rende Variablen, ,AundBmiteiner Ergebnistabelle derBeobachtungswerte vonYf r die Faktorstufenkom-binationen der rung der Varianz vonY.

7 Prognose vonYf r einObjektjmit der Faktorstu-fenkombinationghdurchBestimmun g des arithmeti-schen Beurteilung desEinflusses der Fak-torstufenkombinatio-nen sowie der ein-zelnen Faktoren undder Interaktion aufYin der Beurteilung desEinflusses der Fak-torstufenkombinatio-nen sowie der ein-zelnen Faktoren undder Interaktion aufYin der Grundge- trennende GruppenA,B,..eines nominalenMerkmals und metrischeerkl rende VariablenX1,..,Xkmit nach Gruppen ge-trennten Beobachtungtu-peln(x1gi,..,xkgi).Erkl rung der Trennbarkeitder Gruppen. Klassifizie-rung neuer Objekte, der quadrierten eukli-dischen Beurteilung derG te der Trennbar-keit der Gruppen inder Stichprobe:kanonischer Beurteilung derG te der Trennbar-keit der Gruppen inderGrundgesamt-heit: VariablenX1.

8 ,Xkmit einer von einanderunabh ngigen Hintergrund-variablen, sog. Faktoren,mit der Hauptkomponen-tenanalyse oder der Interpretation derFaktoren:Faktorladungen;zur Beurteilung dererkl rten Varianzendurch die Faktoren:Kommunalit tenund VariablenX1,..,Xkmit einer VariablenX1,..,Xkmit einer codierten der Gesamtheitvon Objekten in disjunkteKlassen (Cluster), so dassdie Klassen in sich homo-gen, aber deutlich vonein-ander getrennt sind, hierarchischen agglo-merativen e f rmetrischeVaria-blen. hnlichkeitsma ef r nominale statistische VerfahrenR ler/UngererBeispieldatensatz1 BeispieldatensatzErgebnis einer statistischen Erhebung an 36 Studierenden im Vorfeld der Statistikklausur: Y1: Fachbereich (1: Betriebswirtschaft, 2: Informationstechnologien) (excel-Datei-download) X1: Geschlecht (0: m nnlich, 1: weiblich) X2: Mathe-Note im Abitur Y2: Ausgaben f r Kopien (E/Semester) X3: Nettoeinkommen (E/Semester) X4: Zeit f r Nacharbeitung und Klausurvorbereitung (Std/Semester) X5: Verweildauer im Internet (Std/Semester) X6: Aufenthaltsdauer in Kinos, Discos oder Kneipen (Std/Semester) X7: Anzahl gekaufter Fachb cher im Semester X8: erwartete Leistung in der Statistikklausur (-1: unterdurchschn.)

9 , 0: durchschn., +1: eher besser) statistische VerfahrenR ler/Ungerer1 Multiple lineare Regressionsanalyse21 Multiple lineare RegressionsanalyseSoll die Streuung einer metrischen VariablenYdurch eine ebenso metrische VariableXerkl rt werden (Einfach-regession) und ergibt sich hierbei ein kleiner Wert f r das Bestimmtheitsma , so versucht man durch Hinzunahmeweiterer metrischer erkl render Variablen einen Erkl rungsbeitrag zu finden (multiple lineare Regression).Regressionsmodell in der StichprobeZur Bestimmung einer Regressionsfunktion, mit der die Streuung der ZielvariablenYerkl rt werdenkann, w hlt man das Kleinste-Quadrate-Kriterium, denn dann ist es m glich, die zu erkl rende StreuungvonYin eine nicht erkl rte und eine durch die Regressionsfunktion erkl rte Streuung zu :zu erkl rende metrische VariableX1.

10 ,Xk:kerkl rende metrische, linear unabh ngige Variablen; rang(X) =k+1 n(yi,x1i,x2i,..,xki): Beobachtungstupel desi-ten Elements,i=1,..,n, (Stichprobenumfangn) y=b0+b1x1+b2x2+..+bkxk: Kleinste-Quadrate-Stichprobenregressions funktionMatrixschreibweise der Normal- bzw. Bestimmungsgleichungen ausminb0,b1,..,bkn i=1(yi yi)2:Normalgleichungen:Bestimmungsgleich ungen:(X X)b=X yb= (X X) 1X ymitb:= ,X:= ,y:= Zur Ermittlung von Ma zahlen f r die G te der Regressionsfunktion in der Stichprobe sowie zur Durch-f hrung des F-Tests f r die G te der Regressionsfunktion in der Grundgesamtheit wird eine Varianzana-lyse (ANalysis Of VAriance) durchgef hrt. Hierzu wird eine Varianzzerlegung vorgenommen:1n 1 n i=1(yi y)2 s2Y=1n 1 n i=1(yi yi)2 s2e+1n 1 n i=1( yi y)2 s2 Y 1n 1 SQT 1n 1 SQR 1n 1 SQEDie ANOVA-Tabelle beinhaltet die Quadratsummen und beschreibt die Berechnung desFemp-Wertes.


Related search queries