Grundwissen
Grundbegriffe
statistische Tests
Messnivau
Sonstiges
100
Am Anfang jeder Forschung wird ... entwickelt. Darauf baut das gesamte Forschungsdesign auf.

Forschungsfrage / Hypothese

100

Was ist eine Variable?

stellt in der Regel eine Frage aus dem Fragebogen dar. Es handelt sich prinzipiell um eine gezielte Information, die erhoben wird.

100

Wozu nutzt man statistische Testverfahren?

statistisches Testverfahren zur Überprüfung, ob die Ergebnisse bedeutsam oder nur zufällig sind - sie schätzen ein ob es einen statistischen Zusammenhang gibt.

100
Welches Skalenniveu und warum? 

Bitte gib dein Geschlecht an: -männlich(1) -weiblich(2) -divers(3)


Nominalskala

Zuordnung der Zahlen ist völlig willkürlich, keine Rangfolge - geht nur darum, ob der Wert gleich oder ungleich (angekreuzt oder nicht angekreuzt) ist.


100
Was ist der Unterschied zwischen Korrelation und Kausalität?

Kausalität ist ein Ursache-Wirkungs-Zusammenhang (z.B. Fällt der Strom aus, geht das Licht aus).

Eine Korrelation zeigt einen Zusammenhang zwischen zwei Variablen (z.B. je mehr Schokolade ich esse, desto mehr Karies bekomme ich).

200

Ich teste mein Erhebungsinstrument hinsichtlich der Eignung für die Zielgruppe und Anwendbarkeit mithilfe von einem ... , bevor ich es einsetze.

Pretest

200

Was untersucht man mit uni-, bi- und multivariaten Analysen? (allgemein)

Univariat: Untersuchung einer Variable

bivariat: Zusammenhangsmaße für zwei Merkmale oder gemeinsame Verteilungsmaße

multivariat: Zusammenhangsmaße für mehr als zwei Merkmale

200

Was beschreibt statistische Signifikanz?

Signifikanz macht eine Aussage darüber, wie wahrscheinlich es ist, dass die Ergebnisse allein durch Zufall zustande gekommen sein können. 

Man nutzt für diese Berechnungen verschiedene Zusammenhangsmaße (z.B. Phi oder Lambda für nominale Variablen, Kendall´s Tau und Gamme für ordinale Variablen und Pearsons R für metrische / intervallskalierte Variablen).

200

Welches Skalenniveau und warum?

Bitte gib dein Geburtsjahr an: _ _ _ _

Intervallskala

Es gibt eine Rangordnung UND gleichgroße Abstände zwischen den möglichen Angaben, die man machen kann.

200

Beispiele für bivariate Fragestellungen

  • Schaffen mehr Mädchen oder mehr Jungen den Hauptschulabschluss (= Gibt es einen Zusammenhang zwischen dem Geschlecht und dem Erreichen des Hauptschulabschlusses)?
  • Werden die Noten mit wachsender Schulzufriedenheit besser?
  • Besuchen Kinder aus einkommensschwachen Familien seltener weiterführende Schulen?
300

Zu welcher Forschungsart gehören standadisierte Befragungen?

Quantitative Forschung

300

Was ist der Unterschied zwischen absoluter und relativer Häufigkeit?

absolut: Wie oft kommen die verschiedenen Merkmalsausprägungen einer Variable vor? (z.B. 5x ja, 6x nein angekreuzt)

relativ: Anteile der einzelnen Häufigkeiten an der Gesamtsumme der Häufigkeit (z.B. Prozentangaben)


300

Wie und wozu nutzt man den Chi-Quadrat-Test?

Zur Überprüfung es Unterschiede in den Häufigkeiten gibt. Wird auf der Basis einer Kreuztabelle durchgeführt. Sagt noch nichts darüber aus, ob ein statistischer Zusammenhang (Korrelation) besteht. Dazu werden Zusammenhangsmaße wie Phi und Cramer-V benötigt!

Voraussetzungen:

- Nullhypothese, die belegt oder widerlegt werden soll

- abhängige und unabhängige Variable

- nominales Skalenniveau

- zufällige Stichprobe

- erwartete Häufigkeit je Zelle von mindestens fünf (mind. fünf Personen haben die Antwortmöglichkeiten jeweils angekreuzt) -->NUR Häufigkeiten, keine relativen Werte (z.B. %)

300

Welches Skalennivau und warum?

Wie viele Haustiere haben sie?

Absolutskala

- es gibt einen absoluten Nullpunkt

- es ist zusätzlich eine natürliche Maßeinheit

300

Wie und wozu nutzt man Kreuztabellen?

Sie geben Auskunft über Häufigkeiten der Kombination von Merkmalsausprägungen und Aufschluss über die Anzahl der gegebenen Antworten.

Auf der Basis von Kreuztabellen lassen sich Zusammenhangsmaße berechnen, wodurch Aussagen über die Stärke eines Zusammenhangs getroffen werden können. Die Signifikanz hierzu muss allerdings erst noch getestet werden. Kreuztabellen eignen sich vor allem für die Darstellung von Zusammenhängen zwischen nominal- und ordinalskalierten Merkmalen. Es braucht eine abhängige und eine unabhängige Variable.

400

Man nennt es auch die "beschreibende" Statistik.

Es geht dabei um statistische Beschreibungen von Stichproben, Verdichtung von Informationen, Beschreibung der vorliegenden Daten mittels einer Stichprobe oder Vollerhebung.

Deskriptive Statistik

400

Was ist ein Skalennivau?

Die Art und Weise, wie sich die Merkmalsausprägungen (Werte) einer Variable ordnen lassen. Man nennt es auch die relationale Struktur oder das Skalenniveau. 

Das Skalenniveau ist entscheident dafür wie Variablen gemessen und ausgewertet werden können.

400

Wie und wozu nutzt man den t-Test?

= eine Form eines Mittelwertvergleichs

Der t-Test kann verwendet werden, um zu bestimmen, ob zwei Stichproben sich statistisch signifikant unterscheiden. Kurz gesagt: man überprüft bei einer Variable, ob sich die Mittelwerte bei zwei Gruppen (z.B. Mann / Frau) unterscheiden und ob die Differenz zwischen den beiden Gruppen zufällig ist oder nicht.

Voraussetzungen:

- Unterscheidung ob es sich um eine unabhängige (z.B. Kontrollgruppenvergleich bei Medikamentenstudie) oder um eine abhängige (z.B. Langzeitstudie / Panel-Studie bei den selben Personen) Stichprobe handelt.

ANMERKUNG: Bei Fr. Fromm sollten wir vorranging t-Test für unabhängige Stichproben kennen!

weiter Voraussetzungen:

- Nullhypothese / Annahme

- Vergleich von maximal zwei Gruppen (bei drei oder mehr braucht man eine Varianzanalyse)

- intervallskalierte abhängige Variable (metrisch)

- binäre bzw. dichtonome unabhängige Variable (heißt nur zwei Antwortmöglichkeiten/Merkmalsausprägungen - z.B. ja/nein)

- Das untersuchte Merkmal ist in den Grundgesamtheiten der beiden Gruppen normalverteilt 

- Homogenität der Varianzen: Die Gruppen kommen aus Grundgesamtheiten mit annähernd identischer Varianz (siehe Levene-Test)

Beispiel für Fragestellung zum t-Test:

Unterscheiden sich Personen mit selbstständiger oder unselbständiger Tätigkeit bezüglich ihrer Zufriedenheit mit ihrer beruflichen Situation?

Gibt es einen Unterschied in der durchschnittlichen Anzahl Einbrüche in Häuser mit und ohne Alarmanlage?

Hat das Hören von klassischer Musik oder Schlagermusik während des Lernens von Vokabeln einen unterschiedlichen Einfluss auf den Lernerfolg?

400

Welches Skalenniveau und warum?

Wie alt sind Sie?

-bis 24 Jahre (1)   -25-30 Jahre (2) usw.

Ordinalskala

- es gibt eine Rangfolge

- man kann die Antworten aufsteigend oder absteigend ordnen

- Aussagen über größer/kleiner, besser/schlechter, gleich/ungleich sind bei diesem Skalenniveau möglich

400

Beispiele für multivariate Fragestellungen

– Wie lassen sich Unterschiede in den Abschlussnoten durch die Merkmale Geschlecht, Klassenstufe und Schulzufriedenheit erklären? (Regressionsanalytische Fragestellung)

– Wie lassen sich Bezirke von Arbeitsagenturen typisieren? (Clusteranalyse)

– Wie können Haushalte nach Merkmalen ihrer sozialen Lage klassifiziert werden? (Clusteranalyse)

– Haben ausländerfeindliche oder rechtsextreme Überzeugungen von Jugendlichen in den letzten Jahren zugenommen? (Faktorenanalyse)

– Wie lässt sich das Scheidungsrisiko auf der Basis von Merkmalen der Ehe prognostizieren (Logistische Regression)

– Welche Konsummuster finden sich bei Haushalten mit unterschiedlichen sozioökonomischen Status? (Clusteranalyse)

500

Man nennt es auch die "schließende Statistik".

Es geht um die Verallgemeinerung von Befunden auf Ebene von Stichproben auf die Grundgesamtheit unter Verwendung wahrscheinlichkeitstheoretischer Annahmen.

Induktive Statistik

500

Was ist der Unterschied zwischen abhängigen und unabhängigen Variablen?

Eine abhängige Variable ist die beeinflusste bzw. die zu erklärende Variable.

Eine unabhängige Variable ist die beeinflussende bzw. erklärende Variable.

BEISPIEL: Man will wissen, ob ein Migrationshintergrund Einfluss auf den erworbenen Hochschulzugang hat.

Die Variable Migrationshintergrund (V7) ist  die unabhängige Variable. Beeinflusst der Migrationshintergrund den Hochschulzugang?

Die Variable Hochschulzugang (V8) ist hier die abhängige Variable. Wird der Hochschulzugang von dem Migrationshintergrund beeinflusst?

500

Mit welchem Verfahren könnte man das alte Sprichwort "Die dümmsten Bauern haben die größten Kartoffeln" überprüfen?

Einfache lineare Regression, aber warum?

- Sprichwort als (Null-)Hypothese/Annahme

Variable IQ von Bauern = Intervallskala (metrisch) -->Wird die Größe der Kartoffel vom IQ der Bauern beeinflusst? (unabhängige Variable)

Variable Größe von Kartoffeln = Verhältnisskala (metrisch) --> abhängige Variable

man will einen statistischen Zusammenhang von 2 Variablen prüfen - Voraussetzung für einfache lineare Regression:

- beide Variablen metrisch, 1 abhängige & 1 unabhängige

- Streudiagramm als Basis -->macht hier Sinn (x-Achse IQ - y-Achse Größe Kartoffeln)

- Annahme / Nullhypothese muss gebildet werden (Sprichwort oder anders formuliert: Je kleiner der IQ, desto größer die Kartoffeln)

--> Mit einer einfachen linearen Regression kann überprüft werden, ob es eine positive oder negative Korrelation gibt. Der Signifikanz-Wert zeigt dann an, ob von einem tatsächlichen Einfluss des IQ auf die Kartoffelgröße ausgegangen werden kann. Je nachdem kann die Hypothese bestätigt oder widerlegt werden. Der (negative oder positive) Korrelationswert gibt an, wie stark der Zusammenhang tatsächlich ist.

500

Welches Skalenniveau und warum?

Wie viel wiegen Sie? ___ Kilogramm

Verhältnisskala (oder Ratioskala)

- Rangordnung

- gleich große Abstände zwischen den Antwortmöglichkeiten

500

Was ist Varianz?

Ein Dispersions- bzw. Streuungsmaß. Diese geben Auskunft darüber, wie sehr sich die Messwerte voneinander unterscheiden --> wie breit eine Verteilung ist!
Die Varianz ist die durchschnittlich quadrierte Abweichung vom Mittelwert. Die Varianz wird umso größer, je stärker die Werte vom Mittelwert abweichen. Sie kann nur für mind. intervallskalierte normalverteilte Variablen sinnvoll berechnet werden.

M
e
n
u