Statistik og kvantitative forskningsdesign 1 - jeopardy! Jeopardy Template

Hvilken test?

Centrale begreber

Symboler

Hvilken test? 2.0

Blandede godter

100

Vi vil undersøge, hvorvidt Patient X's IQ er forskellig fra populationens IQ. Populationens gennemsnitlige IQ er 100 med en standardafvigelse på 15. Patient X's IQ er 120. Data er normalfordelt. Hvilken test skal vi bruge for at undersøge dette?

Single case z-test (da vi har en enkelt score, og vores afhængige variabel er kontinuert - og vi kender standardafvigelsen i populationen)

100

Kritisk værdi

Den kritiske værdi markerer punktet hvor p-værdien bliver lavere end signifikansniveauet. Hvis teststatistikken er mere ekstrem end den kritiske værdi, er der dermed ≤5% sandsynlighed for at få netop den værdi under antagelse af H0.

Hvis vores teststatistik (fx vores t) er mere ekstrem end den kritiske værdi, forkaster vi med andre ord nulhypotesen.

100

Et samples gennemsnit

100

Vi vil gerne undersøge om psykologistuderende har en anderledes IQ end populationen. Populationens gennemsnitlige IQ er 100 med en standardafvigelse på 15. Vi tester 30 psykologistuderende og finder, at de har en gennemsnitlig IQ på 115.

Hvilken test skal benyttes?

One sample z-test (da der er en gruppe, og vi kender standardafvigelsen i populationen)

100

Hvad skal man kigge på, hvis man på en nem måde vil finde ud af, hvilken test man skal bruge?

Det er en god ide at tage udgangspunkt i skemaet over de forskellige tests og fx spørge sig selv: Hvor mange grupper er der? Og hvilken skala måles den afhængige variabel på?

200

Vi vil undersøge, om vores nyopfundne terapiform mod depression er bedre end standardbehandlingen. Standardbehandlingen har en succesrate på 60%. Vi har foretager et studie med N=20, hvor 12 bliver helbredt (succes) og 8 ikke bliver helbredt (failure).
Hvilken test skal vi bruge til at undersøge dette?

Binomialtest (da vi har en gruppe, og den afhængige variabel er binær)

200

Type I fejl

At forkaste en nulhypotese der er sand (sandsynlighed=alpha)

200

En populations gennemsnit

200

Vi vil gerne undersøge, om Prebens evne til at genkende ansigter er forskellig fra normgruppens. Normgruppen består af 15 mennesker med en gennemsnitlig ansigtsgenkendelsesscore på 80 og en standardafvigelse på 10. Preben scorer 94 på testen.

Hvilken statistik test bør benyttes her?

Single case t-test (da vi har en enkelt person, en kontinuert afhængig variabel, og vores normgruppe er for lille til at kunne betragtes som en population)

200

Nævn tre faktorer, der kan øge power.

Signifikansniveauet:
Hvis man øger signifikansniveauet, øges power. Dog øges sandsynligheden for Type I fejl også. Denne metode benyttes derfor ikke så meget.

Succesrate/effektstørrelse:
Øges succesrate/effektstørrelsen, øges power. Dog kan man ikke bare opfinde en succesrate/effektstørrelse, men er nødt til at begrunde det i litteraturen.

Sample size:
Den mest brugte metode - sample size planning. Man kan planægge på forhånd, hvor stort N man skal have med i sit studie for at opnå et bestemt niveau af power (ofte ≥80%)

300

Vi vil undersøge om antallet af fraværsgange på hold 4 og hold 6 er forskellige. Den afhængige variabel er antal fraværsgange (0; 1-2; 3-5; 6-9; 10-14).

Hvilken test skal bruges til at undersøge dette?

Mann Whitney-test (da data er på ordinal skala og ikke normalfordelt, og vi har to uafhængige grupper)

300

Type II fejl

At beholde en nulhypotese, der er falsk (sandsynlighed=beta=1-power)

300

s eller SD

Et samples standardafvigelse (standard deviation)

300

Vi vil undersøge om emotionsfokuseret terapis succesrate er forskellig fra kognitiv adfærdsterapis.
Den afhængige variabel er, om patienterne stopper med selvskade (succes) eller fortsætter med selvskade (fiasko) efter endt behandling. Nulhypotesen er, at de to succesrater er ens.

Hvilken test bør benyttes her?

Chi-i-anden test (da vi har to grupper, og den afhængige variabel er binær)

300

På hvilke tre måder kan man forkaste nulhypotesen? (Hvilke tre ting kan man kigge på for at tjekke om man bør forkaste H0 eller ej?)

Den kritiske værdi:
Hvis testværdien er mere ekstrem end den kritiske værdi forkastes H0.

P-værdien:
Hvis p-værdien er under 5% forkastes nulhypotesen.

Konfindensintervallet:
Hvis forskellen defineret ved nulhypotesen (oftest 0) IKKE indgår i intervallet, forkastes nulhypotesen.

400

Vi vil undersøge om kognitiv adfærdsterapi (CBT) er en effektiv terapi mod anoreksi. Vi måler vægten på en gruppe anoreksipatienter før og efter behandling. Vores nulhypotese er, at der ikke er sket nogen forandring i patienternes vægt. Data er normalfordelt.
Hvilken test skal vi bruge her?

Paired samples t-test (vi har en gruppe med en før/efter-måling)

400

p-værdi

p-værdien er sandsynligheden for at få en given testværdi/et givet antal succeser eller et mere ekstremt resultat, under antagelse af at nulhypotesen er sand.

Så p-værdien besvarer spørgsmålet (eksempel: one sample t-test):

”Hvis der ikke er nogen forskel mellem samplet og populationen, hvor sandsynligt er det så at få dette gennemsnit ved en tilfældighed?”

Hvis sandsynligheden for dette er under 0.05 (5%), forkaster vi nulhypotesen. Scoren er altså så usandsynlig, at vi må antage, at samplet ikke kommer fra den population, vi har sammenlignet med. Derfor konkluderer vi, at der er forskel mellem vores sample og populationen (og forkaster nulhypotesen)

400

sigma

En populations standardafvigelse

400

Vi vil undersøge, om indtagelse af koffein fører til, at man blinker mere. Vi laver to grupper, hvoraf den ene drikker to kopper kaffe en time inden målingen, og den anden drikker vand. Begge grupper får målt, hvor mange gange de blinker i en tidsperiode på 5 min.

Hvilken test skal vi bruge til at undersøge, om der er forskel mellem grupperne?

Independent samples t-test (da grupperne er uafhængige, og den afhængige variabel er kontinuert)

400

Vi vil teste en ny terapiform på en gruppe af N = 32 patienter op mod standardbehandlingen med en succesrate på 60%. Vi observerer 24 succeser og 5 fiaskoer, men der mangler 3 observationer.

Hvilken strategi til håndtering af missing data vil være hhv. mest og mindst konservativ?

Mest konservativ: Worst case scenario

Mindst konservativ: Best case scenario

(Havde vi haft to grupper, ville mixed case have været mest konservativ - men når vi kun har en, er det worst case)

500

Vi vil undersøge, hvorvidt tosprogede børns matematikfærdigheder afviger fra populationens. Populationens gennemsnit er 18.1. Vi undersøger 25 tosprogede børn, og finder et gennemsnit på 16.1 med en standardafvigelse på 3.6.

Hvilken test skal bruges her?

One sample t-test (da vi har et sample, vi vil sammenligne med populationen - men standardafvigelsen i populationen er ukendt)

500

Power

Power (= 1 - beta) er sandsynligheden for korrekt at afvise en falsk nulhypotese.

Sagt med andre ord: Det er sandsynligheden for at forkaste H0 under antagelse af, at H0 er falsk.

500

Sandsynligheden for succes (succesrate)

500

Vi vil undersøge, hvor god sangterapi er til at hjælpe børn, der stammer. Standardbehandlingen har en succesrate på 0.6, og den nye behandling vil kun blive implementeret, hvis den er bedre end standardbehandlingen. Efter terapiforløbet måles det, om børnene er stoppet med at stamme (succes) eller ej (fiasko).

Hvilken test skal du bruge for at undersøge, om den nye terapi er bedre end standardbehandlingen?

Binomialtest (da der er en gruppe, og den afhængige variabel er binær)

500

I næsten alle de tests vi kender, forkaster vi nulhypotesen, hvis teststatistikken er mere ekstrem end den kritiske værdi. For hvilken test gør vi det modsatte - altså forkaster nulhypotesen når teststatistikken er MINDRE end den kritiske værdi?

Mann Whitney-testen