Vi vil undersøge, hvorvidt Patient X's IQ er forskellig fra populationens IQ. Populationens gennemsnitlige IQ er 100 med en standardafvigelse på 15. Patient X's IQ er 120. Data er normalfordelt. Hvilken test skal vi bruge for at undersøge dette?
Single case z-test (da vi har en enkelt score, og vores afhængige variabel er kontinuert - og vi kender standardafvigelsen i populationen)
Kritisk værdi
Den kritiske værdi markerer punktet hvor p-værdien bliver lavere end signifikansniveauet. Hvis teststatistikken er mere ekstrem end den kritiske værdi, er der dermed ≤5% sandsynlighed for at få netop den værdi under antagelse af H0.
Hvis vores teststatistik (fx vores t) er mere ekstrem end den kritiske værdi, forkaster vi med andre ord nulhypotesen.
M
Et samples gennemsnit
Vi vil gerne undersøge om psykologistuderende har en anderledes IQ end populationen. Populationens gennemsnitlige IQ er 100 med en standardafvigelse på 15. Vi tester 30 psykologistuderende og finder, at de har en gennemsnitlig IQ på 115.
Hvilken test skal benyttes?
One sample z-test (da der er en gruppe, og vi kender standardafvigelsen i populationen)
Hvad skal man kigge på, hvis man på en nem måde vil finde ud af, hvilken test man skal bruge?
Det er en god ide at tage udgangspunkt i skemaet over de forskellige tests og fx spørge sig selv: Hvor mange grupper er der? Og hvilken skala måles den afhængige variabel på?
Vi vil undersøge, om vores nyopfundne terapiform mod depression er bedre end standardbehandlingen. Standardbehandlingen har en succesrate på 60%. Vi har foretager et studie med N=20, hvor 12 bliver helbredt (succes) og 8 ikke bliver helbredt (failure).
Hvilken test skal vi bruge til at undersøge dette?
Binomialtest (da vi har en gruppe, og den afhængige variabel er binær)
Type I fejl
At forkaste en nulhypotese der er sand (sandsynlighed=alpha)
my
En populations gennemsnit
Vi vil gerne undersøge, om Prebens evne til at genkende ansigter er forskellig fra normgruppens. Normgruppen består af 15 mennesker med en gennemsnitlig ansigtsgenkendelsesscore på 80 og en standardafvigelse på 10. Preben scorer 94 på testen.
Hvilken statistik test bør benyttes her?
Nævn tre faktorer, der kan øge power.
Signifikansniveauet:
Hvis man øger signifikansniveauet, øges power. Dog øges sandsynligheden for Type I fejl også. Denne metode benyttes derfor ikke så meget.
Succesrate/effektstørrelse:
Øges succesrate/effektstørrelsen, øges power. Dog kan man ikke bare opfinde en succesrate/effektstørrelse, men er nødt til at begrunde det i litteraturen.
Sample size:
Den mest brugte metode - sample size planning. Man kan planægge på forhånd, hvor stort N man skal have med i sit studie for at opnå et bestemt niveau af power (ofte ≥80%)
Vi vil undersøge om antallet af fraværsgange på hold 4 og hold 6 er forskellige. Den afhængige variabel er antal fraværsgange (0; 1-2; 3-5; 6-9; 10-14).
Hvilken test skal bruges til at undersøge dette?
Mann Whitney-test (da data er på ordinal skala og ikke normalfordelt, og vi har to uafhængige grupper)
Type II fejl
At beholde en nulhypotese, der er falsk (sandsynlighed=beta=1-power)
s eller SD
Et samples standardafvigelse (standard deviation)
Vi vil undersøge om emotionsfokuseret terapis succesrate er forskellig fra kognitiv adfærdsterapis.
Den afhængige variabel er, om patienterne stopper med selvskade (succes) eller fortsætter med selvskade (fiasko) efter endt behandling. Nulhypotesen er, at de to succesrater er ens.
Hvilken test bør benyttes her?
Chi-i-anden test (da vi har to grupper, og den afhængige variabel er binær)
På hvilke tre måder kan man forkaste nulhypotesen? (Hvilke tre ting kan man kigge på for at tjekke om man bør forkaste H0 eller ej?)
Den kritiske værdi:
Hvis testværdien er mere ekstrem end den kritiske værdi forkastes H0.
P-værdien:
Hvis p-værdien er under 5% forkastes nulhypotesen.
Konfindensintervallet:
Hvis forskellen defineret ved nulhypotesen (oftest 0) IKKE indgår i intervallet, forkastes nulhypotesen.
Vi vil undersøge om kognitiv adfærdsterapi (CBT) er en effektiv terapi mod anoreksi. Vi måler vægten på en gruppe anoreksipatienter før og efter behandling. Vores nulhypotese er, at der ikke er sket nogen forandring i patienternes vægt. Data er normalfordelt.
Hvilken test skal vi bruge her?
Paired samples t-test (vi har en gruppe med en før/efter-måling)
p-værdi
p-værdien er sandsynligheden for at få en given testværdi/et givet antal succeser eller et mere ekstremt resultat, under antagelse af at nulhypotesen er sand.
Så p-værdien besvarer spørgsmålet (eksempel: one sample t-test):
”Hvis der ikke er nogen forskel mellem samplet og populationen, hvor sandsynligt er det så at få dette gennemsnit ved en tilfældighed?”
Hvis sandsynligheden for dette er under 0.05 (5%), forkaster vi nulhypotesen. Scoren er altså så usandsynlig, at vi må antage, at samplet ikke kommer fra den population, vi har sammenlignet med. Derfor konkluderer vi, at der er forskel mellem vores sample og populationen (og forkaster nulhypotesen)
sigma
En populations standardafvigelse
Vi vil undersøge, om indtagelse af koffein fører til, at man blinker mere. Vi laver to grupper, hvoraf den ene drikker to kopper kaffe en time inden målingen, og den anden drikker vand. Begge grupper får målt, hvor mange gange de blinker i en tidsperiode på 5 min.
Hvilken test skal vi bruge til at undersøge, om der er forskel mellem grupperne?
Independent samples t-test (da grupperne er uafhængige, og den afhængige variabel er kontinuert)
Vi vil teste en ny terapiform på en gruppe af N = 32 patienter op mod standardbehandlingen med en succesrate på 60%. Vi observerer 24 succeser og 5 fiaskoer, men der mangler 3 observationer.
Hvilken strategi til håndtering af missing data vil være hhv. mest og mindst konservativ?
Mest konservativ: Worst case scenario
Mindst konservativ: Best case scenario
(Havde vi haft to grupper, ville mixed case have været mest konservativ - men når vi kun har en, er det worst case)
Vi vil undersøge, hvorvidt tosprogede børns matematikfærdigheder afviger fra populationens. Populationens gennemsnit er 18.1. Vi undersøger 25 tosprogede børn, og finder et gennemsnit på 16.1 med en standardafvigelse på 3.6.
Hvilken test skal bruges her?
Power
Power (= 1 - beta) er sandsynligheden for korrekt at afvise en falsk nulhypotese.
Sagt med andre ord: Det er sandsynligheden for at forkaste H0 under antagelse af, at H0 er falsk.
pi
Sandsynligheden for succes (succesrate)
Vi vil undersøge, hvor god sangterapi er til at hjælpe børn, der stammer. Standardbehandlingen har en succesrate på 0.6, og den nye behandling vil kun blive implementeret, hvis den er bedre end standardbehandlingen. Efter terapiforløbet måles det, om børnene er stoppet med at stamme (succes) eller ej (fiasko).
Hvilken test skal du bruge for at undersøge, om den nye terapi er bedre end standardbehandlingen?
Binomialtest (da der er en gruppe, og den afhængige variabel er binær)
I næsten alle de tests vi kender, forkaster vi nulhypotesen, hvis teststatistikken er mere ekstrem end den kritiske værdi. For hvilken test gør vi det modsatte - altså forkaster nulhypotesen når teststatistikken er MINDRE end den kritiske værdi?
Mann Whitney-testen