Jacob Liljehult
Klinisk sygeplejespecialist
cand.scient.san, Ph.d.
Neurologisk afdeling
Nordsjællands Hospital
Man kan omregne fra Z og T fordelinger med funktionerne pnorm(-abs(z))
og
pt(-abs(t), df = ( n-1 ))
Som eksempel kan man bruge Z og T-fordelinger til at udregne andelen af patienter over eller under en given grænseværdi ud fra mean og standard deviation (antaget at data er normalfordelt):
strokedata <- read.csv("
https://jacobliljehult.github.io/research/strokedata.csv", sep=",", header = TRUE)
library("dplyr")
strokedata %>%
mutate(variable = age) %>%
filter(!is.na(variable)) %>%
summarise(
number = n(),
mean = (mean(variable)),
SD = round(sd(variable),2)
)
number | mean | SD | |
---|---|---|---|
1 | 1031 | 71.85063 | 12.42 |
I dette eksempel bruges data fra en kohorte af 1031 patienter med apopleksi på Nordsjællands Hospital:
Gennemsnitsalderen er 71.85 år med en standard deviation på 12.42.
z <- (50 - 71.85063)/12.42
z
pnorm(-abs(z))
[1] -1.75931
[1] 0.03926244
Dette svare til at 3.9% af patienterne forventes at være under 50 år
z <- (90 - 71.85063)/12.42
z
pnorm(-abs(z))
[1] 1.461302
[1] 0.0719663
Dette svare til at 7.2% af patienterne forventes at være over 90 år
Samme udregninger kan laves med en T-fordeling:
t <- (50 - 71.85063)/12.42
t
pt(-abs(t), df = (1031-1))
[1] -1.75931
[1] 0.03941087
t <- (90 - 71.85063)/12.42
t
pt(-abs(t), df = (1031-1))
[1] 1.461302
[1] 0.0721188
Samme funktioner kan bruges til at lave henholdsvis ensidige (one-sample) Z og T-test. Her bruges dog standard error fremfor standard deviation
z <- (71 - 71.85063)/(12.42/sqrt(1031))
z
pnorm(-abs(z))
[1] -2.199117
[1] 0.01393478
t <- (71 - 71.85063)/(12.42/sqrt(1031))
t
pt(-abs(t), df = (1031-1))
[1] -2.199117
[1] 0.01404562
Der er altså 1.4% sandsynlighed for at vi ved en ny stikprøve ville få et gennemsnit på 71 år eller lavere
Hvis man har brug for en Z eller T-værdi svarende til en given sandsynlighed bruges henholdsvis funktionerne
qnorm(p)
og qt(p, df = ( n - 1 )
Z værdierne svarende til et 95% konfidensinterval:
qnorm(c(0.025,0.975))
[1] -1.959964 1.959964
T-værdierne svarende til et 95% konfidensinterval i en population a 60
qt(c(0.025,0.975), df=(30-1))
[1] -2.04523 2.04523