Statistik
eksempler i R

Neurologi Neuroanatomi Statistik Home

Deskriptiv


Kvantitative data
Kategoriske data
Intervaller

Analytisk


Sandsynligheder

Kategoriske udfald

Kategoriske eksponeringer
Logistisk regression

Kvantitative udfald

Kvantitative udfald
Linær regression
Korrelationer
Overlevelse
Poisson regression

Tilfældighed


Randomisering

Forskning


PhD thesis



Jacob Liljehult
Klinisk sygeplejespecialist
cand.scient.san, Ph.d.

Neurologisk afdeling
Nordsjællands Hospital

Sandsynligheder

Man kan omregne fra Z og T fordelinger med funktionerne pnorm(-abs(z)) og pt(-abs(t), df = ( n-1 ))

Som eksempel kan man bruge Z og T-fordelinger til at udregne andelen af patienter over eller under en given grænseværdi ud fra mean og standard deviation (antaget at data er normalfordelt):

strokedata <- read.csv(" https://jacobliljehult.github.io/research/strokedata.csv", sep=",", header = TRUE)
library("dplyr")
strokedata %>%
  mutate(variable = age) %>%
  filter(!is.na(variable)) %>%
    summarise(
      number = n(),
      mean = (mean(variable)),
      SD = round(sd(variable),2)
)

number mean SD
1 1031 71.85063 12.42

I dette eksempel bruges data fra en kohorte af 1031 patienter med apopleksi på Nordsjællands Hospital:
Gennemsnitsalderen er 71.85 år med en standard deviation på 12.42.

Andel under 50 år

z <- (50 - 71.85063)/12.42
z
pnorm(-abs(z))

[1] -1.75931
[1] 0.03926244

Dette svare til at 3.9% af patienterne forventes at være under 50 år

Andel over 90 år

z <- (90 - 71.85063)/12.42
z
pnorm(-abs(z))

[1] 1.461302
[1] 0.0719663

Dette svare til at 7.2% af patienterne forventes at være over 90 år

Samme udregninger kan laves med en T-fordeling:

t <- (50 - 71.85063)/12.42
t
pt(-abs(t), df = (1031-1))

[1] -1.75931
[1] 0.03941087

t <- (90 - 71.85063)/12.42
t
pt(-abs(t), df = (1031-1))

[1] 1.461302
[1] 0.0721188

Samme funktioner kan bruges til at lave henholdsvis ensidige (one-sample) Z og T-test. Her bruges dog standard error fremfor standard deviation

z <- (71 - 71.85063)/(12.42/sqrt(1031))
z
pnorm(-abs(z))

[1] -2.199117
[1] 0.01393478

t <- (71 - 71.85063)/(12.42/sqrt(1031))
t
pt(-abs(t), df = (1031-1))

[1] -2.199117
[1] 0.01404562

Der er altså 1.4% sandsynlighed for at vi ved en ny stikprøve ville få et gennemsnit på 71 år eller lavere

Opslag af Z og T værdier fra sandsynlighed

Hvis man har brug for en Z eller T-værdi svarende til en given sandsynlighed bruges henholdsvis funktionerne qnorm(p) og qt(p, df = ( n - 1 )

Z værdierne svarende til et 95% konfidensinterval:

qnorm(c(0.025,0.975))

[1] -1.959964 1.959964

T-værdierne svarende til et 95% konfidensinterval i en population a 60

qt(c(0.025,0.975), df=(30-1))

[1] -2.04523 2.04523