Statistik
eksempler i R

Neurologi Neuroanatomi Statistik Home

Deskriptiv


Kvantitative data
Kategoriske data
Intervaller

Analytisk


Sandsynligheder

Kategoriske udfald

Kategoriske eksponeringer
Logistisk regression

Kvantitative udfald

Kvantitative udfald
Linær regression
Korrelationer
Overlevelse
Poisson regression

Tilfældighed


Randomisering

Forskning


PhD thesis



Jacob Liljehult
Klinisk sygeplejespecialist
cand.scient.san, Ph.d.

Neurologisk afdeling
Nordsjællands Hospital

Deskriptiv statistik for kvantitative data

En hurtig måde at lave deskriptiv statistik er med funktionen summary(x):

summary(strokedata$age)

Min.1st Qu. MedianMean3rd Qu.Max.
21.0064.00 73.0071.8581.0099.00

summary(x) ignorerer per default NA-værdier, men vil fortælle hvor mange NA-værdier den har ignoreret:

summary(strokedata$height)

Min.1st Qu. MedianMean3rd Qu.Max.NA's
139.00164.00 170.00171.1178.00198.00 50

Hvis man ønsker de enkelte beregninger kan de udregnes med følgende funktioner:

Antal værdier i variablen

length(strokedata$age)

[1] 1031

Gennemsnit - mean(x)

mean(strokedata$age)

[1] 71.85063

Median (midterste værdi) - median(x)

median(strokedata$age)

[1] 73

Mindste værdi - min(x)

min(strokedata$age)

[1] 21

Højeste værdi - max(x)

max(strokedata$age)

[1] 99

Range (mindste og højeste værdi) - range(x)

range(strokedata$age)

[1] 21 99

Variation - var(x)

var(strokedata$age)

[1] 154.3349

Standard deviation - sd(x)

sd(strokedata$age)

[1] 12.42316

Kvantiler/fraktiler - quantile(x, p)

quantile(strokedata$age, .25)

25%
64

quantile(strokedata$age, c(0.025,0.975))

2.5%97.5%
4692

Mange af de deskriptive funktioner ignorerer ikke NA-værdier per default og vil i så fald returnere NA, men mindre man fortæller funktionen at den skal ignorere NA-værdier med argumentet na.rm=TRUE

mean(strokedata$height)

[1] NA

mean(strokedata$height, na.rm = TRUE)

[1] 171.1203