Jacob Liljehult
Klinisk sygeplejespecialist
cand.scient.san, Ph.d.
Neurologisk afdeling
Nordsjællands Hospital
En hurtig måde at lave deskriptiv statistik er med funktionen summary(x)
:
summary(strokedata$age)
Min. | 1st Qu. | Median | Mean | 3rd Qu. | Max. |
---|---|---|---|---|---|
21.00 | 64.00 | 73.00 | 71.85 | 81.00 | 99.00 |
summary(x)
ignorerer per default NA-værdier, men vil fortælle hvor mange NA-værdier den har ignoreret:
summary(strokedata$height)
Min. | 1st Qu. | Median | Mean | 3rd Qu. | Max. | NA's |
---|---|---|---|---|---|---|
139.00 | 164.00 | 170.00 | 171.1 | 178.00 | 198.00 | 50 |
Hvis man ønsker de enkelte beregninger kan de udregnes med følgende funktioner:
Antal værdier i variablen
length(strokedata$age)
[1] 1031
Gennemsnit - mean(x)
mean(strokedata$age)
[1] 71.85063
Median (midterste værdi) - median(x)
median(strokedata$age)
[1] 73
Mindste værdi - min(x)
min(strokedata$age)
[1] 21
Højeste værdi - max(x)
max(strokedata$age)
[1] 99
Range (mindste og højeste værdi) - range(x)
range(strokedata$age)
[1] 21 99
Variation - var(x)
var(strokedata$age)
[1] 154.3349
Standard deviation - sd(x)
sd(strokedata$age)
[1] 12.42316
Kvantiler/fraktiler - quantile(x, p)
quantile(strokedata$age, .25)
25%
64
quantile(strokedata$age, c(0.025,0.975))
2.5% | 97.5% |
---|---|
46 | 92 |
Mange af de deskriptive funktioner ignorerer ikke NA-værdier per default og vil i så fald returnere NA, men
mindre man fortæller funktionen at den skal ignorere NA-værdier med argumentet na.rm=TRUE
mean(strokedata$height)
[1] NA
mean(strokedata$height, na.rm = TRUE)
[1] 171.1203