Inleiding Programmeren + R

Central script

» Start

Script voor gemiddelden


Als laatste voorbeeld van een script gebruiken we weer een statistische toepassing. We maken een script wat voor een vector met de naam x verschillende soorten gemiddelden uitrekent, nl het rekenkundig gemiddelde, de mediaan, het geometrisch gemiddelde en het harmonisch gemiddelde.


Kopieer en plak de bovenstaande regels in een tekstfile (Notepad, of Textwrangler), en bewaar die file met naam central.r in de working directory van R.

# mean, median, geometric mean, harmonic mean for vector x

gm <- exp(mean(log(x)))

hm <- 1/mean(1/x)

cat("Mediaan = ", median(x),"\n")

cat("Rekenkundig gemiddelde = ",mean(x),"\n")

cat("Geometrisch gemiddelde =",gm,"\n")

cat("Harmonisch gemiddelde = ",hm,"\n")

De functie cat doet ongeveer het zelfde als print, alleen kunnen we het format beter controleren, bijvoorbeeld door code voor een nieuwe regel ("\n") toe te voegen.


Eerst wat data binnen halen om te kunnen bewerken:

> # lees een dataframe in.

> cohort <- read.table("gegevens.txt", header=T)

> # maak de namen in de eerste rij van cohort beschikbaar als namen van

> # variabelen met bijbehorende inhoud (kolommen van dataframe)

> attach(cohort).

> # en laat zien om welke variabelen het gaat.

> names(cohort) 

[1] "lichaam"  "arm"  "pols"  "geslacht"  "hand"  "ogen"    

Vervolgens gaan we de verschillende gemiddelden van de variabele lichaam uitrekenen met ons zelf geschreven script central.r. Eerst zorgen we dat lichaam de juiste naam, x,  krijgt om het script goed te laten werken.

> x <- lichaam

# daarna lezen we het script in

> source("central.r")

Mediaan =  179 

Rekenkundig gemiddelde =  177.4470 

Geometrisch gemiddelde =  177.1838 

Harmonisch gemiddelde =   176.9154