# Diseño de experimentos. # Comparación de dos poblaciones a nivel de la medias o de la centralización. # 1. Muestras independientes. # Se piensa que la presentación de sepsis generalizada influye en los niveles de proteínas. # Se tomaron dos grupos de individuos, uno de 10 pacientes con sepsis generalizada y otro # de 14 personas sanas, con edades, sexo, etc... equiparables, anotándose el contenido de # albúmina en suero en gr/l en cada uno de ellos; los resultados obtenidos están en los # ficheros sepsis.sav y sepsis.dat. ¿Confirman los resultados la hipótesis planteada? # (modificación del estudio de Alvarez,C., Ramos,A (1986)."Lipids, Lipoproteins and # Apoproteins in Serum during Injection". Clinical Chemistry, 32 (1), 142-145.) # (datos simulados de normales de media y desviación típica: # sanos : media=37.9 desv. tipica=1.8 # sepsis: media=35.7 desv. tipica=1.8) datos<-read.table("sepsis.dat", head=T) attach(datos) x<-sepsis[grupo==1] #Sanos y<-sepsis[grupo==2] #Sepsis library(ctest) shapiro.test(x) #Contraste de Normalidad shapiro.test(y) var.test(x,y) #Comparación de varianzas basada en Normalidad t.test(x,y, var.equal=T) #Comparación de medias asumiendo normalidad y homocedasticidad. wilcox.test(x,y) #Comparación no paramétrica de poblaciones a nivel de centralización. # ¿Qué podemos decir ahora si los datos recogidos son los de los ficheros sepsis1.sav # y sepsis1.dat? # (datos simulados de normales de media y desviación típica: # sanos : media=37.9 desv. tipica=1.8 # sepsis: media=35.7 desv. tipica=3) datos<-read.table("sepsis1.dat", head=T) attach(datos) x<-sepsis[grupo==1] #Sanos y<-sepsis[grupo==2] #Sepsis shapiro.test(x) #Contraste de Normalidad shapiro.test(y) var.test(x,y) #Comparación de varianzas basada en Normalidad t.test(x,y) #Comparación de medias asumiendo normalidad y heterocedasticidad. wilcox.test(x,y) #Comparación no paramétrica de poblaciones a nivel de centralización. # 2. Muestras apareadas. # Los archivos presion.sav y presion.dat presentan las presiones sanguíneas sistólicas # de 10 individuos alcohólicos antes y después de dos meses de haber dejado la bebida. # Analiza los datos. datos<-read.table("presion.dat", head=T) attach(datos) shapiro.test(antes-despues) #Contraste de Normalidad t.test(antes,despues,paired=T) #Comparación de medias asumiendo normalidad wilcox.test(antes,despues,paired=T) #Comparación no paramétrica # Comparación de tres o más poblaciones a nivel de la medias o de la centralización. # 1. Diseño completamente aleatorizado. # En los archivo iris e iris.sav tenemos las medidas en centímetros de las variables: # 1. Longitud y anchura de los sepalos (Sepal.Length, Sepal.Width, respectivamente). # 2. Longitud y anchura de los petalos (Petal.Length, Petal.Width, respectivamente). # de 50 flores de cada una de 3 Especies de lirios (Setosa, Versicolor y Virgínica). # (Datos publicados por E. Anderson(1935) y R.A. Fisher(1936)) # Estudiemos si las anchuras media de los sepalos es la misma para las 3 # especies de lirios consideradas. data(iris) attach(iris) summary(aov(Sepal.Width~Species)) kruskal.test(Sepal.Width,Species) library(ea, lib.loc="../") npcompmult(Sepal.Width,Species) # 2. Diseño por bloques al azar. # Debido al incremento en los precios de la gasolina se han desarrollado varios # dispositivos que se colocan en los carburadores de los automóviles. Una # empresa selecciona tres de estos dispositivos para someterlos a prueba. La # empresa desea compararlos con los carburadores estándar, con el propósito # de determinar si existe un incremento apreciable de kilómetros por litro de # gasolina con el uso de estos dispositivos. La compañía selecciona cinco # automóviles para el experimento. Para controlar la variación, se planea # utilizar el mismo conductor para todo el experimento. Los datos observados están # en los archivos carbu.dat y carbu.sav. datos<-read.table("carbu.dat",head=T) attach(datos) Automovil<-factor(Automovil) summary(aov(km.litro~Dispositivo+Automovil)) friedman.test(km.litro,Dispositivo,Automovil) library(ea, lib.loc="../") nptukey(km.litro,Dispositivo,Automovil) # 3. Diseño factorial. # Se piensa que el voltaje máximo que puede proporcionar una batería puede estar # influenciado por el material por el que está fabricada y por la temperatura a # que trabaja. Se diseñó una experiencia en laboratorio con tres tipos de # material y tres temperaturas, realizándose 4 réplicas. Los datos obtenidos se # encuentran en voltaje.dat y voltaje.sav. volt<-read.table("voltaje.dat",head=T) attach(volt) temperatura<-factor(temperatura) material<-factor(material) summary(aov(voltaje~temperatura+material+temperatura:material)) # 4. Análisis de la Covarianza. # Se ha realizado un estudio medioambiental en el que se han medido # las variables nivel de ozono (en ppb) y temperatura (en grados # centígrados) en tres ciudades españolas (Badajoz, Madrid y # Sevilla) a lo largo de un año, tomándose 40 observaciones de ambas # variables para cada ciudad. Los datos obtenidos se encuentran en # los archivos ozono.dat y ozono.sav. # Se consideró que la variable temperatura podía determinar # de algún modo el nivel de ozono y que la relación # entre ambas podía variar de unas ciudades a otras. Realiza el # estudio adecuado para determinar dicha relación y si esta es la # misma en las tres ciudades. datos<-read.table("ozono.dat",head=T) attach(datos) res<-lm(ozono~temperatura+ciudad+temperatura:ciudad) # o equivalentemente res<-lm(y~temperatura*ciudad) summary(res) res1<-lm(ozono~temperatura+ciudad) summary(res1)