Dato perdido 1 Causas 2 En diseño completamente al azar

Dato perdido
Dr. Jesús Alberto Mellado Bosque
1 Causas
Un dato se pierde por razones meteorológicas, por mal manejo, por vandalismo,
enfermedades imprevistas, por aplicar un tratamiento que no corresponde o por
cualquier situación ajena al investigador. En todos los casos se considera una falla en el
experimento, ya que el número de grados de libertad se reducen. El máximo número de
datos que se permite declarar perdidos es el 10% siempre y cuando estén repartidos en
diferentes tratamientos.
2 En diseño completamente al azar
En el diseño completamente al azar no se tienen consecuencias graves, solo se considera que
cada tratamiento tiene diferente número de repeticiones.
3 En diseño bloques al azar
En el diseño bloques al azar no se permiten los datos faltantes, así que se aplican ciertas
ecuaciones para calcular los datos. Para el caso de un dato la ecuación es como se muestra.
Además los grados de libertad del total se le restan el número de datos calculados
Donde r es el número de repeticiones, t el número de
tratamientos, B la suma del bloque donde se
recuperará el dato, T es la suma del tratamiento donde
se recupera el dato y G es la suma de todos los datos.
Ejemplo
Suponiendo que se perdió el
dato del tratamiento 2 del
bloque 3. Se obtienen las
sumas del renglon y la columna
y se aplica la fórmula:
Trat 1
Trat 2
Trat 3
rB + tT - G
X = ----------------------(r – 1)(t – 1)
Bloque 1 Bloque 2 Bloque 3 Bloque 4
13
12
13
11
11
14
12
9
8
11
9
24
37
123
4(24) + 3(37) – 123
X = --------------------------------- = 14
(4 – 1)(3 – 1)
Se ubica el dato 14 en la casilla vacía y los GL del total serán 10 y los del error 5
4 Para capturar un dato perdido en SAS
El dato será substituido por un punto “.”, No se debe dejar la casilla en blanco y se debe
especificar el tratamiento y el bloque al que corresponde.
Trat 1
Trat 2
Trat 3
rep 1
3.2
5.2
4.6
rep 2
4.1
5.4
5.4
rep 3
4
.
5.6
rep 4
3.6
4.8
5.5
Trat
En SAS el diseño bloques al azar se considera un diseño
factorial, pero al identificar que para cada tratamiento y
cada bloque solo hay una repetición, se calcula como
bloques al azar.
1
1
1
1
2
2
2
2
3
3
3
3
Bloque Prod
1
3.2
2
4.1
3
4
4
3.6
1
5.2
2
5.4
3
.
4
4.8
1
4.6
2
5.4
3
5.6
4
5.5
5 Diseño bloques incompletos
Cuando las unidades experimentales no son homogéneas, es decir, existen algunas diferencias
entre ellas, entonces hay que separarlas en bloques. Por ejemplo, si se va a probar una nueva
dieta, pero los animales que se van a usar tienen diferente índice corporal, entonces se
agrupan en bloques, ya que seguramente la dieta tendrá diferentes resultados en animales
desnutridos que con sobrepeso.
En algunas ocasiones los tamaños de los bloques son mas pequeños que el número de
tratamientos, por ejemplo, en un bloque hay 5 animales pero hay que probar 7 tratamientos.
En este caso se usa el diseño “bloques incompletos”. En cada bloque se van sorteando los
tratamientos que se van a usar, pero con planeación para que ningún tratamiento tenga mas
apariciones que los demás. Cuando un tratamiento tiene mas apariciones que los demás se
retira del sorteo. De alguna forma cuando un bloque está incompleto se pensaría que los
datos faltantes son perdidos, pero para no calcular todos los datos se opta por el diseño
“balanceado”
Cuando se logra que los tratamiento aparezcan el mismo número de veces, al diseño se le
llama “Bloques incompletos Balanceados”.
Ejemplo:
Bloque 1  tratamientos: 1, 2, 3
Bloque 6  tratamientos: 1, 4, 5
Bloque 2  tratamientos: 1, 2, 4
Bloque 7  tratamientos: 2, 3, 4
Bloque 3  tratamientos: 1, 2, 5
Bloque 8  tratamientos: 2, 3, 5
Bloque 4  tratamientos: 1, 3, 4
Bloque 9  tratamientos: 2, 4, 5
Bloque 5--> tratamientos: 1, 3, 5
Bloque 10  tratamientos: 3, 4, 5