Elección del mejor modelo para el análisis de experimentos con medidas repetidas en tiempo; hormonas en cerdas durante la lactancia

E R Pérez Sánchez, E Gutiérrez Vázquez, J Herrera-Camacho¹ y J C Segura Correa²

Instituto de Investigaciones Agropecuarias y Forestales, Universidad Michoacana de San Nicolás de Hidalgo, km 9.5, carretera Morelia - Zinápecuaro, municipio de Tarímbaro, Michoacán¹ Instituto de Investigaciones Agropecuarias y Forestales, Universidad Michoacana de San Nicolás de Hidalgo, km 9.5, carretera Morelia - Zinápecuaro, municipio de Tarímbaro, Michoacán² Facultad de Medicina Veterinaria y Zootecnia, Universidad Autónoma de Yucatán. Km 15.5 carretera Mérida-Xmatkuil, Mérida, Yucatán segura52@hotmail.com

Resumen

El objetivo de este estudio fue determinar el efecto de diferentes estructuras de covarianzas en la significancia estadística y en los estimadores de los efectos fijos, tomando como ejemplo los datos de cuatro hormonas en un experimento con mediciones repetidas. El estudio se realizó en una granja comercial de tres sitios con 2400 vientres en la Piedad Michoacán, México. Se utilizaron 32 cerdas de tercer parto pertenecientes a tres grupos genéticos (11 cerdas AZ, 11 cerdas B y 10 cerdas del grupo genético N) a las cuales se les tomó 10 ml de sangre para determinación de las concentraciones de las hormonas: progesterona (P4), estradiol (E2), prolactina (PRL) e insulina (INS). Las muestras de sangre se tomaron a los 3, 6, 9, 12, 15 días de lactancia. Las determinaciones de las hormonas se hicieron por medio de radioinmonoanálisis. Los datos fueron analizados utilizando anovas para medidas repetidas y procedimientos de modelos mixtos. Los anovas fueron realizados utilizando las opciones RANDOM o TEST del programa SAS. Los modelos mixtos consideraron nueve estructuras de covarianzas: componentes de varianza (CV), simetría compuesta (CS), autogresiva (AR(1)), antedependencia (ANTE(1)), Toeplitz, no estructurada (UN), CS heterogénea, AR(1) heterogénea y Toeplitz heterogénea.

Las mejores estructuras de covarianzas que describieron los datos fueron: ANTE(1), UN, CS y CS para P4, E2, PRL e INS, respectivamente. Se observaron diferencias en los niveles de significancia de los efectos fijos, principalmente de grupo genético, dependiendo de la estructura de covarianzas utilizada. Por ejemplo, para P4 el intervalo de las significancias para grupo genético fue de P = 0.0063 para la estructura CV a P = 0.1318 para Toeplitz. El efecto del tiempo de lactancia sobre las concentraciones de hormonas fue altamente significativo para todas las estructuras (P<0.001). Las medias de cuadrados mínimos generalizados y errores estándares (EE), fueron asimismo afectados por el tipo de matriz de covarianzas. Para P4 los EE más pequeños correspondieron a la estructura más simple (CV) y los mayores a las estructuras AR(1) y Toeplitz.

En conclusión, los resultados de este estudio indican que la elección de la estructura de covarianzas afecta principalmente el nivel de significancia de la prueba de F y los errores estándares de las medias. El análisis de datos de las hormonas aquí estudiadas pero con frecuencias de medición diferentes o por periodos más cortos o prolongados a los aquí investigados, así como el estudio de otras variables de respuesta, requería la exploración de diferentes estructura de covarianzas para encontrar la más apropiada.

Palabras clave: Estructura de covarianzas, hormonas, medidas repetidas, modelos mixtos

Selection of the best model for the analysis of experiments with repeated measurements over time; hormones in lactating sows

Abstract

The objective of this study was to determine the effect of different covariance structures on the statistical significance and on the fixed effect estimates, using as an example the data of four hormones in a repeated measures experiment. The study was carried out in a three-sites commercial farm with 2400 sows in La Piedad Michoacan, Mexico. Thirty-two multiparous sows from three genetic groups (11 AZ, 11 B and 10 N sows) were used. Sows were bled and a 10 ml blood sample was taken to determine the concentration of progesterone (P4), estradiol (E2), prolactin (PRL) and insulin (INS). Blood samples were taken at days 3, 6, 9, 12 and 15 of lactation. Hormone assays were carried out by radioimmunoanalysis. Data were analyzed using anova repeated measures and mixed models procedures. The anova repeated analysis was carried out using the options RANDOM and TEST of the SAS programme. The mixed models considered nine covariance structures: variance components (VC), compound symmetry (CS), autoregressive (AR(1)), Toeplitz, unstructured (UN), heterogeneous CS (CSH), heterogeneous AR(1) and heterogeneous Toeplitz.

The anova repeated analysis gave similar results than the CS structure. The best covariance structures that described the data were ANTE(1), UN, CS and CS for P4, E2, PRL and INS, respectively. Differences were observed in the levels of significance of the fixed effects, mainly of genetic group, depending on the structure used. For example, for P4 the interval of significances for genetic group was from P = 0.0063 for the structure CV to P = 0.1318 for Toeplitz. The effect of time of lactation on the hormone concentrations was highly significant for all structures (P<0.001). The generalized least squares means and standard errors (SE), were also affected by the type of the covariance matrix. For P4 the lowest SE corresponded to the simplest structure (VC) and the greatest to the AR(1) and Toeplitz structures.

In conclusion, the results of this study indicate that the covariance structure selected affects the level of significance of the F test and the SE of the means. The analysis of the data for the hormones here studied but with different bleeding times or for shorter or longer periods, as well as the study of other response variables needs the exploration of different covariance structures in order to find the most appropriate.

Key words: Covariance structures, hormones, mixed models, repeated measures

Introducción

Los experimentos con medidas repetidas son frecuentes en las investigaciones pecuarias (Segura y Osorio 2002, ZooBell et al 2003, Wang y Goonewardene 2004) y se refieren a aquellos casos en que se hacen varias mediciones en una misma unidad experimental. En la mayoría de los casos, las múltiples observaciones por unidad experimental son tomadas a través del tiempo, aunque podrían ser en espacio, como es el caso de los experimentos en parcelas divididas. En el análisis de datos de experimentos con mediciones repetidas en tiempo, las suposiciones usuales acerca de independencia y homogeneidad de varianzas normalmente no son válidas, ya que, a menudo, las medidas hechas en un mismo animal están correlacionadas entre si y las varianzas entre mediciones pueden ser diferentes. La metodología de modelos mixtos permite analizar correcta y eficientemente los datos de experimentos con medidas repetidas, a través del modelaje de la estructura de covarianzas que consideren las correlaciones entre medidas repetidas y la presencia de varianzas heterogéneas. El ignorar la importancia de la correlación dentro de sujetos utilizando modelos de efectos fijos (procedimientos ANOVA o GLM) o modelos mixtos con estructuras de covarianzas muy simple, podrían aumentar la tasa de error tipo I (rechazo de la hipótesis nula cuando debería ser aceptada) para la prueba de los efectos fijos del modelo, mientras que un modelo muy complicado conduciría a un sacrificio en el poder y eficiencia de la prueba para los efectos fijos (Littell et al 2000; Wang y Goonewardene 2004). La elección de la estructura de covarianzas apropiada resulta en estimadores más eficientes de los efectos fijos del modelo y consecuentemente pruebas más robustas de los efectos de las medidas repetidas. Sin embargo, la selección de la estructura de covarianzas más apropiada y parsimoniosa es complicada debido a la existencia de un gran número de estructuras posibles (SAS, 2000). Los criterios más utilizados para la elección de la mejor estructura son el criterio de información de Akaike y el criterio de información Bayesiano de Schwarz (Littell et al 1998; Wang y Goonewardene 2004).

El objetivo de este estudio fue determinar el efecto de la estructura de covarianzas en los niveles de significancia de los efectos fijos y en los estimadores de los efectos fijos, tomando como ejemplo los datos de un experimento con mediciones repetidas de las hormonas progesterona, estrógenos, prolactina e insulina.

Material y métodos

El estudio se realizó en una granja comercial de tres sitios con 2400 vientres en la Piedad Michoacán México. Al inicio de la lactación las cerdas recibieron 2kg de alimento (15.5% de proteína cruda) aumentándose la cantidad progresivamente hasta alcanzar 6 kg/día. Se utilizaron 32 cerdas de tercer parto pertenecientes a tres grupos genéticos comerciales (11 cerdas AZ, 11 cerdas B y 10 cerdas del grupo genético N) a las cuales se les tomó 10ml de sangre para determinación de las hormonas: progesterona (P4), estradiol (E2), prolactina (PRL) e insulina (INS). Las muestras de sangre se tomaron durante la lactancia a los 3, 6, 9, 12, 15 días. Las determinaciones de las hormonas se hicieron por medio de radioinmonoanálisis (RIA) utilizando kits comerciales. Las condiciones ambientales y de manejo así como la determinación de las hormonas en sangre han sido descritas con anterioridad (Pérez Sánchez et al., en prensa).

Análisis estadístico

El modelo estadístico que describió los resultados de las hormonas fue:

y_ijk = m + G_i + a(G)_ij + T_k + e_ijk

donde:

y_ijk es la concentración de la hormona medida en el tiempo k de la j-ésima cerda del grupo racial i;
m es el efecto de la media general;
G_i es el efecto fijo del i-ésimo grupo racial;
a(G)_ij es el efecto aleatorio (fijo para el anova con medidas repetidas) de cerda dentro de grupo racial,

T_k es el efecto fijo del k-ésimo tiempo de medición (3, 6, 9, 12, 15 días),
e_ijk es el error aleatorio asociado con la j-ésima cerda perteneciente al i-ésimo el grupo racial el k-ésimo tiempo(día), eijk ~N(0, Vij) (aproximadamente normal con media 0 y varianza V_ij; donde V_ij es una matriz de covarianzas con bloques en la diagonal para cada cerda j perteneciente al grupo racial i. La matriz de covarianzas V_ij puede tomar diferentes formas dependiendo de heterogeneidad y relación entre las mediciones repetidas.

Los datos de las hormonas se analizaron utilizando procedimientos de análisis de varianza para mediciones repetidas, que utilizan el cuadrado medio del error de unidad experimental dentro de tratamiento para probar la hipótesis de igualdad de tratamientos y modelos mixtos, considerando diferentes estructuras de covarianza (correlaciones) de las medidas repetidas. Las estructuras de covarianzas evaluadas fueron: componentes de varianza (CV) la cual es la estructura más simple ya que asume que todas las observaciones son independientes una de otra y que no hay correlación (covarianza) entre pares de observaciones, aun cuando las mediciones se hicieron en el mismo individuo.

Esta estructura tiene varianzas iguales en la diagonal principal y ceros en los demás elementos de la matriz. La estructura de simetría compuesta (CS) considera varianzas iguales en la diagonal principal e iguales covarianzas en los demás elementos de la matriz, es decir asume una misma correlación entre observaciones independientemente de la distancia entre tiempos de medición. La estructura autoregresiva de primer orden (AR(1)) considera varianzas homogéneas . Asimismo considera que la correlaciones entre dos medidas adyacentes son iguales y que éstas declinan exponencialmente con la distancia entre mediciones .

La estructura de TOEPLITZ (TOEP) es similar a la AR(1) en que todas las mediciones próximas a la siguiente tienen la misma correlación, medidas separadas por una medición tienen la misma correlación, pero diferente de la primera, medidas separadas por dos mediciones tienen la misma correlación pero diferente de la primera y segunda y así sucesivamente. La estructura de covarianzas de primer orden y covarianzas dependientes (ANTE(1)) permite varianzas diferentes para cada medición en tiempo y correlaciones y covarianzas diferentes entre diferentes pares de medidas. La estructura de covarianzas no estructurada (UN) permite que cada término de la matriz de covarianzas sea diferente. Asimismo, se corrieron las versiones: CSH, ARH(1), TOEPH que son las versiones de las estructuras CS, AR(1) y TOEP pero considerando varianzas heterogéneas. También se probaron las estructuras CS + AR(1), CS+ARH(1) y CS+TOEP, las cuales se desecharon por tener peores valores de AICC (criterio de información de Akaike) y BIC (criterio de información bayesiano) que algunas de las estructuras anteriormente citadas.

Los anovas con medidas repetidas se corrieron utilizando las opciones RANDOM y TEST del procedimiento GLM y las nueve estructuras de covarianzas evaluadas, se corrieron utilizando la sentencia REPEATED del procedimiento MIXED (SAS 2000) la cual controla la estructura de covarianzas de los errores residuales. Las sentencias SAS utilizadas para correr los diferentes modelos se proporcionan en el Apéndice. Los datos de concentraciones de hormona se transformaron usando la función raíz cuadrada para aproximarlos a la normalidad, pero al no afectar la jerarquía de las estructuras comparadas se prefirió presentar los resultados de los datos sin transformar. Los datos transformados redujeron en 2 a 3% los niveles de significancia. La hipótesis de homogeneidad de varianzas entre mediciones se probó utilizando la prueba de Bartlett (Snedecor y Cochran 1978).

La selección de la mejor estructura de covarianzas se basó en la comparación de los criterios AICC y BIC. Estos estadísticos son funciones del logaritmo de la verosimilitudes y cuando se comparan dos estructuras aquella con los valores de los criterios más bajos indican una mejor estructura.

Resultados

Las varianzas para las hormonas P4 y E2 fueron heterogéneas (P<0.05) y para PRL e INS homogéneas (P>0.05). Los intervalos de varianzas para las hormonas P4, E2, PRL e INS fueron: 0.0134-0.0375 ng²/ml², 13.82-71.42 ng²/ml², 7.26-9.53 ng²/ml² y 0.4186-0.8756 ng²/ml², respectivamente. Las razones entre las varianzas mayor y menor para las concentraciones de P4, E2, PRL e INS fueron 2.8, 5.2, 1.3 y 2.1, respectivamente. En el Cuadro 1 se presenta la matriz de covarianzas para las cuatro hormonas.

Cuadro 1. Matriz de covarianzas y correlaciones obtenida utilizando la estructura de covarianzas no estructurada (UN) para concentraciones de hormonas durante la lactancia en cerdas*.
Día de medición	Día de medición
Día de medición	3	6	9	12	15
Progesterona
3	0.037	0.265	0.215	0.081	0.040
6	0.006	0.014	0.726	0.747	0.606
9	0.005	0.012	0.018	0.838	0.544
12	0.002	0.010	0.013	0.013	0.647
15	0.001	0.012	0.012	0.013	0.029
Estradiol
3	71.4	0.328	0.018	0.188	0.135
6	18.8	46.0	0.537	0.276	0.315
9	1.05	25.4	48.5	0.141	0.755
12	5.91	6.96	3.65	13.8	0.233
15	5.94	11.1	27.5	4.53	27.3
Prolactina
3	8.02	0.822	0.778	0.778	0.886
6	6.34	7.42	0.694	0.760	0.770
9	6.80	5.83	9.53	0.764	0.788
12	5.94	5.58	6.36	7.26	0.782
15	7.47	6.24	7.24	6.27	8.85
Insulina
3	0.761	0.361	0.001	0.019	0.293
6	0.229	0.530	0.606	0.096	0.487
9	0.001	0.348	0.622	0.223	0.402
12	0.011	0.046	0.114	0.419	0.231
15	0.239	0.332	0.297	0.140	0.876
* Correlaciones arriba de la diagonal principal; varianzas en la diagonal; covarianzas debajo de la diagonal.

Los resultados de los ANOVAs con medidas repetidas fueron similares a los obtenidos con la estructura del covarianzas CS del procedimiento MIXED. Lo que indica que para experimentos balanceados o ligeramente desbalanceados (como en este estudio) con varianzas homogéneas y similares correlaciones entre pares de medidas repetidas, los procedimientos de cuadrados mínimos (utilizados por GLM) proporcionan los mismos resultados que los procedimientos de máxima verosimilitud (utilizados por MIXED). Los resultados de los criterios de información (AICC y BIC) y los niveles de significancia obtenidos por los efectos de grupo genético y número de medición, para las estructuras comparadas, se presentan en los Cuadros 2-5. Con base en los criterios AICC y BIC las mejores estructuras de covarianzas que describieron los datos fueron ANTE(1), UN, CS y CS para las hormonas P4, E2, PRL e INS, respectivamente. Asimismo se observa, que las hormonas PRL e INS pudieron ser analizadas utilizando ANOVAs con medidas repetidas.

Cuadro 2. Criterios de información y niveles de significancia de la prueba de F para los efectos de grupo genético y número de medición para progesterona en sangre en cerdas
Estructura de covarianzas	Criterios		Efectos fijos
Estructura de covarianzas	AICC	BIC	Grupo genético	Medición
GLM random			0.1164	0.0001
GLM test			0.1164	0.0001
Componente de varianza (CV)	-122.9	-121.5	0.0063	0.0001
Simetría compuesta (CS)	-151.9	-149.1	0.1164	0.0001
Ante-dependence ANTE(1)	-197.7	-185.7	0.1000	0.0001
Autoregresiva AR(1)	-165.8	-162.9	0.1303	0.0001
Toeplitz (TOEP)	-161.0	-154.0	0.1318	0.0001
No estructurada (UN)	-192.4	-174.0	0.1229	0.0001
CS Heterogénea	-173.3	-165.5	0.0595	0.0001
AR(1) heterogénea	-188.6	-180.4	0.0720	0.0001
TOEP heterogénea	-183.4	-171.4	0.0666	0.0001
AICC = Criterio de Información de Akaike; BIC = Criterio de Información Bayesiano

Cuadro 3. Criterios de información y niveles de significancia de la prueba de F para los efectos de grupo genético y número de medición para estradiol en sangre en cerdas
Estructura de covarianzas	Criterios		Efectos fijos
Estructura de covarianzas	AICC	BIC	Grupo genético	Medición
GLM random			0.0441	0.0001
GLM test			0.0441	0.0001
Componente de varianza	1024.2	1025.6	0.0063	0.0001
Simetría compuesta	1018.7	1021.5	0.0441	0.0001
Ante-dependence	1008.7	1020.6	0.2072	0.0001
Autoregresiva	1014.2	1017.0	0.0467	0.0001
Toeplitz	1017.2	1024.1	0.0740	0.0001
No estructurada	989.1	1007.6	0.5577	0.0017
CS Heterogénea	1006.2	1014.4	0.2745	0.0001
AR(1) heterogénea	1005.6	1013.8	0.2089	0.0002
TOEP heterogénea	1002.1	1014.0	0.5335	0.0004
AICC = Criterio de Información de Akaike; BIC = Criterio de Información Bayesiano

Cuadro 4. Criterios de información y niveles de significancia de la prueba de F para los efectos de grupo genético y número de medición para prolactina en sangre en cerdas
Estructura de covarianzas	Criterios		Efectos fijos
Estructura de covarianzas	AICC	BIC	Grupo genético	Medición
GLM random			0.44590	0.4375
GLM test			0.44590	0.4375
Componente de varianza, CV	776.4	777.8	0.0412	0.9280
Simetría compuesta, CS	638.2	641.0	0.4459	0.4375
Ante-dependence, ANTE(1)	684.4	696.3	0.4645	0.6394
Autoregresiva, AR(1)	675.2	678.0	0.4489	0.4878
Toeplitz, TOEP	638.7	645.6	0.4266	0.4358
No estructurada, UN	655.8	674.3	0.4105	0.6127
CS Heterogénea	644.2	652.5	0.4994	0.4860
AR(1) heterogénea	679.6	687.8	0.4571	0.5686
TOEP heterogénea	645.2	657.1	0.4213	0.4796
AICC = Criterio de Información de Akaike; BIC = Criterio de Información Bayesiano

Cuadro 5. Criterios de información y niveles de significancia de la prueba de F para los efectos de grupo genético y número de medición para insulina en sangre en cerdas
Estructura de covarianzas	Criterio		Efectos fijos
Estructura de covarianzas	AICC	BIC	Grupo genético	Medición
GLM random			0.3048	0.7359
GLM test			0.3048	0.7359
Componente de varianza, CV	389.5	390.9	0.0905	0.8296
Simetría compuesta, CS	375.9	378.7	0.3048	0.7359
Ante-dependence, ANTE(1)	381.2	393.1	0.2688	0.7673
Autoregresiva, AR(1)	375.9	378.7	0.1608	0.7112
Toeplitz, TOEP	378.2	385.1	0.2940	0.6651
No estructurada, UN	383.2	401.7	0.5563	0.6993
CS Heterogénea	379.7	387.9	0.4761	0.7619
AR(1) heterogénea	379.1	387.3	0.2893	0.7313
TOEP heterogénea	381.2	393.2	0.4781	0.6904
AICC = Criterio de Información de Akaike; BIC = Criterio de Información Bayesiano

Se observaron diferencias en los niveles de significancia de los efectos fijos (principalmente de grupo genético) dependiendo de la estructura de covarianzas utilizada. Por ejemplo, para la concentración de progesterona en sangre el intervalo de significancia para el efecto de grupo genético fue P = 0.0063 para la estructura de covarianza CV y P = 0.1318 para la estructura TOEP. Esto demuestra la importancia de elegir la correcta estructura de covarianzas para la prueba de hipótesis de los efectos fijos en los experimentos con mediciones repetidas. El efecto del tiempo de lactancia sobre las concentraciones de hormonas fue altamente significativo para todas las estructuras (P<0.001).

Las medias de cuadrados mínimos generalizados y errores estándares (EE), fueron asimismo afectados por el tipo de estructura de matriz de covarianzas. Por brevedad sólo se presentan los datos para las hormona progesterona, sin embargo las medias y EE para otras hormonas también se vieron afectadas por la estructura de covarianzas seleccionada. En el Cuadro 6 se observa que los EE más pequeños correspondieron a la estructura de covarianzas más simple (CV) y los mayores a las estructuras AR(1) y TOEP.

Cuadro 6. Medias de cuadrados mínimos por grupo racial para progesterona en sangre, utilizando diferentes estructuras de covarianzas
Estructura de covarianzas	Grupo Genético
Estructura de covarianzas	AZ	B	N
GLM random	0.183+0.032^a	0.281+0.032^ab	0.238+0.034^b
GLM test	0.183+0.032^a	0.281+0.032^b	0.238+0.034^b
Ante dependencia, ANTE(1)	0.183+0.031^a	0.276+0.031^b	0.244+0.032^ab
Componente de varianza	0.183+0.020^a	0.281+0.020^b	0.238+0.021^ab
Simetría compuesta, CS	0.183+0.032^a	0.281+0.032^b	0.238+0.034^ab
Autoregresiva, AR(1)	0.181+0.034^a	0.282+0.034^b	0.239+0.036^ab
Toeplitz, TOEP	0.181+0.035^a	0.282+0.035^b	0.239+0.036^ab
No estructurada, UN	0.188+0.032^a	0.280+0.032^b	0.234+0.033^ab
CS heterogénea	0.182+0.030^a	0.279+0.030^b	0.241+0.032^ab
AR(1) heterogénea	0.183+0.030^a	0.279+0.030^b	0.240+0.031^ab
TOEP heterogénea	0.183+0.029^a	0.280+0.029^b	0.240+0.031^ab
^a,b Medias de grupos genéticos con diferentes superíndices indican diferencia significativa (P<0.05).

Discusión

Selección de la mejor estructura de covarianzas

Como se aprecia en los Cuadros 2-5, con base en los criterios AICC y BIC, la estructura que peor describe los datos fue la estructura de covarianzas denominada componentes de varianzas (VC), la cual corresponde a la estructura más simple. Esta estructura da valores similares a los obtenidos por el procedimiento GLM, considerando las medidas repetidas como independientes, por lo que no se recomienda su uso, para experimentos con medidas repetidas en tiempo. Sin embargo, para diseños de parcelas dividas en espacio es el más apropiado (Gil 2001, Segura datos inéditos). Para P4 la mejor estructura de covarianzas fue ANTE(1). Esta estructura permite varianzas heterogéneas y correlaciones diferentes entre pares de mediciones que disminuyen con el tiempo, lo cual es compatible con la matriz de covarianzas del Cuadro 1. Algunos estudios con mediciones repetidas de progesterona han analizado la información usando modelos mixtos con estructuras simples, posiblemente CV que es la estructura predeterminada por el programa SAS (Mejia-Guadarrama et al 2002; Stegner et al 2004) lo cual podría haber resultado en el rechazo de la hipótesis nula cuando debería ser aceptada y con estimadores de efectos fijos con EE más pequeños. Wang and Goonewardene (2004) encontraron que la estructura ANTE(1) fue la mejor en un experimento balanceado de crecimiento en novillas en la que compararon cinco estructuras de covarianzas.

Para E2 la mejor estructura fue UN lo que indica diferentes varianzas para cada medición y diferentes correlaciones entre medidas repetidas. Stegner et al (2004) en un experimento en el que midieron E2 en vacas utilizaron el procedimiento MIXED, no mencionan el tipo de estructura de covarianzas por lo que muy probablemente utilizaron la estructura CV. La mejor estructura de covarianzas para las hormonas PRL e INS fue CS, la cual supone homogeneidad de varianzas y covarianzas. Mejía-Guadarrama et al (2002) utilizaron el procedimiento MIXED para analizar la concentración de insulina en cerdas después del destete, con mediciones cada 15 min de 0815 a 1615 h pero no mencionan que estructura de covarianzas utilizaron por lo que posiblemente hayan utilizando la estructura predeterminada de SAS y sus resultados pudieran estar sesgados a menos que tuvieran varianzas homogéneas y no existieran correlaciones entre medidas repetidas.

La estructura de la matriz de covarianzas cambia para cada tipo de estudio, la frecuencia de mediciones, cuando existen datos perdidos o pérdida de combinaciones de tratamientos, varianzas heterogéneas etc. Esto indica que utilizar la estructura CV predeterminada por el programa SAS y otros programas pudiera resultar en sesgo en los niveles de significancia de la prueba de F y en los estimadores de efectos fijos.

Significancia de los efectos fijos

Como se mencionó anteriormente, los niveles de significancia de las pruebas de hipótesis (principalmente de grupo genético) se afectaron por el tipo de estructura de covarianzas utilizada. Esto demuestra la importancia de elegir la correcta estructura de covarianzas para la prueba de hipótesis de los efectos fijos en los experimentos. Similarmente, Littell et al (1998) y Wang y Goonewardene (2004) encontraron diferencias en los niveles de significancia según la estructura de covarianzas utilizada. La estructura CV rechazó más fácilmente la hipótesis de igualdad de grupos genéticos en comparación con la estructura ANTE(1), para el caso de la hormona P4, como ejemplo. Sin embargo, el uso de estructuras de covarianza más complejas no es garantía de mayor exactitud y precisión en los experimentos con mediciones repetidas. Por ejemplo, según Littell et al (1998) una desventaja de la estructura UN es que no permite tendencias en las covarianzas con el tiempo y a menudo resulta en patrones erráticos de los errores estándares. La estructura CV, proporciona resultados similares a los obtenidos con los procedimientos GLM sin considerar la existencia de medidas repetidas.

Medias y errores estándares (EE)

La medias de cuadrados mínimos fueron ligeramente diferentes para las distintas estructuras de covarianzas debido a que el experimento no estaba balanceado. Experimentos balanceados y sin datos perdidos dan similares medias de cuadrados mínimos (Cnaan et al 1997, Wang y Goonewardene 2004). Sin embargo, los EE de las medias de cuadrados mínimos para datos balanceados o no, son diferentes para las distintas estructuras de covarianzas, porque son ajustadas por los parámetros de covarianzas en el modelo mixto (Littell et al 1998). Los errores estándares para CV fueron los más bajos debido a que esta estructura supone varianzas constantes con el tiempo y observaciones independientes.

Conclusiones

Los resultados de este estudio indican que la elección de la estructura de covarianzas para el análisis de datos de experimentos con medidas repetidas en tiempo afecta principalmente el nivel de significancia de la prueba de F y los errores estándares de las medias de cuadrados mínimos. El análisis de datos de las hormonas aquí estudiadas pero con frecuencias de medición diferentes o por periodos más cortos o prolongados a los aquí investigados, así como el estudio de diferentes hormonas u otras variables de respuesta, requería el examen de diferentes estructura de covarianzas para encontrar la más apropiada.

Literatura citada

Cnaan A, Laird N M and Slasor P 1997 Using the general linear mixed model to analyze unbalanced repeated measures and longitudinal data. Statistics in Medicine 16:2349-2380.

Gil J L 2001 Comparación de los procedimientos GLM y MIXED del SAS para analizar diseños de parcelas divididas con bloques al azar Zootecnia Tropical 19(1):43-58.

Littell R C, Henry P R and Ammerman C B 1998 Statistical analysis of repeated measures data using SAS procedures. Journal of Animal Science 76:1216-1231.

Littell R C, Pendergast J and Natarajan R 2000 Modelling covariance structure in the analysis of repeated measures data. Statistics in Medicine 19(13):1973-1819.

Mejia-Guadarrama C A, Pasquier A, Dourmad J Y, Prunier A and Quesnel H 2002 Protein (lisine) restriction in primiparous lactating sows: Effects on metabolic state, somatotropic axis, and reproductive performance after weaning. Journal of Animal Science 80:3286-3300.

SAS 2000 SAS/STAT User's Guide. Version 8. SAS Institute Inc. Cary NC, USA.

Pérez Sánchez E R, Gutiérrez Vazquez E, Montes-Pérez R C, Aké López R, Centurión Castro F y Segura Correa J C 2005 (en prensa) Efecto del genotipo, peso al parto y concentración de prolactina en el intervalo destete-estro en cerdas lactantes. Veterinaria México (Enviado).

Segura J C y Osorio M M 2002 Choice of phenotypic (co)variance structure for test day records in Bos Taurus x Bos indicus cows under a dual-purpose cattle system. Livestock Research for Rural Development 14(1). Available http://www.lrrd.org/lrrd14/1/segu141.htm

Snedecor G W y Cochran W G 1978 Métodos Estadísticos. Editorial Continental SA (CECSA) México, DF .

Stegner J E, Kojima F N, Bader J F, Lucy M C, Ellersieck M R, Smith M F and Patterson D J 2004 Follicular dynamics and steroid profiles in cows during and after treatment with progestin-based protocols for synchronization of estrus. Journal of Animal Science 82:10022-1028.

Wang Z and Goonewardene L A 2004 The use of Mixed models in the analysis of animal experiments with repeated measures data. Canadian Journal of Animal Science 84:1-11.

ZoBell D R, Goonewardene L A, Olson K C, Stonecipher C A and Weidmeier R D 2003 Effects of feeding wheat middlings on production, digestibility, ruminal fermentation and carcass characteristics in beef cattle. Canadian Journal of Animal Science 83:551-557.

Apéndice

*** Programa para el análisis de datos de un experimento con medidas repetidas utilizando la opción RANDOM del procedimiento GLM del SAS;

PROC GLM;

CLASSES GENO TIEMPO ANIMAL;

MODEL P4 E2 PRL INS= GENO ANIMAL(GENO) TIEMPO/SS3;

RANDOM ANIMAL(GENO)/TEST;

LSMEANS GENO/E=ANIMAL(GENO) PDIFF STDERR;

LSMEANS TIEMPO/PDIFF STDERR;

RUN;

*** Programa para el análisis de datos de un experimento con medidas repetidas utilizando la opción TEST del procedimiento GLM del SAS;

PROC GLM;

CLASSES GENO TIEMPO ANIMAL;

MODEL P4 E2 PRL INS = GENO ANIMAL(GENO) TIEMPO /SS3;

TEST H = GENO E = ANIMAL(GENO);

LSMEANS GENO/E=ANIMAL(GENO) PDIFF STDERR;

LSMEANS TIEMPO/PDIFF STDERR;

RUN;

*** Programa para el análisis de datos de un experimento con medidas repetidas utilizando el procedimiento MIXED del SAS;

PROC MIXED;

CLASSES GENO TIEMPO ANIMAL;

MODEL P4 = GENO TIEMPO/ddfm=satterth;

REPEATED TIEMPO/TYPE=SIMPLE SUBJECT=ANIMAL(GENO);

LSMEANS GENO TIEMPO /DIFF;

RUN;

QUIT;

Nota: La estructura de covarianzas SIMPLE o CV es la opción predeterminada para TYPE = en el procedimiento MIXED. Otras estructuras pueden ser invocadas reemplazando la opción simple SIMPLE por la opción CS, AR(1), ANTE(1), TOEP, UN, CSH, ARH(1) o TOEPH. Ejemplo REPEATED TIEMPO /TYPE = ANTE(1) SUBJECT = ANIMAL(GENO);

Elección del mejor modelo para el análisis de experimentos con medidas repetidas en tiempo; hormonas en cerdas durante la lactancia

E R Pérez Sánchez, E Gutiérrez Vázquez, J Herrera-Camacho1 y J C Segura Correa2

Resumen

Selection of the best model for the analysis of experiments with repeated measurements over time; hormones in lactating sows

Abstract

Introducción

Material y métodos

Análisis estadístico

Resultados

Discusión

Selección de la mejor estructura de covarianzas

Significancia de los efectos fijos

Medias y errores estándares (EE)

Conclusiones

Literatura citada

Apéndice

E R Pérez Sánchez, E Gutiérrez Vázquez, J Herrera-Camacho¹ y J C Segura Correa²