"En ninguna parte alguien concedería que la ciencia y la poesía puedan estar unidas. Se olvidaron que la ciencia surgió de la poesía, y no tuvieron en cuenta que una oscilación del péndulo podría reunirlas beneficiosamente a las dos, a un nivel superior y para ventaja mutua"-Wolfgang Goethe-

jueves, 24 de agosto de 2017

Linealidad: método del Lack-of-fit

Lo prometido es deuda y he aquí una de las técnicas prometidas en la entrada anterior para el estudio de linealidad. Aunque realmente me gusta dejar claro que esta prueba tiene como cometido principalmente comprobar cuanto error puede aportar a las predicciones la falta de ajuste del modelo. Para hablar de linealidad creo que es preferible comprobar a cada nivel de concentración, porque un modelo que puede parecer globalmente lineal puede no serlo para ciertos niveles de concentración. Pero esa es mi opinión, y por suerte la de muchos.

Debéis disculparme que para esta entrada me ponga en plan técnico más que divulgativo, pero esta entrada tiene fines docentes, y prefiero escribirlo de esta forma.

Partimos de un conjunto de ni puntos de calibración (xi, yi) que presentan una relación lineal aparente, donde se considera que los cada valor de xi está exento de error  y los valores de yi están sujetos a errores de medida pero son homocedásticos. Los valores xi deben aparecer replicados, con lo que estarán agrupados en j (1 a nj) niveles con k (1 a nk) replicados en cada nivel, con lo que ni = nj·nk. Los datos pueden ajustarse a un modelo con c parámetros de ajuste (en regresión lineal c = 2) dando lugar a una ecuación del tipo (1). Siendo y la variable dependiente,  x la variable independiente, b1 la pendiente de la recta de regresión y b0 la ordenada en el origen. La función se obtiene fácilmente mediante el método de mínimos cuadrados minimizando la suma de cuadrados de residuales (2), que considerando la replicación se puede escribir como (3), con grados de libertad  (4).



La prueba  F de falta de ajuste o de Lack-of-fit se basa en un análisis de la varianza (ANOVA) de residuales en el que la suma de residuales, SSE, se descompone en componentes de falta de ajuste. SLF, y error puro SPE, (5) y (6) comprobando la influencia del primero en el error de los residuales. En (7) y (8) se muestra la descomposición de los grados de libertad de cada término.


Los cuadrados medios o varianzas pueden obtenerse fácilmente dividiendo las sumas de cuadrados entre sus correspondientes grados de libertad. De este modo se puede tener la siguiente tabla de ANOVA de falta de ajuste.

Tabla de ANOVA de falta de ajuste (Lack-of-fit)
La prueba de falta de ajuste consiste en calcular un valor F como el cociente entre la varianza (o cuadrado medio) de falta de ajuste y la varianza de error puro.

La hipótesis nula ha de ser entonces que no existe falta de ajuste, el modelo ajusta de forma adecuada a los datos. Si el valor de F calculado es menor que un F tabulado para α = 0.05 (95% de nivel de confianza), nj-c grados de libertad para el numerador y ni-nj grados de libertad para el denominador, se acepta la hipótesis nula. En caso contrario se rechaza y se dice que existe falta de ajuste.

Aunque os parezca tedioso, el cálculo es muy simple y se puede hacer en hoja de cálculo:

1) Obtener SSE a partir de cálculos de regresión o según la fórmula tabla.
2) Obtener SPE según la fórmula de la tabla.
3) Obtener SLF despejando en (5).
4) Dividir entre los grados de libertad indicados en la tabla para obtener MSLF y MSPE.
5) Obtener el F calculado según (9)
6) Comparar con el valor tabulado de F.

Una ventaja de este método es que está implementado en muchos entornos y software como Minitab, R, Statistica, entre otros.

Espero sea de utilidad. Más adelante hablaré del método %RE-plot, propuesto por nosotros, como ya he indicado.

CONTINUARA

No hay comentarios:

Publicar un comentario

Haz tu comentario... quedará pendiente de moderación