"En ninguna parte alguien concedería que la ciencia y la poesía puedan estar unidas. Se olvidaron que la ciencia surgió de la poesía, y no tuvieron en cuenta que una oscilación del péndulo podría reunirlas beneficiosamente a las dos, a un nivel superior y para ventaja mutua"-Wolfgang Goethe-

sábado, 5 de agosto de 2017

Sobre linealidad en el rango de calibración analítica

Desde hace unos días he mencionado varias veces un trabajo sobre linealidad en el rango de calibración analítica [1]. Creo que es necesario explicar algunas cuestiones sobre este parámetro de calidad de un método. Una comparación detallada de los distintos métodos para evaluar la linealidad se puede encontrar en un trabajo previo [2] de uno de los autores, Francisco Raposo, y, de hecho, fue el punto de partida para despertar mi interés en este tema. Tengo que agradecer al Dr. Raposo por las discusiones previas que me llevó a plantearme este trabajo y fructificó en una colaboración, por haber insistido en intentarlo en una gran revista como Talanta y por haberse encargado él de la última parte de la revisión (muy luchada) en estos momentos en los que me daba por vencido. El tiempo nos dirá si nuestra propuesta es útil o no.

Cuando somos estudiantes y comenzamos a realizar ajustes lineales en nuestras prácticas de laboratorio nos gusta mucho que el coeficiente de correlación (r) o el de determinación (r^2) sean próximos a la unidad. Si eso es así, nuestra respuesta es lineal... Falso, simplemente si nos aceramos a la unidad podemos asegurar que el modelo empleado para ajustarse a nuestros datos es bueno, pero no que sea el mejor. Este parámetro informa sobre como es de pequeña la suma de cuadrados de residuales, pero no indica como se distribuyen los mismos. Por eso no se recomienda el empleo del coeficiente de correlación o determinación como sinónimo de linealidad. Habría que observar la distribución de los residuales.

Este valor de r^2 puede darse por válido en una práctica, pero sería un error. Si se observa con detalle, los puntos se distribuyen de forma no lineal

Otro parámetro muy usado, que yo he usado mucho para no recurrir al valor de r, es el de linealidad on-line [3], que se calcula como 100 menos la desviación estándar relativa de la pendiente. La desviación estándar de la pendiente aumenta cuando aumenta el error estándar de residuales, con lo que estamos en una caso parecido a hablar de coeficientes de correlación, es decir, te da cuenta del porcentaje de ajuste de acuerdo al error de la pendiente, pero no te dice como se distribuyen los puntos alrededor de la recta de calibración. 

Fórmula de la linealidad on-line

¿Cuál es la solución? Como siempre digo a mis alumnos, lo primero que ha de hacerse cuando se tienen datos en el laboratorio es pintarlos en un papel. Hay que hacer una gráfica, siendo a veces la inspección visual lo que da idea, si los datos se distribuyen bien alrededor de la función ajustada, de si el modelo elegido es el adecuado. Supongamos el modelo lineal, a veces es difícil ver la distribución sobre la misma recta y es preferible usar un gráfico de residuales. Este tipo de gráficos es muy interesante, porque puede indicar que la función elegida no es adecuada simplemente con observar la distribución de los residuales. También puede indicar que la distribución no es homocedástica, lo que implicaría el uso  de un modelo ponderado. Pero si tenemos un gráfico de residuales ¿cómo establecemos el límite que pueda indicar  que un punto está fuera de la tendencia de los demás. Para eso es interesante trabajar con residuos estandarizados. Hay muchas formas de estandarizar, pero nosotros proponemos los residuos Studentizados. Si un residuo supera el valor de 1.96 (aproximamos a 2), se considera que el valor es sospechoso se denomina valor extremo (outlier) si supera el 3. Para aceptar un modelo no debe haber valores sospechosos a lo largo del rango de calibración.

Gráficos de residuales Studentizados correspondiente a la recta anterior. Aunque todos están dentro de los límites se observa una distribución de los mismos que indican la idoneidad de un modelo no lineal

Otra opción es el gráfico de linealidad o de factor de respuesta, que se hizo conocido gracias a Huber [4]. Desde mi punto de vista, este método da cuenta del la variación del factor de respuesta (señal debida al analito dividida entre su cantidad o concentración) a lo largo del rango de calibración, pero poco más. Huber establece unos límites del 5% por encima y por debajo de la mediana de los factores de respuesta y establece la linealidad en el rango en que los puntos se mantienen entre esos límites. Esto funciona generalmente bien en métodos cromatográficos, pero no es así en métodos espectroscópicos. Además no tiene en cuenta que las desviaciones de los factores de respuesta pueden ser muy grandes si trabajamos a concentraciones muy pequeñas. no obstante es un método muy útil para observar cambios en la respuesta del método. 

Se puede observar que el gráfico de factor de respuesta (C) falla en este caso 

El método del lack-of-fit (falta de ajuste)  no lo incluimos en el trabajo. Podéis ver una explicación del mismo en aquellos apuntes de Excel que compartí hace años. Aunque esta entrada en el blog es una declaración de intenciones y quiero trabajar en un par de entradas más sobre linealidad. En la primera describiré exclusivamente el método de lack-of-fit y en la segunda el procedimiento que hemos denominado %RE-plot, el gráfico de errores relativos recalculados.


CONTINUARA...


Referencias

[1] J. M. Jurado, A. Alcázar, R. Muñiz-Valencia, S. G. Ceballos-Magaña, F. Raposo, Some practical considerations for linearity assessment of calibration curves as function of concentration levels according to the fitness-for-purpose approach, Talanta, 2017, 172, 221-229.
[3] L. Cuadros Rodríguez , A. M. García-Campaña , C. Jiménez, M Román, Estimation of performance characteristics of an analytical method using the data set of the calibration experiment, Analytical Letters, 1993, 26,1243-1258.
[4] L. Huber, Validation of analytical methods: review and strategy, LC-GC Europe,1998, 11,  96-105.

2 comentarios:

  1. Jose Antonio Bergillos Natoli17 de agosto de 2017, 11:34

    Buenísimo y muy útil estaré pendiente para la continuación. Me ha llamado mucho la atención que el coeficiente de correlación (r) o el de determinación (r^2) no tengan por que ser próximos a la unidad para obtener una respuesta "del todo" lineal, tomar otros caminos siempre puede ser muy útil siempre sabiendo como y cuando hacerlo, además vamos fortaleciendo las ideas que intentamos plasmar desde un primer momento, me gusta, he tomado nota.

    por cierto, me ha sacado una sonrisa:
    "Como siempre digo a mis alumnos, lo primero que ha de hacerse cuando se tienen datos en el laboratorio es pintarlos en un papel." Parece que te estoy escuchando.

    Un saludo, Jose Antonio Bergillos Natoli

    ResponderEliminar
    Respuestas
    1. Muchas gracias por tu comentario. El hecho de que r sea próximo a uno implica un buen ajuste pero no linealidad en todo el rango. A veces valores no tan próximos a uno se aceptan si en el rango de concentraciones se puede admitir más error. Esta es la filosofía del fit-for-purpose.
      Un abrazo

      Eliminar

Haz tu comentario... quedará pendiente de moderación