Divulgo, luego existo: Cálculo de regresión en Excel 2007

miércoles, 24 de agosto de 2011

Cálculo de regresión en Excel 2007

En esta entrada veremos como calcular la pendiente y ordenada en el origen de una serie de datos que se correlacionan linealmente mediante el método de mínimos cuadrados (es imprescindible para la aplicación del calibrado en Química Analítica). Además se obtendrán los errores de estos parámetros y el coeficiente de correlación, entre otros parámetros interesantes.

Intentaré ser lo más gráfico posible. Una explicación más detallada sobre la regresión en Excel (pero era 2003) lo podéis encontrar en Aplicación de Microsoft Excel a la Química Analítica: validación de métodos analíticos. Aquí, lo haré de una forma más simple, explicando sólo lo que hay que ir haciendo con este software.

1) Solución gráfica (la que todos conocemos)

Se seleccionan las columnas para los valores X e Y (deben estar en ese orden) y vamos al menú Insertar, seleccionando Dispersión.

Obtenemos una gráfica de dispersión. Para dibujar la recta de mejor ajuste se pincha sobre los puntos de la gráfica y se hace click con el botón derecho del ratón. Seleccionamos la opción Agregar linea de tendencia.

Se escogen las opciones: tipo lineal, presentar la ecuación en el gráfico y el valor de R2.

Y quedará así

El problema es que no podemos conocer los errores de la pendiente y ordenada en el origen, requeridos en Química Analítica para el calculo de la incertidumbre de los resultados.

2) Mediante fórmulas
Nos situamos en una celda. Se emplea el menú Fórmulas/Insertar función. Se seleccionan las fórmulas que aparecen en la imagen de abajo.

Conocido_y se refiere a los valores de Y y Conocido_X a los de X (Señal y Concentración en nuestro caso). Se pueden escribir en la celda las fórmulas directamente, e ir señlecionando las X y las Y. O se puede usar el menú insertar función.

El problema de nuevo es que no se obtienen los errores.

3. Fórmula matricial

La fórmula se introduce de igual modo que las anteriores, pero tiene truco.

Primero seleccionamos 2x5 celdas (una matriz) e insertamos la función ESTIMACION.LINEAL(). Se seleccionan las Y y las X, se introduce un 1 o VERDADERO en las otras dos cajas del formulario.

Importante, no pulsar aceptar

Pulsar en el teclado y a la vez las teclas Control (Ctrl), la flecha de mayúsculas (encima de la de Control) y Entrar (Intro o como la llaméis cada uno)

La matriz queda rellena de la siguiente forma:

Y aquí si obtenemos los errores de la pendiente y de la ordenada, así como el error típico.

4. Usando la herramienta "Análisis de datos" de Excel

Sí, Excel tiene una macros muy buena para estos menesteres, pero hay que saber interpretarla. Lo primero (para el que no lo tenga) es activar la herramienta. Botón de Office, Opciones de Excel, Complementos. Administrar complementos de Excel, Ir.

Activar herramientas para análisis

Una vez hecho esto (solo si no se instaló la herramienta anteriormente) se puede usar desde Menú/Datos/Análisis de Datos y luego seleccionar Regresión

En el formulario seleccionamos los datos de entrada. Si hemos seleccionado los rótulos marcamos esta opción. Seleccionamos si queremos obtener gráficos de residuales, etc (leed el documento). Yo siempre prefiero los resultados en una hoja nueva.

Y se tienen estos resultados:

Pendiente y ordenada con sus errores.

Los valores de los residuales

Coeficiente de correlación

El ANOVA de regresión

Esta forma es muy completa.

Espero que os sirva

Recomiendo el libro Statistics and Chemometrics for analytical Chemistry (Miller) para el tema de la aplicación del método de los mínimos cuadrados.

75 comentarios:

AngelMtzD16 de febrero de 2012 a las 5:27
Excelente Publicación.. muchas gracias!!!!!

en verdad muchas gracias por darte el tiempo de poner todos estos procedimientos. Excelente explicación

un gran saludo

AngelMtzD Estudiante de Medicina (Farmacología)

IPN México
ResponderEliminar
Respuestas
Anónimo4 de abril de 2012 a las 11:30
Ante todo gracias por este blog tan fantástico; me gustaría que me ayudases acerca de mis dudas de como se calcula la incertidumbre de los resultados de un análisis de ácidos grasos por cromatografia de gases; estoy llevando a cabo un estudio de validacion del método utilizando materiales de referencia certificados. Cómo se calcula la incertidumbre? con la fórmula de la incertidumbre expandida, U, o calculando un intervalo de confianza, o calculando la desviacion estandar es suficiente?
Gracias por todo y espero su respuesta.
Un cordial saludo.
ResponderEliminar
Respuestas
Anónimo4 de abril de 2012 a las 14:24
Muchas gracias por su respuesta. Leeré la referencia que muy amablemente me ha indicado y espero resolver mis dudas.
Un saludo.
ResponderEliminar
Respuestas
Ana20 de abril de 2012 a las 13:38
Hola otra vez; me propone un estudio de reproducibilidad intra-lab, pero como realizo el diseño? basta con tres niveles de concentración del CRM y cinco réplicas de cada nivel en tres días diferentes? Y como obtengo la matriz de datos para el ANOVA? tiene algún ejemplo de esto desarrollado en excel?
Un saludo y muchas gracias por su inestiimable ayuda.
ResponderEliminar
Respuestas
Anónimo20 de abril de 2012 a las 19:56
Me parece fenomenal que existan blogs como estos porque realmente nos ayudan mucho. Actualmente estoy iniciandome en el tema de la validación de un método de cromatografia de gases-fid; he leido publicaciones sobre el tema pero no encuentro ninguna aplicacion practica en la que se explique como aplicar un ANOVA en excel para el estudio de la reproducibilidad intralab y la incertidumbre;dispone usted de algún ejemplo práctico en excel?
Muchas gracias, un saludo.
ResponderEliminar
Respuestas
Ana24 de abril de 2012 a las 9:59
Buenos días! Muchas gracias por su respuesta; por el momento no dispongo de las aplicaciones (statistica y SPSS) que comenta; intentaré profundizar más en el tema pero entiendo que se necesita tiempo para entender la filosofia de un ANOVA;
Un saludo!
ResponderEliminar
Respuestas
Daniel4 de mayo de 2012 a las 22:12
Buenas! Muy buen post! Sólo una pregunta... Cuando hago la regresión común (con la linea de tendencia, mostrando la ecuación y el R2 en el gráfico, señalando la intersección de la línea por el cero, me da un valor de R2; pero cuando lo hago con la matriz, señalando FALSO donde pide la ordenanada y VERDADERO donde pide los errores, me entrega otro valor de R2. A que se puede deber esto?
Cabe aclarar que si pido que me calcule la ordenada en la fórmula matricial y no señalo una intersección en la recta de regresión, me entrega el mismo valor de R2.
ResponderEliminar
Respuestas
María9 de mayo de 2012 a las 9:42
Hola!Excelente post! En relación a la validación de métodos, me gustaría que me explicase como se obtiene la recta de regresión; me explico, tengo una matriz, que no es placebo o blanco, con unos valores de analito determinados; entonces para estudiar la linealidad del método (previamente he realizado el estudio de la linealidad del sistema con patrones)añado diferentes volumenes de patrón a la muestra (por ejemplo: 0, 50, 80, 100 y 120 mL) y después que represento en abscisas? Supongo que en ordenadas tengo que representar la relación de áreas de analito/patrón interno porque estoy usando la calibración con patrón interno ((Ai/Ap.i.)pero en abscisas,que represento? la concentración añadida (ug/mL) de patrón? o la relación de áreas?.
Muchas gracias anticipadas por su atención.
ResponderEliminar
Respuestas
Anónimo22 de junio de 2012 a las 6:51
Muchas gracias me fue de mucha ayuda tu post!
ResponderEliminar
Respuestas
Anónimo31 de agosto de 2012 a las 10:41
Muchas gracias!! muy útil la información!!
ResponderEliminar
Respuestas
Anónimo7 de octubre de 2012 a las 17:45
gracias por ese aporte tan bueno. saludos.
ResponderEliminar
Respuestas
Anónimo10 de octubre de 2012 a las 12:35
Impresionanre post :O esto sirve tanto para fisicos(como yo) o para quimicos! te lo agradezco con locura!
ResponderEliminar
Respuestas
Anónimo30 de octubre de 2012 a las 13:08
¿Cómo se puee hacer incertidumbre de una medida? ¿Se puede calcular a partir de los errores de la pendiente y la ordenada en el origen de su recta de regresión? ¿Cómo?

Gracias.
ResponderEliminar
Respuestas
Gerardo12 de noviembre de 2012 a las 2:31
Buen post, muy útil. Tengo una duda, por lo que veo este método se utiliza para correlacionar una serie de puntos x con otra serie de puntos y, de tal manera que se forman las parejas coordenadas (x,y) y se determina si tienen una correlación lineal. En mi caso yo tengo una serie de datos (xcal,ycal) y los quiero comparar contra otros datos (xteo,yteo) de tal manera que los datos cal (calculado) sea lo más parecido posible a los teóricos. ¿Hay alguna manera de saber qué tanto se acercan estos valores entre sí usando la R2? De antemano, Gracias.
ResponderEliminar
Respuestas
Gerardo15 de noviembre de 2012 a las 20:00
Muchas Gracias, en efecto tengo y's comunes en cada par de datos, intentaré este método.
ResponderEliminar
Respuestas
Yessica27 de febrero de 2013 a las 19:35
Gracias por la explicación, realmente muy buena
ResponderEliminar
Respuestas
Anónimo2 de marzo de 2013 a las 21:55
y donde esta el analisis de los resultados?
ResponderEliminar
Respuestas
Anónimo20 de abril de 2013 a las 4:32
gracias es una explicación excelsa,justo lo que estaba buscando
ResponderEliminar
Respuestas
Daniel Algeciras23 de mayo de 2013 a las 16:14
Realmente fantástico, fácilmente uno puede realizar todo el procedimiento paso a paso y sin equivocarse. Tu post está como decimos vulgarmente en Colombia "anti brutos".
Mil gracias, un abrazo y sigue adelante!
ResponderEliminar
Respuestas
Marcos24 de mayo de 2013 a las 0:03
Gracias a ti por comentar.La verdad es que lo dejé listo para mis alumnos y por eso está tan "mascadito" como decimos en mi tierra. Un abrazo
ResponderEliminar
Respuestas
Camila Valdes4 de septiembre de 2013 a las 18:54
Muchas gracias por la explicación, quedatodo muy claro. Quería consultarte si se pueden hacer otro tipo de regresiones en EXCEL sin necesidad de realizar el método gráfico, por ej una regresión polinómica grado 2?
Un abrazo, muchas gracias!
ResponderEliminar
Respuestas
Anónimo11 de septiembre de 2013 a las 18:57
Gracias por tu dedicación. este post me ha ayudado a resolver una cuestión que me estaba volviendo loco.
ResponderEliminar
Respuestas
Unknown29 de octubre de 2013 a las 13:21
muchas gracias me sirvioo muchisimoo !saludos!execelente blog
ResponderEliminar
Respuestas
Álvaro3 de enero de 2014 a las 21:41
Buenisimo post!! Me sirvió de mucha ayuda para realizar un ejercicio de química analítica. Muchas gracias por tus aclaraciones y sigue así que ayudaras a mas de uno como a mi. Saludos y buena suerte!!
ResponderEliminar
Respuestas
Anónimo4 de enero de 2014 a las 12:32
¿Cómo se realiza la combinación de teclas en Mac?, porque a mi con ctrl+shift+enter no me sale :S
ResponderEliminar
Respuestas
Anónimo31 de enero de 2014 a las 19:53
Saludos estimado, quisiera saber como podría aplicar este proceso de calculo a los temas de calibración de presión o temperatura??

Por cierto Muy bueno el Blog
ResponderEliminar
Respuestas
Anónimo6 de febrero de 2014 a las 19:00
En Mac = fn+cmd+intro
ResponderEliminar
Respuestas
Unknown25 de marzo de 2014 a las 6:59
Muchas gracias, me ayudaste a resolver un gran problema, no lograba activar el complemento.

Saludos :)
ResponderEliminar
Respuestas
Anónimo19 de junio de 2014 a las 6:43
Muchísimas gracias por compartir este blog. Cuando hice mi tesis hace un montón de años tuve que hacerme las fórmulas en excel a mano!!!! Si hubiera tenido esto, la cantidad de tiempo que me hubiera ahorrado.

Ahora trabajo en industria farmacéutica y esto me viene fenomenal, pero me surge una duda, ¿como se puede validar una hoja excel que realiza estos cálculos estadísiticos? Para poder utilizar hojas excel en rutina tenemos que validarlas, es decir, demostrar que calculan correctamente, ¿tienes algún protocolo o ejemplo?

Muchas gracias
ResponderEliminar
Respuestas
Anónimo15 de noviembre de 2014 a las 11:41
Muy buen post, el único que he visto que lo explique tan bien y tan claro. ¡¡ GRACIAS Y ENHORABUENA !!
ResponderEliminar
Respuestas
Unknown23 de diciembre de 2014 a las 18:19
Hola, buenas.. he estado tratando de obtener mediante calculos la funcion exponencial de mi tabla de valores, la ecuacion de la linea de tendencia que obtengo de excel es exacta pero no se como llega a ese resultado.. me podrías ayudar con ello?
ResponderEliminar
Respuestas
Anónimo10 de enero de 2016 a las 17:31
Hola,
¿como se calcula el punto de cruce de dos ecuaciones conocidas utilizando solver?
Gracias
ResponderEliminar
Respuestas
The Mule3 de abril de 2016 a las 15:11
Mil gracias
ResponderEliminar
Respuestas
Unknown4 de junio de 2016 a las 2:41
tras todo este tiempo sigue siendo algo muy pero muy util, muchas gracias :)
ResponderEliminar
Respuestas
Noelia16 de junio de 2016 a las 14:37
Buen día, quería consultarle como se calcula el Fcritico en el análisis de varianza? Muchas por brindarnos este espacio para despejar las dudas
ResponderEliminar
Respuestas
Alfredo12 de diciembre de 2016 a las 18:46
Hola, muchas gracias por la información !
Le consulto, cuando se evalúa una curva de calibración, cómo se interpretan los resultados de la ESTIMACION LINEAL ? Es decir, que significan los valores de residuales, F, los diferentes errores...? y si tienen algún límite de aceptación para la NO aceptación de dicha curva de calibración....
Muchas gracias !

ResponderEliminar
Respuestas
Unknown11 de enero de 2017 a las 1:00
Mil gracias por la información, es muy útil.
ResponderEliminar
Respuestas

Añadir comentario

Haz tu comentario... quedará pendiente de moderación

Etiquetas

miércoles, 24 de agosto de 2011

Cálculo de regresión en Excel 2007

75 comentarios: