Analisis de Regresion

Aunque me gusta la rigurosidad matemática de las definiciones por que dan una precisión muy buena del significado, la verdad a veces pienso que el lenguaje utilizado aleja de la comprensión a los que se inician y se pierde mucho por ello.

 

Hasta los editores de Wikipedia, aquella adorable enciclopedia, caen en las definiciones abstrusas que no aportan mucho al entendimiento de los conceptos.

 

Por ejemplo, si se busca análisis de regresión en ella se encuentra: "La regresión estadística o regresión a la media es la tendencia de una medición extrema a presentarse más cercana a la media en una segunda medición" What the heck!!

 

Ahora, pongámoslo en español: El Análisis de Regresión es la búsqueda de una función que mejor describe una serie de datos. Así de sencillo. Tener una función que represente de manera muy precisa una serie de datos es increíblemente útil por que:

 

* permite predecir que sucederá con los datos en el futuro (se puede usar  para hacer predicciones o pronósticos)

 

* permite inferir que tanta relación hay entre dos fenómenos, o entre dos o mas variables.

 

* Permite saber que pasaría con los valores intermedios a los ya tomados.  Es decir, permite interpolar.

 

* Permite simplificar un problema complejo, al reemplazar un cúmulo de datos por una ecuación sencilla.

 

Pasos para realizar un Análisis de Regresión:

 

1. Recolectar y organizar la información. Normalmente se verá como una tabla de las mediciones tomadas.  Se le pone nombre a cada columna de información un nombre, o que variable representan.

 

2. Realizar gráficas de dispersión. (Estas gráficas son las que tienen dos ejes ejes y las mediciones se representan por un punto.) 

 

3. Estudiar las gráficas para inferir que tipo de relación guardan las variables.  Por ejemplo si a medida que crece la una, en la gráfica de manera casi que proporcional la otra también crece, se infiere una relación lineal.  O si a medida que una variable crece la otra crece mucho más y más rápido se puede estar en frente de una relación cuadrática o exponencial. También si en la medida que una variable crece, la otra va decreciendo más y más es probable que se tenga a la mano una relación inversa.  Para este punto es fundamental conocer las graficas de las funciones básicas: la de la recta, la parábola, la función exponencial, inversa, etc.

 

4. Con base en el punto anterior se escoge el tipo de función que gráficamente se acerque mas a la gráfica de dispersión del conjunto de datos.

 

5.  Realizar la regresión y hallar los parámetros de mejor ajuste**.

 

6.  Evaluar la bondad de ajuste de los parámetros con pruebas estadísticas: este punto es algo avanzado, no voy a entrar en detalles.

 

Para realizar la regresión en resumen se hace lo siguiente: se define una función de error como la sumatoria de la diferencia al cuadrado de la función a la que se desea ajustar los datos y los datos medidos. Se eleva al cuadrado por que todo cuadrado real es positivo.  Al minimizar esta función se encuentran los parámetros de mejor ajuste. Esto realmente se puede entender mejor con los ejemplos abajo.

 

Nota: he escrito un programa en línea para resolver varios tipos de regresiones en: http://soft.ingenieria-industrial.net/regresion_lineal.php

 

 

Social