Regresión Lineal Múltiple

 

 

 
 
La técnica de los mínimos cuadrados me gusta mucho por que es extraordinariamente potente y muy fácil de comprender.  Casi todo en la naturaleza se puede describir por medio de una ecuación, desde el movimiento de los planetas,  hasta el rendimiento físico de un operario a través del tiempo; desde el nivel de inventarios en un almacén en función de ventas, hasta el precio del dólar en función de la demanda del mismo. Todo, absolutamente todo, es susceptible de  ser medido, cuantificado y relacionado por medio de ecuaciones. Es cierto que nuestra capacidad de medición esta limitada (como habría dicho Heisenberg por su famoso principio de incertidumbre), pero cuando estamos tratando con objetos más grandes que electrones es muy pero muy posible realizar mediciones, hacer conjeturas sobre sus relaciones, encontrar una función o ecuación que las describa lo mejor posible, probar la misma ecuación y luego poder inferir conclusiones, hacer predicciones, etc.

Es ahí donde la técnica de los mínimos cuadrados entra a jugar: luego de tener una serie de mediciones de un conjunto de variables que inciden en otra u otras, se puede conocer cual es la función que mejor describe los datos medidos. Uno debe escoger con que tipo de función probarla, por ejemplo con una lineal o con una cuadrática, con una poli nómica o con una logarítmica  etc, cada familia de funciones se diferencia por medio de los parámetros de la misma, por ejemplo en una recta se tienen dos parámetros: Y = a + bX, que son la a (punto de corte) y la b (pendiente).

Aquí expongo un ejemplo de como utilizar el Solver del Excel para encontrar la función lineal que mejor se ajusta a una serie de datos con dos variables independientes (Esto es llamado Regresión Lineal Múltiple). El ejemplo le debe servir para que usted infiera como realizar un procedimiento  análogo si ya no tiene solamente dos variables sino cuatro, ocho o treinta y dos mil, o si ya no es una relación lineal sino que es poli nómica, exponencial o la que sea.
Suponga que tiene las siguientes mediciones:
 
X1      X2        Yi       
1 8 37
2 10 47
3 3 21
4 7 39

La función a la que se desea ajustar es del tipo: Y = a +bX1 + CX2, pero podría ser de cualquier tipo. Bueno, usted se podría hacer la pregunta: ¿Cómo se a que tipo de función ajustar? Una forma de hacerse una idea es graficar cada variable independiente con la variable dependiente (cada X con la Y), según la forma que exprese cada gráfica se puede inferir la forma de la función.

Nuestro problema se reduce a encontrar los valores de a, b y c de tal manera que se minimice el error, y el error lo podemos expresar como:

Error = (Y -Yi)2. El cuadrado es para que el error de siempre positivo.

Donde Y es el valor calculado (el que da de efectuar la operación a + bX1 + CX2) y Yi es la medición i
 
Como lo hacemos en Excel con Solver:
 

Primero hagamos el formato tal como se ve en la figura:
 

 
En las celdas A2, B2, C2 se corresponderán con los valores de a, b y c. El meollo del asunto es escribir una fórmula en la columna D que este en función de A2, B2, C2 y de cada valor que vaya tomando X1 y X2 que se encuentran en la columna A y B después de la fila 5.  Si se tuviera otra función los parámetros adicionales se escribirían a la derecha de la C  y la fórmula de la columna D (o la columna correspondiente) cambiaría según la función pero lo demás sería exactamente igual.
La fórmula de Y:

D5 =$A$2 + $B$2*A5 + $C$2*B5

a =  $A$2
b =  $B$2
X1=   A5
C  =   $C$2
X2 =  B5

Nótese que para a, b, y c se uso $$ para denotar que la referencia no cambiará para ninguna celda donde se copie y pegue la fórmula, en cambio para x1 y x2 no. La fórmula se debe copiar y pegar (o arrastrar) a las celdas D6,D7 y D8. Para la columna E la fórmula es la diferencia entre Y y Yi o sea E5=C5-D5, y se copia y pega (o se arrastra) para las demás hacia abajo. En la columna F la fórmula será la columna E al cuadrado: F5=E5^2.
En la celda F9 se dejará la suma de los errores al cuadrado, y esa será la celda cuyo valor nos interesa que sea mínimo. La pinta debe ser como se presenta a continuación:
 


Luego se debe invocar el Solver del Excel haciendo click en Herramientas luego en Solver (si no aparece chulearlo en la opción de complementos del mismo menú), le indicaremos que deseamos minimizar el valor de la celda F9 cambiando el valor de las celdas A2, B2 y C2, tal como se ve en la siguiente figura:
 
 
 
Entonces hacemos click en resolver y se tendrá:
 


Se encontró la siguiente solución:

A= 3
B= 2
C= 4.
Y = 3 + 2X1 + 4X2.

Y eso es todo.
Lo importante es que se pueda deducir la forma para hacerlo para CUALQUIER función.
Espero que esto les sea útil...
 
- Jairo.

 

Contenido :

Social