5.1 ¿Qué es un Modelo de Regresión?


El modelo de regresión se utiliza para representar la relación entre \(Y\) y \(X\): \[Y = f(x)\]

  • \(Y\) es una variable respuesta, explicada o dependiente: que depende de otras y que tratamos de explicar/predecir.
  • \(X\), o mas bien \(X_1, X_2, \ldots, X_K\) son variables explicativas o independientes que permiten explicar/predecir \(Y\).

Una regresión es lineal, cuando la función \(f(x)\) que relaciona \(X\) e \(Y\) es una función lineal.

Teniendo \(K\) variables explicativas, la regresión lineal es:

\[ Y = \beta_0 + \beta_1 X_1 + \beta_2 X_2 + ... + \beta_K X_K + \epsilon; \epsilon \sim N(0,\sigma^2) \]

De manera que el valor de la predicción de la variable \(Y\) será:

\[ \hat{Y} = \beta_0 + \beta_1 X_1 + \beta X_2 + ... + \beta X_K \]

O lo que es lo mismo:

\[ \epsilon = Y - \hat{Y} \] Así, \(\epsilon\) será el error cometido en la previsión de \(Y\) usando el mode.


En función del número \(K\) de variables explicativas que tengamos, la regresión lineal puede ser Simple o Múltiple.

  • Simple si hay una única variable independiente (\(K = 1\)).
  • Múltiple si hay varias variables independendientes (\(K > 1\)).

Para obtener la \(\hat{Y}\) es necesario conocer \(\beta_0, \ldots, \beta_K\), es decir, falta el proceso de inferencia estadística.


La Inferencia Estadística es el procedimiento que permiten elaborar conclusiones sobre parámetros poblacionales desconocidos.

\[ \hat{Y} = \hat{\beta}_0 + \hat{\beta}_1 X_1 + \hat{\beta} X_2 + ... + \hat{\beta} X_K \]

  • Conocer o estimar a un parámetro de la distribución de una variable es posible a través de un estadístico (estadístico muestral).
  • Dado que el estadístico es obtenido a partir de una muestra y hay más de una muestra posible de ser elegida, el valor del estadístico dependerá de la muestra seleccionada.
  • Como los valores de los estadísticos cambian de una muestra a otra. Interesa contar con una medida de estos cambios para cuantificar la medida del error en el que podría incurrirse al hacer una inferencia.

Los parámetros de un modelo de regresión se pueden estimar con:

  • Mínimos Cuadrados Ordinarios (OLS)
  • Máxima Verosimilitud (ML)
  • Inferencia Bayesiana