6.1 Modelos Lineales Generalizados

Los Modelos Lineales Generalizados son una extensión de los modelos lineales clásicos. Un modelo lineal se basa en un vector de observaciones \(\mathbf{Y}\) con \(n\) componentes, que son una realización de una variable aleatoria \(\mathbf{Y}\) cuyas componentes están independientemente distribuidas con media \(\mu\). Un modelo lineal puede ser descrito como: \[\mathbf{Y} = \mathbf{\mu} + \mathbf{\epsilon}\]

La parte sistemática de un modelo es una especificación para \(\mu\) en función de un número pequeño de parámetros, \(\beta_1, \ldots, \beta_p.\) Esa especificación se hace de la siguiente manera: \[ \mu_i = \sum_{j=1}^p X_{ij}\beta_j; i=1,\ldots,n. \]

O en forma matricial, \[ E(\mathbf{Y}) = \mathbf{\mu} = \mathbf{x} \mathbf{\beta} \]

donde \(\mathbf{X}\) es una matriz \(n \times p\), con las covariables o regresoras del modelo. Para la parte aleatoria se supone independencia y varianza constante de los errores.

En un modelo lineal clásico, se tiene que: \[ \mathbf{\epsilon} \sim N(0, \sigma^2 \mathbf{I}) \]

Por tanto un modelo lineal clásico puede ser resumido de la forma: \[ \begin{align} \mathbf{Y} & \sim N(\mathbf{\mu}, \sigma^2 \mathbf{I}) \\ E(\mathbf{Y}) & = \mathbf{X}\mathbf{\beta} \\ Var(\mathbf{Y}) & = \sigma^2\mathbf{I} \end{align} \]

La generalización de los modelos lineales incluye una especificación de tres aspectos principales:

  • Las componentes de \(\mathbf{Y}\) tienen distribución normal con varianza constante y son independientes.
  • En la parte sistemática, las covariables, \(x_1, x_2, ..., x_p\), producen un predictor lineal \(\eta\), dado por:

\[ \eta= \sum_{j=1}^p X_{ij}\beta_j \]

  • La relación entre los componentes sistemáticos y aleatorios se hace a través de una función de manera que:

\[\mathbf{\mu}=\mathbf{\eta}\]

Los Modelos Lineales Generalizados o MLGs permiten dos extensiones. La primera extensión está en la función de enlace, que es la parte del modelo que determina la relación entre la media de la variable respuesta y las covariables. Esta función de enlace, ahora, podrá ser cualquier función monótona diferenciable y generalmente denotada por \(g(\mu)\). La segunda extensión reside en la distribución especificada para la componente aleatoria. En los MLGs esta puede ser de la familia exponencial, de la cual la distribución normal forma parte.

Se supone que si \(\mathbf{Y}\) tiene una distribución de la familia exponencial para unos específicos \(a(\cdot), b(\cdot)\) y \(c(\cdot)\) se asume la siguiente forma:

\[ f_Y ( \mathbf{Y} | \eta,\phi) = \exp \left\{ \dfrac{\mathbf{\eta} - b(\eta)}{a(\phi)} + c(\mathbf{Y},\phi) \right\} \]

El parámetro \(\phi\) es llamado parámetro de dispersión y, si es conocido, llamamos a su familia ``de familia exponencial lineal de parámetro canónico \(\theta\)’’. Utilizando la ecuación anterior y algunas relaciones, se puede obtener expresiones para la media y la varianza de \(\mathbf{Y}\) de la siguiente manera:

\[ \begin{align} E(\mathbf{Y}) & = b'(\eta) \\ Var(\mathbf{Y}) & = a(\phi)b''(\eta) \end{align} \]