8.1 Aprendizaje supervisado
En el aprendizaje supervisado existen una serie de características (o variables, variables independientes, variables predictoras, columnas, features) que vamos a utilizar para decir algo de otra variable objetivo (o target, variable respuesta, variable dependiente). Ese decir algo puede ser predecir el valor que puede tomar la variable objetivo en función de las características disponibles o intentar explicar porqué se comporta como se comporta.
Pongamos dos ejemplos. En una empresa eléctrica quieren desarrollar un modelo que les permita detectar el fraude en los contadores. En este caso, tendremos disponibles una serie de características como información del contrato del cliente (fecha de alta, datos demográficos), consumos, etcétera. También tendremos disponible la información obtenida de una campaña de inspecciones que han realizado para una muestra de los clientes y lo que se busca es extraer un patrón de fraude de tal forma que dadas las características de un cliente concreto, el modelo sea capaz de devolver una probabilidad de que el cliente esté cometiendo fraude. Es decir, sea \(X = (X_1, X_2, \ldots, X_n)\) el vector de las características e \(Y\) el valor de la variable objetivo que, en este caso, toma valores \(0\) y \(1\), estamos buscando
\[ P(Y = 1|X) \]
En este caso, lo que interesa es detectar el fraude con la mayor precisión posible.
Otro ejemplo podría ser el de que se quiera desarrollar un modelo para conceder o no un crédito pero que seamos capaces de saber porqué el modelo acepta o deniega un crédito.
En el primer ejemplo, buscaremos un modelo muy preciso aunque no seamos capaces entender porqué da las predicciones que da y sería conveniente el uso de modelos propios del Machine Learning. En el segundo ejemplo, el interés es justo al contrario, queremos entender el comportamiento del modelo aunque esto suponga un detrimento de la capacidad predictiva y podríamos utilizar modelos más clásicos.
Este tipo de aprendizaje está conformado por técnicas en las que tanto las características como la variable objetivo pueden ser de diversa naturaleza (variables binarias, reales, categóricas, etcétera).
8.1.1 Una reflexión
La crítica principal que se hace a los algoritmos de Machine Learning es que es complicado entender la naturaleza de las predicciones. En los últimos años están surgiendo iniciativas que permiten darle una capa explicativa a este tipo de modelos. La iniciativa con más repercusión es LIME.
Ahora bien, el éxito de los modelos de machine learning frente a otros más clásicos se basa en que son capaces de adaptarse y detectar patrones complejos. Pero en la realidad, no siempre se tiene porqué dar un patrón complejo y podría ser suficiente con un modelo clásico.
Es fundamental entender la estructura de los datos y probar distintos modelos para escoger el más útil para el problema.