Ventajas y Desventajas de los Algoritmos de Regresión

Pros-contra-blog-1

Al abordar cualquier tipo de problema de Machine Learning hay muchos algoritmos para elegir, pero hay algo que debemos tener claro y es que ningún algoritmo es el mejor para todos los problemas, cada uno de ellos cuentan con sus algunos pros y sus contras, lo cual no sirve como guía para seleccionar el más adecuado.

Aunque recuerda que el rendimiento de los diferentes algoritmos de Machine Learning depende en gran medida del tamaño y la estructura de los datos.

Esta entrada te servirá de gran ayuda para seleccionar el mejor algoritmo de Machine Learning para problemas de regresión.

Regresión Lineal

Definición

Entrenar la mejor línea a través de todos los puntos de datos. Este algoritmo puede ser Regresión Lineal Simple, en donde se realiza la predicción con una sola variable, Regresión Lineal Múltiple, en donde se crea un modelo para la relación entre múltiples variables de entradas independientes y la Regresión Polinomial en el que el modelo se convierte en una combinación no lineal de las variables características.

Ventajas

  • Fácil de entender y explicar, lo que puede ser muy valioso para las decisiones de negocios.
  • Es rápido de modelar y es particularmente útil cuando la relación a modelar no es extremadamente compleja y no tiene mucha información.
  • Es menos propenso al sobreajuste.

Desventajas

  • No se puede modelar relaciones complejas.
  • No se pueden capturar relaciones no lineales sin transformar la entrada, por lo que tienes que trabajar duro para que se ajuste a funciones no lineales.
  • Puede sufrir con valores atípicos.

Son útiles

  • Dar un primer vistazo a un conjunto de datos.
  • Cuando se tiene datos numéricos con muchas características.
  • Realizar predicción econométricas.
  • Modelando las respuestas de marketing.

Pros-contra-blog-2png

Vectores de Soporte Regresión

Definición

Se basa en la construcción de un hiperplano óptimo en forma de superficie de decisión, de modo que el margen de separación entre las dos clases en los datos se amplía al máximo. Los vectores de soporte hacen referencia a un pequeño subconjunto de las observaciones de entrenamiento que se utilizan como soporte para la ubicación óptima de la superficie de decisión.

Ventajas

  • Se pueden modelar relaciones complejas, no lineales.
  • Robusto al ruido, esto se debe a que maximizan los márgenes.

Desventajas

  • Necesidad de seleccionar una buena función de kernel.
  • Los parámetros del modelo son difíciles de interpretar.
  • Requiere memoria significativa y poder de procesamiento.
  • Cuando se tiene muchos datos toma demasiado tiempo para entrenar.

Son útiles

  • Clasificación de texto e imágenes.
  • Reconocimiento de escritura a mano.

Pros-contra-blog-3

Árboles de Decisión Regresión

Definición

Dado un conjunto de datos se fabrican diagramas de construcción lógicas, que sirven para representar y categorizar una serie de condiciones que ocurren de forma sucesiva, para la resolución de un problema.

Ventajas

  • Muy fácil de interpretar y entender.
  • Rápido.
  • Robusto al ruido y valores perdidos.
  • Preciso
  • Excelente para aprender relaciones complejas, altamente no lineales. Por lo general, pueden lograr un rendimiento bastante alto, mejor que la regresión polinomial.

Desventajas

  • Los árboles complejos son difíciles de interpretar.
  • Es posible la duplicación dentro del mismo subárbol.
  • En ocasiones no es utilizado por ser un algoritmo tan sencillo y no tan poderoso para datos complejos.

Son útiles

  • Diagnóstico médico.
  • Análisis de riesgo crediticio.

Pros-contra-blog-4

Bosques Aleatorios Regresión

Definición

Es una combinación árboles de decisión tal que cada árbol depende de los valores de un vectores aleatorio probado indpendientemente y con la misma distribución para cada uno de estos.

Ventajas

  • Puede trabajar en paralelo.
  • Rara vez se sobreajusta.
  • Maneja automáticamente los valores perdidos.
  • No es necesario transformar ninguna variable.
  • No hay necesidad de ajustar parámetros.
  • Puede ser utilizado por casi cualquier persona con excelentes resultados.

Desventajas

  • Difícil de interpretar.
  • Más débil en la regresión al estimar valores en los extremos de la distribución de los valores de respuesta.
  • Parcialmente en problemas multiclase hacia clases más frecuentes.

Son útiles

  • Para casi cualquier problema de Machine Learning.
  • Bioinformática.

Pros-contra-blog-5

Estos son solo algunas ventajas de desventajas de los algoritmos de Machine Learning para regresión, esta información te puede ser bastante útil al momento de desarrollar tus proyectos.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *