Aprendizaje Supervisado: Random Forest Regression

El algoritmo de bosque aleatorio o Random Forest Regressión es un algoritmo de clasificación supervisado. Como su nombre lo sugiere, este algoritmo crea el bosque con varios árboles.

En general, cuantos más árboles haya en el bosque, más robusto será el bosque. Del mismo modo, en el clasificador aleatorio de bosques, cuanto mayor sea el número de árboles en el bosque, mayor será la precisión.

Aprendizaje Supervisado: Random Forest Regression

Una vez calculado cada árbol de decisión, el resultado de cada uno de ellos se promedian y con este se obtiene la predicción del problema.

Las ventajas que tiene este algoritmo son las siguientes:

  • Puede resolver ambos tipos de problemas, es decir, clasificación y regresión, y realiza una estimación decente en ambos frentes.
  • Unos de los beneficios que más llama la atención es el poder de manejar grandes cantidades de datos con mayor dimensionalidad. Puede manejar miles de variables de entrada e identificar las variables más significativas, por lo que se considera uno de los métodos de reducción de dimensionalidad. Además el modelo muestra la importancia de la variable, que puede ser una característica muy útil.
  • Tiene un método efectivo para estimar datos faltantes y mantiene la precisión cuando falta una gran proporción de los datos.

A su vez las desventajas que tiene este algoritmo son las siguientes:

  • Hace un buen trabajo en la clasificación, pero no es tanto bueno como para los problemas de regresión, ya que no proporciona predicciones precisas y continuas sobre la naturaleza. En caso de regresión, no predice más allá del rango en los datos de entrenamiento, y que pueden sobreajustar los conjuntos de datos que son particularmente ruidosos.
  • En ocasiones se puede parecer este algoritmo como una caja negra, ya que se tiene muy poco control sobre lo que hace el modelo. Puedes, en el mejor de los casos, probar diferentes parámetros y datos aleatorios.

Aprendizaje Supervisado: Random Forest Regression

Respuesta a la pregunta del video: ¿Cuál de los siguientes ejemplos podemos aplicar el algoritmo de random forest regression?

Opción 1: Predecir la enfermedad de un paciente tomando en cuenta los síntomas que presenta. Respuesta Incorrecta. Con este algoritmo no se puede predecir la enfermedad de un paciente para esto se requiere de un algoritmo de clasificación y este es un algoritmo de regresión.

Opción 2: Predecir el precio de una acción de la bolsa de valores, tomando en cuanta los datos históricos. Respuesta Correcta. Con este algoritmo se puede predecir si una acción de la bolsa el precio de una acción tomando como variables independientes los datos históricos.

Opción 3: Predecir si una persona puede vivir o morir en el hundimiento del Titanic tomando en cuenta la edad, sexo y ubicación de su cabina. Respuesta Incorrecta. Con este algoritmo no se puede determinar si una persona puede vivir o morir el hundimiento del Titanic, ya que para ello se requiere utilizar un algoritmo de clasificación y este es un algoritmo de regresión.
ebook introducción a machine learning

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *