Diferencias entre el modelado estadístico y Machine Learning

Diferencia estadistica y ML

Una duda que surge cuando se inicia en el mundo de Machine Learning es qué diferencia hay entre las estadísticas, o mejor dicho el modelado estadístico, y el aprendizaje automático o Machine Learning, es cierto que ambos conceptos tienen superposición en objetivos, que es el de aprender de los datos, y en algoritmos, como el de regresión lineal, pero aún asi ambos conceptos son diferentes, por lo que comencemos a definir cada uno de ellos.

Definición

El modelado estadístico es la formalización de las relaciones entre variables en los datos en forma de ecuaciones matemáticas, acá las estadísticas son sobre muestras, población e hipótesis.

Machine Learning, por su parte, es un algoritmo que puede aprender de los datos sin depender de la programación basada en reglas, acá se trata de predicciones, aprendizaje supervisado, aprendizaje no supervisado.

Área de estudio

El modelado estadístico es un subcampo de las matemáticas, que trata de encontrar relaciones entre las variables para predecir los resultados.

Por su parte, Machine Learning es un subcampo de la ciencia de la computación y la inteligencia artificial. Se trata en la construcción de sistemas que pueden aprender de los datos sin programación explícita.

Origenes

El modelado estadístico y Machine Learning nacieron en diferentes épocas. El modelado estadístico ha existido por siglos, sus origenes datan del siglo XVII. Sin embargo, Machine Learning fue definido más recientemente por científicos informáticos por la década de 1950, floreciendo en los 90, emergiendo de la informática y evolucionando del estudio del reconocimiento de patrones y la toería del aprendizaje computacional en la inteligencia artificial.

Cantidad de datos

Los algoritmos de Machine Learning pueden predecir datos sobre la marcha y son capaces de aprender de billones de observaciones, una por una. Se utiliza mejor con datos que tienen una gran cantidad de atributos y una número de observaciones.

Por parte el modelado estadístico utiliza una pequeña cantidad de datos con menos atributos y, como tal, existe una buena posibilidad de que se produzca un ajuste excesivo.

Suposiciones en los datos

Los modelos estadísticos incorporan un conjunto de supociones sobre la generación de los datos observados y datos similares de poblaciones más grandes.

Por su parte, Machine Learning no requiere suposiciones previas sobre las relaciones subyacentes entre las variables, solo debe ingresar todos los datos que tenga, y el algoritmo procesa los datos y descubre patrones, con los cuales puede hacer predicciones sobre el nuevo conjunto de datos. Machine Learning trata un algoritmo como una caja negra, siempre y cuando funcione.

Esfuerzo humano

Machine Learning es la ciencia de hacer que las computadoras actuén sin estar explicítamente programadas, por lo tanto, se requiere un mínimo esfuerzo humano, ya que la carga de trabajo involucrada en la informática se coloca directamente en la máquina, ya que se encuentra “en forma” y “entrenada” para encontrar patrones en los datos.

Por el contrario, los estadísticos deben comprender cómo se recopilaron los datos, las propiedas estadísticas del estimador, la distribución subyacente de la población que está estudianod y los tipos de propiedades que espera si hicera el experimento muchas veces. En otras palabras, se requiere que el modelador comprenda la relación entras las variables antes de ingresar los datos.

Puede parecer que Machine Learning y el modelado estadístico son dos ramas diferentes del modelado predictivo, pero la diferencia entre ambos se ha reducido significativamente en la última decada, ambas ramas aprendieron mucho el uno del otro y continuarán acercándos en el futuro.

Sin embargo, comprender la asociación y conocer sus diferencias permite a los interesados ampliar sus conocimientos e incluso aplicar métodos que están fuera de su campo de experiencia. Esto es lo que ahora se le conoce como la “ciencia de datos” y que apunta en cerrar la brecha. La colaboración y la comunicación entre estas dos disciplinadas basadas en datos, nos permite tomar mejores decisiones que finalmente afectarán positivamente nuestra forma de vida.

2 thoughts on “Diferencias entre el modelado estadístico y Machine Learning”

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *