Introducción a la librería Scikit-Learn de Python

Scikit-learn es probablemente la librería más útil para Machine Learning en Python, es de código abierto y es reutilizable en varios contextos, fomentando el uso académico y comercial. Proporciona una gama de algoritmos de aprendizaje supervisados y no supervisados en Python.

Este librería está construida sobre SciPy (Scientific Python) e incluye las siguientes librerías o paquetes:

Scikit Learn 1

  • NumPy: librería de matriz n-dimensional base
  • Pandas: estructura de datos y análisis
  • SciPy: librería fundamental para la informática científica
  • Matplotlib: trazado completo 2D
  • Ipython: consola interactiva mejorada
  • SymPy: matemática simbólica

Para implementar scikit-learn, primero se debe importar los paquetes anteriores, para poderlos implementar en la programación. Se pueden descargar estos paquetes usando las líneas de comando o si estás usando Jupyter estos ya vienen instalados en este IDE.

Componentes de scikit-learn

La librería de scikit-learn viene cargado con muchas funciones, a continuación se explican algunas de ellas:

Algoritmos de aprendizaje supervisados

La gran mayoría de los algoritmos de Machine Learning que entran en la clasificación de aprendizaje supervisado forman parte de scikit-learn, desde los modelos lineales generalizados, como lo es regresión lineal, como las máquina de vectores de soporte (SVM), árboles de decisión y hasta los métodos bayesianos, todos ellos son parte de las herramientas de scikit-learn.

Validación cruzada

Existen varios métodos para verificar la precisión de los modelos supervisados y esta librería cuenta con las instrucciones necesarios para poder implementar estos métodos sin tanto esfuerzo.

Algoritmos de aprendizaje no supervisados

Igual que los algoritmos de aprendizaje supervisados, esta librería cuenta con una gran variedad de algoritmos disponibles para aprendizaje no supervisado, comenzando por la agrupación, el análisis factorial, el análisis de componentes principales y las redes neuronales no supervisadas.

Varios conjuntos de datos o dataset

Este librería pone a disposición varios dataset que son muy útil para que puedas practicar tus conocimientos de Machine Learning con Python, implementando esta librería. Varios de estos dataset los utilizaremos a los largo de este curso.

Extracción y selección de características

Esta librería es muy útil para extraer características de imágenes y texto, así como también para identificar atributos significativos a partir de los cuales crear modelos supervisados.

Comunidad

Una de las principales razones detrás del uso de herramientas de código abierto es la gran comunidad que tiene, lo mismo sucede para scikit-learn. Hay alrededor de 35 colaboradores hasta la fecha mejorando esta librería.

Scikit Learn 2

Como se puede observar scikit-learn es una librería muy importante dentro de Machine Learning, acá solamente se ha cubierto los aspectos básicos para que puedas empezarla utilizar en tus proyectos, a medida que la utilices y la practiques conocerás muchas más características de la misma.

 

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *