Instalación y configuración de librerías para Python
Resumen
Antes de iniciar en el mundo de la programación y el análisis de datos con Python, es esencial asegurarse de que el entorno de desarrollo esté correctamente configurado. Un entorno adecuado es la base para que proyectos complejos fluyan sin inconvenientes, evitando pérdidas de tiempo y frustraciones. Este artículo guiará paso a paso cómo preparar el terreno para trabajar con Scikit-learn, una biblioteca esencial para el aprendizaje automático en Python, y otras herramientas que aumentan nuestra eficiencia y poder de análisis.
¿por qué es importante validar las librerías y el entorno de desarrollo?
Trabajar con Python puede presentar desafíos debido a la variedad de sistemas operativos, versiones de Python y dependencias entre librerías. Realizar una validación adecuada desde el comienzo permite identificar y resolver problemas que puedan aparecer, ahorrando tiempo y minimizando las complicaciones en etapas avanzadas del desarrollo.
¿qué librerías son esenciales para comenzar con scikit-learn?
Scikit-learn es una herramienta poderosa para tareas de aprendizaje automático y depende de ciertas bibliotecas para su correcto funcionamiento:
NumPy: Esencial para operaciones de alto rendimiento sobre arreglos. Requiere la versión 1.11.0 o superior.
SciPy: Necesaria para operaciones matemáticas y estadísticas avanzadas. Scikit-learn funciona con la versión 0.17.0 en adelante.
Joblib: Utilizada para la serialización eficiente de grandes estructuras de datos, compatible con cualquier versión superior a 0.11.
Adicionalmente, Python debe estar en su versión 3.5 o superior.
¿cuáles librerías complementan a scikit-learn para el análisis de datos?
Existen librerías que, aunque externas a Scikit-learn, son altamente recomendadas para facilitar el manejo de datos y la visualización:
Pandas: Es como una hoja de cálculo pero en código Python, permite gestionar tablas y realizar operaciones como filtrados, agregaciones y búsquedas. Requiere conexión a internet estable para su instalación, recomendada la versión 0.25.3 o superior.
Matplotlib: Biblioteca para la visualización de datos que facilita la creación de gráficos, compatible con la versión 3.1.0 o superior.
¿cómo verificar e instalar las librerías necesarias?
Para comprobar si una librería está instalada y proceder a su instalación en caso de que no lo esté, se utiliza el gestor de paquetes pip. Aquí algunos comandos útiles:
Para NumPy: python -m pip install numpy
Para SciPy: python -m pip install scipy
Para Joblib: python -m pip install joblib
Para Pandas: python -m pip install pandas
Para Matplotlib: python -m pip install matplotlib
Cada comando instalará la versión más reciente o actualizará la ya existente.
¿cómo instalar y verificar scikit-learn?
Después de instalar las librerías auxiliares, se procede con la instalación de Scikit-learn:
Instalación con pip: python -m pip install scikit-learn
Verificación de la instalación abriendo una consola de Python y ejecutando:
import sklearn
print(sklearn.__version__)
Esto retornará la versión de Scikit-learn que se ha instalado en el entorno.
Recuerda que, en caso de enfrentar problemas durante la configuración o tener dudas adicionales, puedes buscar ayuda en la comunidad o foros especializados. Las complicaciones suelen ser comunes, pero hay una solución para casi cada caso. ¡Ahora estás listo para comenzar a trabajar en tus proyectos con Scikit-learn! Mantente curioso y abierto al aprendizaje, y los obstáculos técnicos que surjan se convertirán en escalones que te llevan hacia una mayor maestría en el análisis y el aprendizaje automático.
les dejo un truquito:
pueden crear un archivo llamado: requirements.txt
y dentro ponen todo lo que necesitan de la siguiente manera(el nombre de las librerias):
numpy
scipy
joblib
pandas
matplotlib
scikit-learn
y en su ambiente virtual ejecutan el siguiente comando:
pip install -r requirements.txt
Y así ya tienen en un archivo con los requerimientos de su proyecto y pueden ir agregando las librerías que necesiten y solo ejecutar un comando :)
Jaja gracias!
Este método también facilita el despliegue en la nube, por ejemplo, App Engine de Google Cloud lee el archivo requirements.txt e instala todas las librerías allí descritas.
Soy el único que siente que el profesor transmite mucha confianza a la hora de hablar?
Sii, es verdad, y por esto el curso pinta que es excelente Jajaja
Así es!!!
Pasos para instalar librerías
Instalación de librerías
instalación de librerías que vamos a usar en el proyecto en el entorno de trabajo
imprimir la versión que estamos trabajando print(sklearn.__version__)
Gracias buen summary!
las librerias usadas son: numpy, scipy, pandas, matplotlib y scikit-learn
en anaconda podemos usar conda list para ver las librerias isntaladas y si usamos conda install anaconda se instalan todas las librerias automaticamente y otras mas que son utiles
Bro, te amo!! JJAJA
yo voy a usar google colab
#team_colab
gogle colab es una gran herramienta pero deberias de darle la oportunidad visual studio code.
Cuando se crean ambientes virtuales "entorno" como lo llamo Ariel, también, se conoce como (.env, .venv y venv); todas las dependencias que se instalan se hacen en el ambiente virtual, por lo que si haces pip freeze podrás visualizar todas las librerias instaladas en el proyecto!
ATENCIÓN: Para que esto funcione, tenemos que estar atentos de que el ambiente virtual este activado
.venv\Scripts\activate.bat en Windows
y
source .venv/bin/activate en Linux y MacOS
Otra forma para conocer las versiones instaladas es escribiendo
pip freeze
Y para guardarlas en un archivo
pip freeze > requirements.txt
Así es !!
Por si quieren instalar todas la bibliotecas con un solo comando:
Una vez instaladas todas las librerías podemos saber cómo quedó conformado nuestro entorno utilizando el siguiente comando:
<py -m pip freeze>
Este comando nos da un listado de todas las versiones de las librerías en el formato para armar el archivo requirements.txt
Mas información sobre entornos virtuales e instalación de librerías de python en el Curso de Python Intermedio en la sección de Entorno virtual. Además, aprenderás a registrar las librerías instaladas en tu entorno en un archivo (requeriments.txt) para compartir tu proyecto o subirlo a producción.
Existen distintas alternativas para el uso de scikit.-learn, uno de ellas es Google Colab, les dejo el link por si quieren conocer más al respecto:
Nota: Para salir del Shell de Python después de comprobar la versión de Python como lo muestra en el video, se sale con exit() y enter.
Otra forma de comprobar que este instalado correctamente y la versión de la biblioteca es con el comando: python -m pip show Nombre_Del Paquete
Y para comprobar o simplemente listar los paquetes de nuestro entorno virtual es con: pip freeze , o con: pip list
En caso de que al intentar hacer el
import sklearn
dentro del shell de python les de el siguiente error:
RuntimeError:The current Numpyinstallation(PATH) fails to pass a sanity check due to a bug in the windows runtime.
La solución momentanea es instalar la versión 1.19.3 de numpy.
python -m pip install numpy==1.19.3
Que buena clase!!!
¿Qué ventaja tiene implementar le entorno virtual e instalar las librerias frente a importarlas directamente en el archivo Python?
Las ventajas de crear entornos virtuales es que puedes instalar las versiones de las librerías que utilices en tu proyecto, no en todos los proyectos utilizamos siempre las mismas versiones y al instalar todo de manera global podría hacer que algunos proyectos no funcionen.
Por eso al usar Python es un estándar y buena práctica crear env para nuestros proyectos. 🐍🤓
Imagínate que estas trabajando de forma paralela en dos proyectos que usan la misma librería, ejemplo pandas. Bueno piensa que una puede requerir pandas 0.1 porque es la única versión compatible con otra X librería. A su vez el otro proyecto requiere pandas 0.14 porque los datos están optimizados para esa versión.
Si no tienes el entorno puesto tendrías un problema de compatibilidad de librerías, que podría causar conflictos en uno o los doy proyectos, quitándote tiempo en arreglarlo. Para eso el entorno virtual.
Para que se les haga más sencillo, recomiendo crear un archivo llamado requirements.txt en su entorno virtual, dentro de este pueden copiar y pegar lo siguiente:
numpy
scipy
joblib
pandas
matplotlib
scikit-learn
Una vez peguen eso, guardan el archivo y ejecutan esto en la terminal:
pip install -r requirements.txt```pip install -r requirements.txt
Este comando instala todas las librerías que escriban en su archivo requirements.txt
Datos extra: 
* El archivo puede tener cualquier nombre, pero es un estándar y buena práctica llamarlo "requirements.txt"
* Pueden incluir una librería con una versión específica (ej. `scipy==1.11.4`)
La instalación de librerías en Python se realiza utilizando administradores de paquetes como pip, condau otros, dependiendo del entorno y las necesidades de su proyecto. A continuación, te mostraré cómo instalar librerías utilizando pipy conda.
Instalación con pip:
pip es el administrador de paquetes más comunes para Python y se utiliza para instalar librerías desde el repositorio público de Python, el Python Package Index (PyPI).
Instalación de paquetes desde fuentes externas:
Además de pipy conda, algunos paquetes pueden tener instaladores específicos o pueden requerir compilación. En ese caso, consulte la documentación específica del paquete.
Recuerda que es una buena práctica instalar las librerías en un entorno virtual para evitar conflictos y mantener tu espacio global de Python limpio.
Para que se les haga más sencillo, recomiendo crear un archivo llamado requirements.txt en su entorno virtual, dentro de este pueden copiar y pegar lo siguiente:
numpy
scipy
joblib
pandas
matplotlib
scikit-learn
Una vez peguen eso, guardan el archivo y ejecutan esto en la terminal:
pip install -r requirements.txt
Este comando instala todas las librerías que escriban en su archivo requirements.txt
Datos extra:;
* El archivo puede tener cualquier nombre, pero es un estándar y buena práctica llamarlo "requirements.txt"
* Pueden incluir una librería con una versión específica (ej. 'scipy==1.11.4')
Con pip list pueden saber todo lo que tienen instalado en el entorno.
Pip freeze para ver todas las librerias y versiones que tienen instaladas