Configuración del ambiente

Clase 5 de 38Curso de Ingeniería de Datos con Python

Contenido del curso

Web scraping

Pandas

Resumen

Configura un entorno sólido de ciencia de datos en minutos con Anaconda y conda. Aquí verás por qué es la opción más práctica para un o una data engineer, cómo instalarla en tu sistema y los comandos básicos para verificar, crear y administrar ambientes virtuales sin complicaciones.

¿Cómo instalar Anaconda y verificar la instalación?

Instalar Anaconda simplifica el arranque en ciencia de datos: incluye más de 1400 paquetes y herramientas listas para usar. Además, permite crear ambientes virtuales con distintas versiones de librerías, ideal para mantener proyectos aislados y estables.

  • Ve a: anaconda.com/download.
  • Elige tu sistema: MacOS, Linux o Windows.
  • Acepta los defaults del instalador y coloca tu contraseña si te la pide.
  • Al finalizar, abre la terminal para verificar.

Comandos útiles para confirmar la instalación:

conda version conda help conda list

Qué hace cada comando:

  • conda version: muestra la versión instalada de Anaconda.
  • conda help: lista comandos disponibles para tu flujo de trabajo.
  • conda list: muestra los paquetes instalados por Anaconda.

Verificación rápida en Python:

import numpy

Si no aparece error, tienes paquetes clave de ciencia de datos disponibles desde el intérprete de Python provisto por Anaconda.

¿Qué ventajas ofrece Anaconda frente a pip y virtual env?

En ciencia de datos, Anaconda es más sencilla que usar pip paquete por paquete. Además, si no dominas Python, te permite ser productivo casi de inmediato. Para desarrollo web, el consejo fue distinto: allí podría preferirse pip, pero aquí destaca Anaconda.

  • pip: instalación paquete por paquete.
  • Virtual Env: entornos aislados en Python tradicional.
  • Anaconda: instalación integral y ambientes virtuales con conda.

Buenas prácticas clave:

  • Un ambiente virtual por proyecto.
  • Mantén versiones específicas de librerías por proyecto.
  • Evita usar paquetes globales si necesitas versiones distintas.

Librerías que se usarán y para qué sirven:

  • Beautiful Soup: parsear y manipular HTML.
  • Requests: hacer solicitudes HTTP a la web.
  • NumPy: análisis numérico de datos.
  • Pandas: análisis, transformación y descripciones de datos.
  • Matplotlib: visualizaciones de datos.
  • YAML: formato similar a JSON para configuraciones.

Además, puedes trabajar en MacOS o Linux (se expresó preferencia por Linux) y también en Windows si lo prefieres.

¿Cómo crear, activar y eliminar ambientes virtuales con conda?

La recomendación es crear un ambiente virtual por cada proyecto. Con conda, el flujo es directo: crear, activar, trabajar, desactivar y, si hace falta, eliminar.

Crea el ambiente (usa el mismo nombre en todos los pasos):

conda create --name NOMBRE_AMBIENTE LIBRERIA_1 LIBRERIA_2 LIBRERIA_3 ...

Activa y desactiva el ambiente:

source activate NOMBRE_AMBIENTE source deactivate

Lista ambientes disponibles y elimina uno si es necesario:

conda env list conda remove --name NOMBRE_AMBIENTE

Puntos a recordar:

  • Al activar, verás el nombre del ambiente al inicio de la línea de comandos.
  • Al desactivar, regresas al ambiente base.
  • Antes de eliminar, confirma el nombre del ambiente con conda env list.

Con este flujo, puedes mantener múltiples proyectos con dependencias distintas sin conflictos. Y si algo falla, siempre puedes revisar los comandos de ayuda de conda.

¿Te quedó alguna duda de instalación, sistema operativo o comandos? Deja tu comentario y la comunidad te apoya con gusto.