Jupyter Notebooks para Ciencia de Datos: Uso y Configuración Inicial
Clase 1 de 16 • Curso de Entorno de Trabajo para Ciencia de Datos con Jupyter Notebooks y Anaconda
Resumen
¿Qué aprenderás en este curso?
Iniciar tu viaje en el mundo de los Jupyter Notebooks para Ciencia de Datos es una decisión emocionante. A lo largo de este curso, guiado por el experto Jesús Vélez Santiago, aprenderás a identificar tu punto de inicio óptimo en la ciencia de datos y a utilizar diversas herramientas y plataformas de Jupyter Notebooks. Desde la instalación de herramientas necesarias para programar en este ámbito hasta el dominio de ambientes virtuales con Conda, este curso cubrirá todo lo que necesitas para desenvolverte con soltura en este fascinante universo.
¿Dónde puedo programar en ciencia de datos?
Hoy en día, cuando decides comenzar con ciencia de datos, te enfrentarás a una variedad de plataformas y herramientas de software listas para ayudarte desde el primer día. Puedes elegir programar de las siguientes maneras:
- Desde tu navegador: Inicia tu journey directamente a través de plataformas basadas en la web, como Google Colab.
- Localmente: Utiliza editores de código o IDEs que se alojan directamente en tu computadora.
- En servidores empresariales: Conecta tus habilidades de programación con herramientas en servidores de tu compañía.
- Móvil: Explora opciones en dispositivos móviles, permitiéndote programar en casi cualquier lugar.
Un aspecto importante es que, independientemente de la plataforma que elijas, puedes comenzar a trabajar con solo un clic o instalar un ambiente configurado.
¿Qué sistema operativo debo utilizar?
La ciencia de datos es bastante flexible cuando se trata de la elección del sistema operativo. Puedes optar por cualquiera de los siguientes:
- Windows: Aunque puede requerir más configuración, es completamente viable gracias a herramientas como el Windows Subsystem for Linux (WSL).
- Linux/Unix: Preferido por la mayoría de los científicos de datos debido a su capacidad para ejecutar comandos de manera sencilla. Ejemplos incluyen Ubuntu y MacOS, ambos basados en Unix.
Aunque cada sistema operativo puede tener sus propias ventajas, la vitalidad y la versatilidad de las herramientas modernas te permitirán trabajar efectivamente en cualquiera de ellos.
¿Con cuál herramienta debo comenzar?
Increíblemente, no hay una respuesta única. Existen múltiples herramientas populares como Google Collab, Jupyter, Deep Note, IPython, y Visual Studio Code, cada una con sus propias ventajas y desventajas. La elección debe basarse en las necesidades de tu proyecto y el tipo de problemas que buscas resolver.
Ventajas de los notebooks
El nacimiento de los Jupyter Notebooks marcó un importante cambio en cómo los analistas de datos documentan y presentan sus análisis. Con funcionalidades enriquecidas como texto en negritas, cursiva, soporte para imágenes y GIFs, los notebooks ofrecen:
- Dinamicidad: Una herramienta que permite un ciclo de prueba, observación y repetición.
- Documentación integrada: Permite explicar ideas, incluir representaciones gráficas y mostrar resultados de manera comprensible.
Los Jupyter Notebooks han revolucionado el proceso de crear reportes ejecutables, siendo vitales para cualquier profesional en ciencia de datos.
Scripts vs. notebooks
Aunque los notebooks ofrecen una plataforma visual y rica en funciones, los scripts de Python siguen siendo valiosos. Aquí te dejamos algunas diferencias:
- Scripts: Ofrecen una visualización clara y sin interrupciones del código, ideal para entender directamente la intención del programador.
- Notebooks: Perfectos para la experimentación y prototipado, permite incorporar explicaciones detalladas, resultados y visualizaciones.
Lo ideal es combinar ambos: utilizar notebooks para prototipado y presentación de resultados, y scripts para implementación y ejecución directa.
Esta combinación te otorgará la técnica necesaria para manejar múltiples conjuntos de datos, adaptando la herramienta a tus necesidades específicas. Listos para comenzar, nos vemos en la siguiente clase, donde profundizaremos en cómo crear y utilizar notebooks de manera tanto local como en tu navegador. ¡El camino hacia el dominio de la ciencia de datos está a solo un clic de distancia!