Creación de Plantillas de Machine Learning con CookieCutter

Clase 15 de 17 • Curso de Entornos Virtuales con Anaconda y Jupyter

Contenido del curso

Entornos virtuales con Anaconda y pip

Uso de Jupyter Notebook y JupyterLab

Proyectos con Cookiecutter

Estructura de entorno en proyectos

17
Gestión de Entornos Virtuales en Proyectos de Data Science
04:23 min

Tomar examen

Resumen

Organizar proyectos de machine learning desde cero puede volverse caótico cuando cada integrante del equipo define su propia estructura. Cookie Cutter resuelve ese problema al permitirte diseñar una plantilla reutilizable que incluye carpetas para datos, código, modelos y documentación, garantizando consistencia y colaboración efectiva en equipos grandes o dispersos.

¿Cómo se estructura un directorio de machine learning con Cookie Cutter?

El punto de partida es definir la arquitectura del proyecto. La plantilla incluye carpetas y archivos clave que cubren todo el ciclo de trabajo en ciencia de datos [0:40]:

data: almacena los conjuntos de datos del proyecto.
source (src): contiene el código fuente, como model.py con código de ejemplo.
notebooks: organiza los cuadernos de análisis y experimentación.
models: guarda los modelos entrenados.
environment.yml: reproduce el entorno virtual con las dependencias exactas.
requirements.txt: lista las bibliotecas necesarias para la instalación.
README.md: documenta el proyecto en formato Markdown.
LICENSE: define los términos legales de uso.

Toda esta estructura vive dentro de una carpeta cuyo nombre se genera dinámicamente gracias al motor de plantillas Jinja. Este motor es muy flexible y permite crear archivos con contenido variable basado en la entrada del usuario [1:18].

¿Qué variables se definen en cookiecutter.json?

El archivo cookiecutter.json es la pieza central. Aquí se especifican las variables que el usuario debe completar al generar un nuevo proyecto [3:06]:

project_name: nombre del proyecto, con un valor por defecto que se usa si el usuario presiona enter sin escribir nada.
author_name: nombre del autor, por ejemplo "Carl Cox".
python_version: versión de Python (3.8, 3.12, según el proyecto).
license: opción múltiple entre MIT, GPL y Apache.

Cuando defines múltiples opciones como en el caso de la licencia, Cookie Cutter presenta al usuario una lista para seleccionar. Cada valor por defecto actúa como sugerencia, agilizando la creación del proyecto.

¿Cómo se usa la sintaxis de Jinja dentro de los archivos?

La sintaxis de Jinja utiliza dobles llaves {{ cookiecutter.variable }} para insertar valores dinámicos. En el README.md, por ejemplo, el título se genera con {{ cookiecutter.project_name }} y la autoría con {{ cookiecutter.author_name }} [4:26].

Para lógica condicional, como en el archivo de licencia, se emplean bloques de control con {% if %}, {% elif %} y {% endif %} [5:30]:

jinja {% if cookiecutter.license == "MIT" %} MIT License Copyright (c) {{ cookiecutter.author_name }} ... {% elif cookiecutter.license == "GPL" %} GPL License ... {% elif cookiecutter.license == "Apache" %} Apache License ... {% endif %}

Un error frecuente es olvidar el signo de porcentaje de cierre o colocar las comillas fuera de posición. Siempre verifica que cada bloque if tenga su correspondiente endif [8:15].

¿Cómo se personaliza el archivo de entorno virtual?

El archivo environment.yml también acepta variables de Jinja. El nombre del entorno se genera con {{ cookiecutter.project_name }} y las dependencias se listan con la indentación correcta [7:30]:

NumPy.
Pandas.
Python con la versión definida por el usuario.

Cuidar la compatibilidad entre la versión de Python y las dependencias es fundamental para evitar conflictos de instalación.

¿Cómo se ejecuta Cookie Cutter desde la terminal?

Antes de ejecutar, la estructura debe quedar clara: el archivo cookiecutter.json se ubica al mismo nivel que la carpeta raíz del template [9:10]. Una buena práctica es agrupar los templates en carpetas individuales, por ejemplo my_ml_template, pensando en que podrías tener múltiples plantillas.

Desde la terminal, el comando es directo [9:50]:

bash cookiecutter my_ml_template

El sistema solicita cada variable definida en el JSON. Al completarlas, genera automáticamente el directorio con toda la estructura personalizada. Puedes verificar con ls que el nuevo proyecto contiene las mismas carpetas y archivos del template original, pero con los valores que ingresaste.

La recomendación final es subir tu plantilla personalizada a un repositorio en GitHub y compartir el enlace. También considera usar la plantilla de ciencia de datos que Cookie Cutter ofrece por defecto como punto de partida. En la próxima sesión se explorarán los hooks para automatizar tareas dentro de tus proyectos.

Comentarios

Paola Alapizco

student•

Esta clase es bastante buena como introducción a la personalización de plantillas usando cookiecutter y la sintaxis de jinja (template engine).

Sin embargo, para quienes deseen profundizar aun más en este tema les recomiendo que también vean el curso de configuración profesional de entornos de trabajo para ciencia de datos aquí mismo en Platzi.

https://platzi.com/cursos/entorno-ciencia-datos/

Valentina Cobo Paz

student•

los dos cursos me parecen fundamentales!! yo vi primero ese porque es más antiguo, pero siento que se complementan muy bien !

Jesús Alberto Romero Hernández

student•

Aquí comparto mi plantilla creada.

Mariano David Melgar Zavala

student•

Gracias, muy buena info y claramente explicado.

Daniel Andres Rojas Paredes

student•

se me ocurrio preguntarle a chat gpt sobre la accesibilidad usando jinja(hasta esta clase no sabia que jinja existia), esto fue lo que me respondio, me parecio muy interesante Yes, Jinja fully respects the accessibility requirements of HTML because it is simply a template rendering engine. Jinja itself does not alter the structure, semantics, or accessibility of the HTML it generates. It is entirely up to the developer to ensure the templates include proper ARIA tags, roles, and other accessibility considerations.

Jinja templates are flexible and make it easy to dynamically include ARIA attributes or roles by leveraging variables and control structures.

Applying ARIA Tags and Roles in Jinja

Dynamic ARIA Attributes: You can insert ARIA attributes dynamically based on variables or conditions.Example:<button aria-expanded="{{ expanded }}" aria-controls="menu"> Toggle Menu </button>
- Here, the expanded variable could be true or false, dynamically setting the aria-expanded attribute.
Roles and Accessibility States: Jinja makes it straightforward to include roles and ARIA states, ensuring the HTML remains accessible.Example:<div role="alert" aria-live="assertive"> {{ message }} </div>
Conditional ARIA Attributes: You can conditionally include ARIA attributes or roles based on specific conditions.Example:<button {% if disabled %} aria-disabled="true" disabled {% endif %}> Click Me </button>

Example: Accessible Dynamic Menu

Below is an example of how Jinja can help generate an accessible menu with ARIA attributes dynamically:

Jinja Template:

<nav aria-label="Main Navigation"> <ul> {% for item in menu %} <li> <a href="{{ item.url }}" aria-current="{% if item.current %}page{% endif %}"> {{ item.name }} </a> </li> {% endfor %} </ul> </nav>

Python Code:

menu = [ {"name": "Home", "url": "/", "current": True}, {"name": "About", "url": "/about", "current": False}, {"name": "Contact", "url": "/contact", "current": False} ] rendered_template = template.render(menu=menu)

Rendered HTML:

<nav aria-label="Main Navigation"> <ul> <li> <a href="/" aria-current="page">Home</a> </li> <li> <a href="/about">About</a> </li> <li> <a href="/contact">Contact</a> </li> </ul> </nav>

Advantages of Using Jinja for Accessibility

Consistency: Templates make it easy to apply accessibility patterns consistently across the app (e.g., reusable components with ARIA attributes).
Dynamic ARIA State Management: ARIA attributes like aria-expanded, aria-hidden, or aria-current can be controlled dynamically with variables.
Flexibility with Logic: Conditional statements (if, for) allow you to tailor accessibility features based on specific content or states.

Best Practices for Accessibility in Jinja Templates

Understand Accessibility Needs: Ensure ARIA attributes and roles align with the functionality and user interaction.
Test Generated HTML: Always validate the final output for accessibility using tools like axe-core, Lighthouse, or screen readers.
Reusable Components: Create reusable template snippets for commonly used patterns, such as modals, menus, or buttons with ARIA attributes.
Follow Standards: Refer to the WAI-ARIA Authoring Practices to ensure proper implementation.

Would you like a specific example of how to implement a particular ARIA feature using Jinja?

Fredy Yecid Castro Agray

student•

Comparto mi plantilla

Creación de Plantillas de Machine Learning con CookieCutter

Entornos virtuales con Anaconda y pip

Creación de Entornos Virtuales en Python con PIP y Venv

Instalación de Anaconda en Windows, Linux y Mac

Gestión de Entornos Virtuales con Conda y Anaconda

Gestión y Limpieza de Entornos Virtuales con Conda

Gestión de Entornos Virtuales y Paquetes con Conda

Gestión de Entornos Virtuales con Anaconda Navigator

Uso de Jupyter Notebook y JupyterLab

Uso de Jupyter Notebooks para Ciencia de Datos con Anaconda

Comandos mágicos en Jupyter Notebook: Atajos y funcionalidades clave

Integración de Git en Jupyter Notebooks con NB Dime

Ejecución de JupyterLab desde Anaconda: Entorno y funcionalidades

Configuración de Jupyter Notebooks en Visual Studio Code

Ejecución de Celdas en Notebooks con Visual Studio Code

Proyectos con Cookiecutter

Instalación y gestión de paquetes con Conda y CondaForge

Configuración de Proyectos con Cookiecutter para Ciencia de Datos

Creación de Plantillas de Machine Learning con CookieCutter

Implementación de Hooks en CookieCutter para Automatizar Proyectos

Estructura de entorno en proyectos

Gestión de Entornos Virtuales en Proyectos de Data Science