Contenido del curso
Web Estático Avanzado
Scraping Dinámico con Selenium
Scraping Dinámico con Playwright
Cómo hacer login automático con Playwright
Resumen
Automatizar el inicio de sesión es uno de esos pasos que separan un scraper básico de uno realmente útil. Con Playwright en Python puedes rellenar formularios de login, manejar el scroll dinámico y extraer datos detrás de páginas autenticadas, todo dentro del mismo flujo. Ideal si trabajas con sitios que esconden información tras un usuario y contraseña.
¿Cómo automatizar un login con Playwright paso a paso?
El flujo se construye encadenando acciones del navegador con tiempos de espera para que la página alcance a renderizar. La lógica que se aplica sobre el sitio de scroll sigue este orden:
- Lanzar el navegador con Playwright, igual que en los ejercicios previos.
- Navegar a la URL objetivo y esperar 2000 milisegundos para que cargue el DOM.
- Hacer clic en el botón que contiene el texto login para abrir el formulario.
- Usar el método
fillsobre el campo#usernamecon el valor Platzi Admin y sobre el campo de contraseña con su credencial. - Disparar el método
clicken el botón submit y esperar otros dos segundos. - Extraer los tags de la página ya autenticada y cerrar el navegador.
Esos pequeños waits de dos segundos no son decorativos: te permiten observar visualmente la ejecución y le dan margen al sitio para terminar de renderizar antes de la siguiente acción [3:15].
¿Para qué sirve el método fill en Playwright? Sirve para escribir texto dentro de un input identificado por un selector, como
#username. Es la forma directa de rellenar campos de formulario sin simular pulsaciones de teclado una a una.
¿Qué diferencia hay entre usar Beautiful Soup y los selectores nativos de Playwright?
En los recursos del curso encontrarás dos versiones del mismo script. La parte uno combina Selenium, Beautiful Soup y Playwright: una vez que el login se completa, el HTML renderizado se pasa a Beautiful Soup para localizar los tags. La parte dos elimina esa dependencia y usa los métodos propios de Playwright para obtener los mismos elementos.
Ambas alternativas cumplen el mismo propósito y devuelven exactamente los mismos tags al final de la ejecución. La elección depende de qué tan ligero quieras mantener tu stack.
¿Cuándo conviene usar solo Playwright sin Beautiful Soup? Cuando quieras reducir dependencias y mantener un flujo más limpio. Playwright ya incluye localizadores potentes que evitan tener que parsear el HTML por separado.
¿Por qué se usan esperas de dos segundos entre acciones?
Las páginas dinámicas necesitan tiempo para ejecutar JavaScript, cargar componentes y reaccionar a los clics. Si lanzas la siguiente acción demasiado rápido, el selector puede no existir todavía y el script falla. Los 2000 milisegundos son un margen visual y técnico que estabiliza la automatización.
¿Qué puedes hacer ahora con Playwright para web scraping?
Con estas piezas en la mano, ya tienes un kit completo para escenarios reales:
- Scrapear páginas estáticas con HTML fijo.
- Scrapear páginas dinámicas que cargan contenido vía JavaScript.
- Manipular el scroll infinito para obtener más resultados.
- Rellenar formularios y autenticarte para acceder a contenido privado.
- Extraer tags con Beautiful Soup o directamente con los selectores de Playwright.
La combinación de fill, click y esperas controladas es lo que te permite tratar al navegador como si fueras tú mismo navegando, pero a velocidad de script. ¿En qué proyecto personal vas a aplicar estas herramientas? Cuéntalo en los comentarios.