A la fecha la página cambio su estructura y ahora los nombres de las clases son aleatorios, alguien sabe como poder aplicar xpath para es...

Pregunta de la clase:
Selección de elementos
Javier Guevara

Javier Guevara

Pregunta
studenthace 4 años

A la fecha la página cambio su estructura y ahora los nombres de las clases son aleatorios, alguien sabe como poder aplicar xpath para estos casos?

2 respuestas
para escribir tu comentario
    Robin Angel Romero

    Robin Angel Romero

    studenthace 4 años

    Hola de nuevo, estuve revisando de nuevo, y al parecer los nombres de las clases no han cambiandso, sin embargo, para crear los xpath, no es estrictamente obligatorio usar el atributo class, trata de buscar que atributos en cada etiqueta deberían mantenerse sin cambios, xpath te permite usar predicados dependiendo de tus necesidades, pdria usar atributos como aria-label, data-test o id, tambien puedes buscar en la estrudutar del html usando predicados con la posicion de la etiqueta, ejemplo

    //div[@id="ContainerFooterCard0"]/span[2]

    con este xpath estaría accediendo al segundo span del árbol, es decir, estoy buscando en el div, el segundo span, que es el que necesito.

    "<div id="ContainerFooterCard0" class="sc-bbkauy bhHunu"> <a id="itinerary-modal-0-dialog-open" data-testid="itinerary-modal-0-dialog-open-link" target="_self" rel="noopener noreferrer" href="#flight-0-itinerary-detail" data-reference="modal-air-offers" class="sc-kvZOFW hOyfyC"> <span aria-hidden="true">1 parada</span> <span class="sc-chPdSV lkxoam">Conocer el detalle completo del itinerario de vuelo </span> -----> este seria el span que obtendria </a> </div>"

    para scrapear este tipo de paginas seria muy util, ya qeu aunque cambien los nombres de las clases, seguirás obteniendo el mismo elemento mientras se mantengo el mismo orden en el html, el cual no debería cambiar, amenos que se haga una nueva reestructuración completa de toda la pagina

    Robin Angel Romero

    Robin Angel Romero

    studenthace 4 años

    pues con lo que llevo hecho hasta ahora, efectivamente se ha cambiado la estructura de latama, pero los nombres de las clases se mantienen iguales aunque son nombre sin sentido tipo (aedsfa-asdf), ya intente recargando la pagina, y siguen siendo los mismos

Curso de Web Scraping: Extracción de Datos en la Web

Curso de Web Scraping: Extracción de Datos en la Web

Web Scraping es el proceso de adquisición previo al análisis de los datos. Conoce y usa herramientas como Scrapy y Selenium para hacer Web Scraping. Automatiza técnicas para extraer contenido de sitios web. Estructura el código HTML e identifica la información requerida para tus análisis usando BeautifulSoup. Los datos ya existen, solo tienes que encontrarlos, aprende a hacer extracción de datos en la Web y lleva tu carrera en Ciencia de Datos al siguiente nivel.

Curso de Web Scraping: Extracción de Datos en la Web
Curso de Web Scraping: Extracción de Datos en la Web

Curso de Web Scraping: Extracción de Datos en la Web

Web Scraping es el proceso de adquisición previo al análisis de los datos. Conoce y usa herramientas como Scrapy y Selenium para hacer Web Scraping. Automatiza técnicas para extraer contenido de sitios web. Estructura el código HTML e identifica la información requerida para tus análisis usando BeautifulSoup. Los datos ya existen, solo tienes que encontrarlos, aprende a hacer extracción de datos en la Web y lleva tu carrera en Ciencia de Datos al siguiente nivel.