Una consulta si un sitio me arroja esto: User-agent: GoogleBot Allow: / ¿al no haber un Disallow puedo scrapear lo que quiera?

Claudio Caniullan Calfin

Claudio Caniullan Calfin

Pregunta
studenthace 5 años

Una consulta si un sitio me arroja esto: User-agent: GoogleBot Allow: / ¿al no haber un Disallow puedo scrapear lo que quiera?

2 respuestas
para escribir tu comentario
    Moisés Manuel Morín Hevia

    Moisés Manuel Morín Hevia

    studenthace 4 años

    Sí, te dice que todo esta permitido.

    Daniel Adolfo Ordoñez Rubio

    Daniel Adolfo Ordoñez Rubio

    studenthace 5 años

    Hola, Claudio :) Las reglas de robots son para los search engines (Google por ejemplo); te recomiendo ver si el sitio indica de forma explícita que prohíbe el acceso o la extracción automatizada de datos de cierta forma. Hay que tener en mente que todas las peticiones a sus servidores tienen un costo (aunque sea muy pequeño) y es comprensible que si no quieren que se haga scraping de sus sitios. Mi consejo es "no abusar" ;)

Curso de Web Scraping con Python y Xpath

Curso de Web Scraping con Python y Xpath

Aprende las bases de la extracción de datos en Internet y descubre cómo funciona una aplicación de Web Scraping internamente. Desarrolla scripts a través de herramientas como Python y las DevTools del navegador y consigue tu siguiente trabajo en cualquier empresa de tecnología.

Curso de Web Scraping con Python y Xpath
Curso de Web Scraping con Python y Xpath

Curso de Web Scraping con Python y Xpath

Aprende las bases de la extracción de datos en Internet y descubre cómo funciona una aplicación de Web Scraping internamente. Desarrolla scripts a través de herramientas como Python y las DevTools del navegador y consigue tu siguiente trabajo en cualquier empresa de tecnología.