No tienes acceso a esta clase

隆Contin煤a aprendiendo! 脷nete y comienza a potenciar tu carrera

Curso de Scrapy

Curso de Scrapy

Facundo Garc铆a Martoni

Facundo Garc铆a Martoni

Evitar meterse en problemas

26/27
Recursos

Aportes 13

Preguntas 1

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

o inicia sesi贸n.

鈥淟as advertencias deber铆an ir al frente y no al final鈥 Dijo el Doctor Strange
馃槃

Este video me gusta pero considero que puede ir al inicio y al final recalcar esto con ejemplos para reforzar el 鈥渘o realices malas practicas鈥

Pregunta: scrapy por defecto respeta el archivo robots.txt, entonces imagino que si mi programa al momento de iniciar ve que la ruta est谩 prohibida deber铆a detenerse y dar un mensaje de error, no ?

De una forma muy resumida y simplificada, el web scraping se podr铆a definir como la aplicaci贸n de t茅cnicas que, de forma autom谩tica, permiten la extracci贸n de datos e informaci贸n de cualquier p谩gina web a trav茅s de un software o script. Generalmente, el proceso se divide en una fase de extracci贸n de la informaci贸n y un posterior traslado de un formato inicial no reutilizable a otro que permita su manipulaci贸n y procesamiento con los fines deseados.

esta clase deber铆a estar al principio

Espero alguien pueda absolver mi pregunta.
Puedo hacer scraping a Linkedin ?
anteriormente eh podido extraer algunos datos usando bs4 y selenium, aunque el c贸digo no est谩 del todo terminado y eh seguido los pasos de este curso pero no eh logrado obtener ni el t铆tulo, hay un error 999. Espero alguien me pueda ayudar o dar una sugerencia, se lo agradecer铆a.

Uff preocupante, mas que nada porque uno no sabe de esos t茅rminos del sitio, al menos a mi me cuesta entenderlos, alguien sabe si https://es.finance.yahoo.com/ se puede scrapear, me gustaria practicar pero ahora con estas conclusiones hasta miedo me da

Una duda, si la p谩gina cuenta con robots.txt. Entonces ya dar铆a por entendido que tengo permiso de navegar por las p谩ginas que permite ese archivo? O igual tengo que consultar con mi abogado? Es interesante que las p谩ginas del gobierno de mi pa铆s de datos abiertos tengan tengan un robots que impide hacer scraping en nada XD

Brutal esta clase!

Ante todo principios 茅ticos!

馃槜