Que es spiders?
Spider es una clase de python a la cual le decimos que informacion queremos, que informacion no queremos y como guardar esa informacion.
Para empezar a hacer uso de esta creamos un archivo en la carpeta spider y escribimos el siguiente codigo:
import scrapy
class QuotesSpider(scrapy.Spider):
# name es el nombre unico con el scrapy se va referir al spider dentro del proyect.
# name debe ser unico.
name = 'quotes'
# Defiimos una lista de url a las cuales les vamos a realizar las peticiones http.
start_urls = [
'http://quotes.toscrape.com/page/1/'
]
# definir el metodo parse el cual nos sirve para analizar un archivo y extraer informacion valiosa a partir de el.
def parse(self, response):
print('*' * 10)
print('\n\n')
print(response.status, response.headers)
print('*' * 10)
print('\n\n')
Y en la consola escribiremos:
scrapy crawl quotes # quotes viene del nombre que le dimos al spider en el codigo anterior.
¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.