Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Curso de Scrapy

Curso de Scrapy

Facundo García Martoni

Facundo García Martoni

Spider: CIA

20/27
Recursos

Aportes 9

Preguntas 2

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Ese momento que ves que el profe cometer un error en el código y quieres avisarle, pero la clase es grabada 😃

Se me hace muy raro ver tan pocos comentarios en esta clase, pero también creo que es porque el profesor explica muy bien todo, entonces no hay mucho más que aportar (Al menos en esta clase). Me ha encantado un montón este curso por eso, el profesor explica muy bien todo y siempre deja claro que la documentación es importante leerla.

Estado actual del código del proyecto:

import scrapy

# XPATHS

# Links
XPATH_LINKS_DECLASSIFIED = '//a[starts-with(@href, "collection") and (parent::h3|parent::h2)]/@href'

class SpiderCIA(scrapy.Spider):

    name = 'cia'
    start_urls = [
        'https://www.cia.gov/readingroom/historical-collections'
    ]

    custom_settings={
        'FEEDS':{
            'cia.json':{
                'format': 'json',
                'encoding': 'utf-8',
                'indent': 4,
                }
                },
    }

    def parse(self, response):
        links_declassified = response.xpath(XPATH_LINKS_DECLASSIFIED).getall()
        for link in links_declassified:
            yield response.follow(link, callback=self.parse_link)

    def parse_link(self, response):
        pass

Hasta ahora Facu es el mejor profe que he tenido en Platzi, explica todo demasiado bien!

Link de la informacion
coleccion historica

Excelente

Excelente

Tan bien explicado que solo merece felicitarlo

Excelente