Paso a paso actualizado (08.01.2020):
El nuevo link para acceder al historical colletion es: https://www.cia.gov/readingroom/historical-collections
Por lo tanto, en consola ponemos:
scrapy shell "https://www.cia.gov/readingroom/historical-collections"
Una vez dentro del shell, ponemos:
response.xpath('//a[starts-with(@href, "collection") and (parent::h3|parent::h2)]/@href').getall()
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?
o inicia sesión.