Estoy usando scrapy
para buscar contenido web, de esta manera:
class PitchforkTracks(scrapy.Spider):
name = "pitchfork_tracks"
allowed_domains = ["pitchfork.com"]
start_urls = [
"http://pitchfork.com/reviews/best/tracks/?page=1",
"http://pitchfork.com/reviews/best/tracks/?page=2",
"http://pitchfork.com/reviews/best/tracks/?page=3",
]
todo está funcionando bien.
ahora, en lugar de ir directamente a las páginas, me gustaría raspar google
caches
las mismas páginas.
¿Qué es lo adecuado syntax
para lograrlo?
PD: Lo he intentado "cache:http://pitchfork.com/reviews/best/tracks/?page=1",
, en vano.
puede usar la siguiente URL de Google para raspar la página de caché
Este artículo se recopila de Internet, indique la fuente cuando se vuelva a imprimir.
En caso de infracción, por favor [email protected] Eliminar
Déjame decir algunas palabras