粗糙的分页不起作用

raju 发表于 Dev

拉朱

我正在尝试学习Scrapy。

    # -*- coding: utf-8 -*-
import scrapy


class QuotesSpider(scrapy.Spider):
    name = 'quotes'
    allowed_domains = ['quotes.toscrape.com/']
    start_urls = ['http://quotes.toscrape.com/']

    def parse(self, response):
        quotes = response.xpath('//*[@class="quote"]')

        for quote in quotes:
            text = quote.xpath(".//*[@class='text']/text()").extract_first()
            author = quote.xpath("//*[@itemprop='author']/text()").extract_first()
            tags = quote.xpath(".//*[@class='tag']/text()").extract();

            item = {
                'author_name':author,
                'text':text,
                'tags':tags
            }
            yield item
    next_page_url = response.xpath("//*[@class='next']/a/@href").extract_first()
    absolute_next_page_url = response.urljoin(next_page_url)
    yield scrapy.Request(url=absolute_next_page_url,callback=self.parse)

但是，scrapy只解析第一页。这段代码有什么问题。我从youtube教程中复制了它。

请帮忙。

只是除第一个请求外的所有请求都被过滤为“ offsite”。这是因为/在allowed_domains值的末尾有多余的部分：

allowed_domains = ['quotes.toscrape.com/']
                    # REMOVE THIS SLASH^

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-11-28

我来说两句

0 条评论

登录后参与评论

上一篇：使用dplyr在R中的整洁数据框中进行多个值排名

分页搜索在laravel中不起作用

zend框架分页器不起作用？

DataTable分页不起作用？

粗糙的分页不起作用并且优化了蜘蛛

分页不起作用

laravel 5.6 datatable分页不起作用

Codeigniter分页不起作用

Laravel分页不起作用。

Cakephp分页不起作用？

Flask中的分页不起作用

分页符不起作用

与Datatable分页的selectBoxIt不起作用

CSS分页符不起作用

我的分页不起作用

分页在asp：DataGrid上不起作用

Angular NgTable分页不起作用

来自文档的Django分页不起作用

春季分页不起作用

分页不起作用-PHP

Bootstrap 分页不起作用

jQuery DataTable 中的分页不起作用

Scrapy：按照分页链接不起作用

Gridview 分页不起作用？

PHP分页不起作用

分页中的链接不起作用

分页器不起作用

Laravel 分页不起作用

Django 为什么分页不起作用？

分页不起作用？？- jQuery 或 Javascript

TOP 榜单

文章

粗糙的分页不起作用

粗糙的分页不起作用

IE 11中的FormData未定义

如何一次从多个文本框中获取值？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

OpenCv：改变 putText() 的位置

Redux动作正常，但减速器无效

如何从JavaScript中的MP3文件读取元数据属性？

如何使用Redux-Toolkit重置Redux Store

将加号/减号添加到jQuery菜单

OpenGL纹理格式的颜色错误

获取并汇总所有关联的数据

超过时间限制错误C ++

ActiveModelSerializer仅显示关联的ID

在交互式Python Shell中获得最后结果

如何开始为Ubuntu开发

去噪自动编码器和常规自动编码器有什么区别？

Excel 2016图表将增长与4个参数进行比较

算术中的c ++常量类型转换

使用因子时如何在y轴上的ggplot中插入count或％

TreeMap中的自定义排序

如何在R中转置数据

在 React Native Expo 中使用 react-redux 更改另一个键的值