将数据存储到SQL不能与我的SQL连接器一起使用并且scrapy

埃德西尔

我正在尝试将已抓取的数据抓取存储到SQL数据库，但是我的代码没有发送任何内容，而在运行时未提及任何错误。

我正在使用sql连接器，因为我无法安装MySQL-python。我的SQL数据库似乎运行良好，当我运行代码时，流量增加了KB / s。请在下面找到我的pipelines.py代码。

import mysql.connector
from mysql.connector import errorcode

class CleaningPipeline(object):
    ...

class DatabasePipeline(object):

    def _init_(self):
        self.create_connection()
        self.create_table()

    def create_connection(self):
        self.conn = mysql.connector.connect(
            host = 'localhost',
            user = 'root',
            passwd = '********',
            database = 'lecturesinparis_db'
        )
        self.curr = self.conn.cursor()

    def create_table(self):
        self.curr.execute("""DROP TABLE IF EXISTS mdl""")
        self.curr.execute("""create table mdl(
                        title text,
                        location text,
                        startdatetime text,
                        lenght text,
                        description text,
                        )""")

    def process_item(self, item, spider):
        self.store_db(item)
        return item

    def store_db(self, item):
        self.curr.execute("""insert into mdl values (%s,%s,%s,%s,%s)""", (
            item['title'][0],
            item['location'][0],
            item['startdatetime'][0],
            item['lenght'][0],
            item['description'][0],
        ))
        self.conn.commit()

阿桑·罗伊（Ahsan Roy）

您需要首先添加该类，ITEM_PIPELINES以便让沙哑的人知道我要使用此管道。

在您的settings.py文件中，使用您的类名称更新以下行，如下所示。

# https://docs.scrapy.org/en/latest/topics/item-pipeline.html
ITEM_PIPELINES = {
    'projectname.pipelines.CleaningPipeline': 700,
    'projectname.pipelines.DatabasePipeline': 800,
}

数字700和800表示管道将按什么顺序处理数据，它可以是1-1000之间的任何整数。管道将根据此数字按顺序处理项目，因此，具有700的管道将在具有800的管道之前处理数据。

注意：将项目名称替换为'projectname.pipelines.CleaningPipeline'您的实际项目名称。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-01-21

我来说两句

0 条评论

登录后参与评论

上一篇：如何在Laravel的控制器中获取选定的无线电输入阵列

<ReferenceArrayInput />不能与我的自定义数据提供程序一起使用（棱镜）

为什么我的完成处理程序不能与我的 URLSession 一起使用？

为什么更改事件处理程序不能与我的代码一起使用？

连接池不能与用于SQL Server for Linux的ODBC Driver 13一起使用

将数据存储到SQL不能与我的SQL连接器一起使用并且scrapy

将数据存储到SQL不能与我的SQL连接器一起使用并且scrapy

蓝屏死机没有修复解决方案

计算数据帧中每行的NA

UITableView的项目向下滚动后更改颜色，然后快速备份

Node.js中未捕获的异常错误，发生调用

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

Linux的官方Adobe Flash存储库是否已过时？

验证REST API参数

ggplot：对齐多个分面图-所有大小不同的分面

Mac OS X更新后的GRUB 2问题

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

带有错误“ where”条件的查询如何返回结果？

用日期数据透视表和日期顺序查询

VB.net将2条特定行导出到DataGridView

如何从视图一次更新多行（ASP.NET - Core）

Java Eclipse中的错误13，如何解决？

尝试反复更改屏幕上按钮的位置 - kotlin android studio

离子动态工具栏背景色

应用发明者仅从列表中选择一个随机项一次

当我尝试下载 StanfordNLP en 模型时，出现错误

python中的boto3文件上传

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID