将数据从熊猫存储到雪花的最佳方法

abdthe1：

数据框很大（7-8百万行）。尝试使用chunksize = 5000的to_sql，但从未完成。

使用，

from sqlalchemy import create_engine
from snowflake.sqlalchemy import URL

df.to_sql(snowflake_table , engine, if_exists='replace', index=False, index_label=None, chunksize=20000)

从熊猫DF将数据存储到SF的其他最佳解决方案还有哪些？还是我在这里做错了什么？DF的大小通常为7-10百万行。

abdthe1：

ilja-everila指出的最佳方法是“复制到...”，因为SF要求在转换之前将csv暂存在云上，我对此犹豫不决，但是鉴于性能在5至10分钟即可获得650万条记录。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-06-4

我来说两句

0 条评论

登录后参与评论

将JSON数据存储到Core Data的最佳方法

将数据存储到客户端的最佳方法

将golang map [string]接口存储到数据存储中的最佳方法

将tcp上的数据流存储到大型阵列中的最佳方法是什么？

将数据从Firebase存储到SQLite或在flutter中脱机的最佳方法是什么？

是否有最佳方法将数据从雪花获取到s3

将数据写入熊猫数据框的最佳方法

通过某些（索引）参数将值插入到熊猫数据框的“适当”位置的最佳方法是什么？

将日期从CSV文件存储到SQL的最佳方法

MySQL存储数据的最佳方法

存储大量数据的最佳方法

从Java保护将数据发布到URL的最佳方法

将 json 数据存储到数据库中的最佳实践

将github存储库克隆到另一个github存储库的最佳方法

熊猫GroupBy对象到数据框，将数据存储在以逗号分隔的文件中

将大熊猫数据帧发送到SQL数据库的最佳方法？

熊猫数据框到云存储桶

熊猫将字典存储到json中

这是将数据存储到SQL Server的最快方法吗？

如何将表单数据发布到存储方法？

重塑熊猫数据框的最佳方法

缓存熊猫数据框的最佳方法？

子集熊猫数据框的最佳方法

将数据存储到列表

熊猫：将每行数据存储到以列名为键的字典中

使用列和行将值存储到Java数据结构中的最佳方法

将用户地址存储到欧洲数据库的最佳方法？

将二叉搜索树节点存储到图顶点的最佳方法

将正在运行的进程中的多个值存储到bash中的变量中的最佳方法

TOP 榜单

文章

将数据从熊猫存储到雪花的最佳方法

将数据从熊猫存储到雪花的最佳方法

Linux的官方Adobe Flash存储库是否已过时？

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

如何检查字符串输入的格式

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

Modbus Python施耐德PM5300

错误TS2365：运算符'！=='无法应用于类型'“（”'和'“）”'

用日期数据透视表和日期顺序查询

检查嵌套列表中的长度是否相同

Java Eclipse中的错误13，如何解决？

ValueError：尝试同时迭代两个列表时，解包的值太多（预期为 2）

如何监视应用程序而不是单个进程的CPU使用率？

如何自动选择正确的键盘布局？-仅具有一个键盘布局

ES5的代理替代

在令牌内联程序集错误之前预期为 ')'

有什么解决方案可以将android设备用作Cast Receiver？

套接字无法检测到断开连接

如何在JavaScript中获取数组的第n个元素？

如何将sklearn.naive_bayes与（多个）分类功能一起使用？

应用发明者仅从列表中选择一个随机项一次

在Windows 7中无法删除文件（2）

ggplot：对齐多个分面图-所有大小不同的分面