需要通过 python 或 ruby 代码将 .csv 文件导入到 Cassandra 3.11.3 DB 的代码(生产使用)

哈雷莎

我们有 7 个节点的 Cassandra 3.11.3 生产集群,我们将票证详细信息转储到中间服务器,我需要从此 .csv 文件中读取并将 .csv 数据导入到 cassandra 表中。我尝试了 ruby​​ 代码,这对我来说很容易编写,但它没有处理所有的列值(因为这个 .csv 将有特殊字符、输入/不同的行、UTF 问题、太多的文本描述,因为它在票务中工具),因为数据在 .csv 中的每一行中都在不断变化。

我想知道 ruby​​ 或 python 是否适合在生产中执行此活动,或者是否有人有很好的示例代码来缓解上述问题并在生产环境中执行此类活动?

康斯坦丁·斯特鲁科夫

Ruby 和 Python 都非常适合这种任务,但是如果您的源文件格式错误,那么任何潜在的工具都可能失败 - 没有魔术按钮工具可以从(损坏的)数据文件中推断出上下文并修复所有问题自动为您解决问题。

我建议将任务分成两部分:1)修复编码和数据质量问题(并在必要时执行任何数据转换),然后 2)导入干净的数据。

任务 2 几乎可以使用任何编程语言(具有适当的 cassandra 驱动程序)轻松完成,但如果您有一个格式良好的 csv 源,您可能根本不需要任何黑客攻击(当然,取决于用例)- Cassandra 支持copy ... from允许直接从 csv 导入数据的命令(https://docs.datastax.com/en/cql/3.3/cql/cql_reference/cqlshCopy.html)。

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

使用Python将CSV文件导入sqlite3数据库表

如何通过Java代码将CSV文件数据导入到PostgreSQL表中?

使用Java将Google日历数据(通过API v3)导入到Google App Engine

从Java代码将JSON文件批量上传/导入到Azure Cosmos DB

使用PHP将csv文件导入到mySQL中的问题

如何使用node.js将csv文件导入到mysql?

使用sql将数据从文件csv导入到Oracle

将csv导入到xlsx python

使用Google Script将多个CSV文件导入到Google工作表

Python3将模块从文件夹导入到另一个文件夹

如何将导入到python中的数据从csv文件转换为时间序列?

d3将csv文件导入到数组

Python:将3个列表串联到csv文件中?

将js文件全局导入到vuejs 3

无法将facebook api导入到python代码

使用PYSPARK将CSV文件加载/导入到mongodb中

python gspread将csv导入到特定工作表

试图通过python3将csv文件导入postgresql数据库

将csv作为坐标导入到python

使用R将多个csv文件导入到postgresql数据库中(内存错误)

将fortran文件导入到python

我应该如何使用pgAdmin 3将数据从CSV导入到Postgres表中?

不使用主键将CSV文件导入到Mysql表

如何解析文件名,并使用shellscript将数据导入到csv文件中?

当我使用`sequel`将数据从csv文件导入到postgresql中时出现错误

将压缩的csv文件导入到Talend中

仅将升序值从 CSV 导入到列表 - Python

使用python3将csv文件导入mysql数据库

如何使用python将CSV文件导入SQLite3