Spark SQL JDBC仅返回列名称

Abira 发表于 Dev

阿比拉

我正在使用Scala 2.11中的Spark SQL查询数据库表。我遵循了Internet上给出的示例。

我正在使用的数据库：Ubuntu 14.04上的mariadb 5.5我正在查询的表（SOURCES）包含以下列：

`srcname` char(60) NOT NULL,
`endpoint` char(255) NOT NULL,
`pan` char(60) NOT NULL,
`vid` char(10)

这是我的代码：

val sparkSession = SparkSession.builder().master("local[*]").appName("somename").getOrCreate()
val df1 = sparkSession.read
.format("jdbc")
.option("driver", "org.mariadb.jdbc.Driver")
.option("url", url)
.option("dbtable", "SOURCES")
.option("user", username)
.option("password", password)
.load()   

df1.show()

这给了我以下输出：

+-------+--------+---+---+
|srcname|endpoint|pan|vid|
+-------+--------+---+---+
|srcname|endpoint|pan|vid|
|srcname|endpoint|pan|vid|
|srcname|endpoint|pan|vid|
+-------+--------+---+---+

即在不提供数据的情况下为每一行重复列名。我的桌子有3行。我尝试更改db中的行数，并相应地更改输出。

我还尝试了在各种站点中提到的另一种方法：

val prop = new java.util.Properties
prop.setProperty("user",username)
prop.setProperty("password",password)
prop.setProperty("driver","org.mariadb.jdbc.Driver")

val df2 = sparkSession.read.jdbc(url, "SOURCES", "srcname", 0, 5, 1, prop) 
df2.show()

这也提供相同的输出。

这是我的火花依赖项：

compile 'org.apache.spark:spark-core_2.11:2.0.0'
compile 'org.apache.spark:spark-sql_2.11:2.0.0'

关于这里出了什么问题有什么帮助吗？

阿比拉

找出问题。它是jdbc驱动程序

'org.mariadb.jdbc:'mariadb-java-client:1.5.4'

这就是问题所在。用过的mysql驱动程序ie

'mysql: mysql-connector-java:5.1.6'

它就像一个魅力

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-05-16

我来说两句

0 条评论

登录后参与评论

上一篇：Azure DocumentDB受限制的请求

Spark SQL RowFactory返回空行

SPARK SQL-使用DataFrames和JDBC更新MySql表

Spark SQL-PostgreSQL JDBC类路径问题

如何在Spark SQL中表示名称包含空格的列

在Scala中返回临时Spark SQL表

通过JDBC集成Spark SQL和Apache Drill

如何在Spark SQL中重命名列名

访问struct Spark SQL中的字段名称

Spark SQL Map仅DataFrame的一列

从pyspark中的Spark DF仅选择数字/字符串列名称

删除“。” 从Spark DataFrame列名称

如何在Spark SQL中处理非ascii列名称？

Spark sql group by和求和更改列名？

MS SQL QUERY与SPARK SQL返回的总行差

从Spark SQL生成SQL

Spark SQL CTE忽略查询中的名称空间

使用Scala在Spark sql Dataframe中读取歧义列名称

仅使用Spark-SQL API时广播变量的用法

返回列名称在SQL中满足特定值的位置

SQL列名称的句点（。）*

Spark Streaming + Spark SQL

udf spark列名称

ORC文件上的Spark SQL未返回正确的架构（列名称）

仅返回SQL查询中的大写名称

Spark SQL 为 JDBC 查询生成错误的上下限

spark-sql/Scala 列名中的 Unpivot 是数字

无法解析给定输入列的“列名”：Spark-SQL

spark.sql() 和 spark.read.format("jdbc").option("query", "") 有什么区别？

如何使用Spark SQL查詢過濾中文列名？

TOP 榜单

文章

Spark SQL JDBC仅返回列名称

Spark SQL JDBC仅返回列名称

构建类似于Jarvis的本地语言应用程序

在 Avalonia 中是否有带有柱子的 TreeView 或类似的东西？

Qt Creator Windows 10 - “使用 jom 而不是 nmake”不起作用

SQL Server中的非确定性数据类型

使用next.js时出现服务器错误，错误：找不到react-redux上下文值；请确保组件包装在<Provider>中

Swift 2.1-对单个单元格使用UITableView

Hashchange事件侦听器在将事件处理程序附加到事件之前进行侦听

HttpClient中的角度变化检测

如何了解DFT结果

错误：找不到存根。请确保已调用spring-cloud-contract：convert

Embers js中的更改侦听器上的组合框

在Wagtail管理员中，如何禁用图像和文档的摘要项？

如何避免每次重新编译所有文件？

Java中的循环开关案例

ng升级性能注意事项

Swift中的指针替代品？

如何使用geoChoroplethChart和dc.js在Mapchart的路径上添加标签或自定义值？

使用分隔符将成对相邻的数组元素相互连接

在同一Pushwoosh应用程序上Pushwoosh多个捆绑ID

ggplot：对齐多个分面图-所有大小不同的分面

完全禁用暂停（在内核级别？-必须与使用的DE和登录状态无关！）