带有标头的 Spark SQLContext 查询

咖啡因

我正在使用 SQLContext 读取这样的 CSV 文件：

val csvContents = sqlContext.read.sql("SELECT * FROM 
                  csv.`src/test/resources/afile.csv` WHERE firstcolumn=21")

但它打印出第一列作为_c0并包括其下的标题。如何设置标题并使用 SQL 查询？我见过这个解决方案：

 val df = spark.read
         .option("header", "true") //reading the headers
         .csv("file.csv")

但这不允许我SELECT使用WHERE子句进行查询。有没有办法指定 CSV 标头并进行SQL SELECT查询？

咖啡因

事实证明标题没有被正确解析。CSV 文件以制表符分隔，因此我必须明确指定：

val csvContents = sqlContext.read
        .option("delimiter", "\t")
        .option("header", "true")
        .csv(csvPath)
        .select("*")
        .where(s"col_id=22")

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-07-10

我来说两句

0 条评论

登录后参与评论

上一篇：從某個位置開始檢查字符串是否與給定的字符串匹配 javascript

Spark DataFrame与sqlContext

Apache Spark SQLContext与HiveContext有什么区别？

Spark：AttributeError：'SQLContext'对象没有属性'createDataFrame'

无法从Apache Spark SQL 1.5.2在SQLContext中运行查询，获取java.lang.NoSuchMethodError

如何模拟 Spark SqlContext 的方法？

spark.sql和SqlContext

Spark SqlContext输出JSON格式

用sqlcontext激发并行查询

如何使用Scala在Spark中创建SQLContext？

Spark Scala：无法导入sqlContext.implicits._

Apache Spark错误：找不到：值sqlContext

使用 Apache Spark SQLContext 写入错误

pyspark：如何获取spark数据帧的Spark SQLContext？

Spark SQL中带有字符串查询的注释

Spark Scala与带有限制的子查询联接

带有HiveContext的Apache Spark查询不起作用

使用urllib.request查询带有一系列x-api-key标头的url

为Spark 2.x SQLContext设置Hadoop Config属性

无法使用Spark（sqlContext）在AWS Redshift中写入CSV数据

如何从Spark SQLContext连接到Netezza数据库

Spark SQL Dataframe-导入sqlContext.implicits._

Spark SQL的SparklyR包装器：sqlContext.sql

NoSuchMethodError：org.apache.spark.sql.SQLContext.sql

选择查询对大型数据集i sqlcontext失败

Scala如何使用sqlContext处理查询中的isnull或ifnull

具有XSLT标头的SQL Server FOR XML查询

没有SQLContext的pyspark中的clearCache

在Scala Spark应用程序中初始化SQLContext后，为什么要导入隐式SqlContext.implicits._

用于指定触发查询文件的语法（带有elasticsearch-spark连接器）

TOP 榜单

文章

带有标头的 Spark SQLContext 查询

带有标头的 Spark SQLContext 查询

UITableView的项目向下滚动后更改颜色，然后快速备份

Linux的官方Adobe Flash存储库是否已过时？

用日期数据透视表和日期顺序查询

应用发明者仅从列表中选择一个随机项一次

Mac OS X更新后的GRUB 2问题

验证REST API参数

Java Eclipse中的错误13，如何解决？

带有错误“ where”条件的查询如何返回结果？

ggplot：对齐多个分面图-所有大小不同的分面

尝试反复更改屏幕上按钮的位置 - kotlin android studio

如何从视图一次更新多行（ASP.NET - Core）

计算数据帧中每行的NA

蓝屏死机没有修复解决方案

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

离子动态工具栏背景色

VB.net将2条特定行导出到DataGridView

通过 Git 在运行 Jenkins 作业时获取 ClassNotFoundException

在Windows 7中无法删除文件（2）

python中的boto3文件上传

当我尝试下载 StanfordNLP en 模型时，出现错误

Node.js中未捕获的异常错误，发生调用