如何检查pyspark数据框中的字符串列是否全部为数字

cph_sto 发表于 Dev

22

cph_sto

我有一个PySparkDataframe与一列strings。如何检查其中的哪些行是数字。我在PySpark的官方文档中找不到任何功能-

values = [('25q36',),('75647',),('13864',),('8758K',),('07645',)]
df = sqlContext.createDataFrame(values,['ID',])
df.show()
+-----+
|   ID|
+-----+
|25q36|
|75647|
|13864|
|8758K|
|07645|
+-----+

在Python中，有一个函数.isDigit()会返回，True或者False如果string包含是否仅包含数字。

预期的DataFrame-

+-----+-------+
|   ID| Value |
+-----+-------+
|25q36| False |
|75647| True  |
|13864| True  |
|8758K| False |
|07645| True  |
+-----+-------+

我想避免创建UDF。

史蒂文

一个简单的演员就可以完成这项工作：

from pyspark.sql import functions as F

my_df.select(
  "ID",
  F.col("ID").cast("int").isNotNull().alias("Value ")
).show()

+-----+------+
|   ID|Value |
+-----+------+
|25q36| false|
|75647|  true|
|13864|  true|
|8758K| false|
|07645|  true|
+-----+------+

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-12-19

我来说两句

0 条评论

登录后参与评论

上一篇：Apple Healthkit的睡眠元数据是否有任何特定的结构？

相关文章

如何检查数据框的字符串列是否与另一个数据框的字符串列匹配？

检查数据框中的值是否包含字符串列表中的字符串

如何在C ++中检查字符串中的数据是否为数字？

检查数据框中的列是否包含字符串列表中的任何项目

检查字符串列表是否在熊猫数据框列中

如何检查python中字符串列表中的数字？

如何在pyspark数据框中减去两个字符串列？

如何在Go中检查字符串是否全部为大写或小写？

检查字符串列的最后一个字符是否为Pandas中的数字

检查 pandas 数据框列（字符串/对象）是否为数字（忽略空/NULL/NAN）

如何检查JavaScript中的字符串是否全部大写？

如何检查 Python 数据框列中的第一个字符是否为数字

如何检查字符串中的字符是否为数字？

检查是否为“？” 存在于字符串数据框python中的任何位置

检查数据框中的单元格值是否为字符串

如何检查字符串是否为数字

如何检查字符串是否为数字

如何检查字符串输入是否为数字？

如何检查字符串是否为数字Julia

在dart中检查字符串是否为数字

检查字符串是否为Android中的数字

如何检查字符串列表中的字符串是否在pandas dataframe列中

如何在Java中检查字符串是否为数字

在打字稿中，如何检查字符串是否为数字

如何在Java中检查字符串是否为字母数字

如何检查字符串列表及其索引中是否存在特定字符串

如何检查一行是否包含字符串列表中的特定字符串？

Pyspark：将参数传递给数据框中的字符串列

将字符串列转换为pyspark SQL数据框中的字典

TOP 榜单

文章

热门标签

归档