如何检查pyspark数据框中的字符串列是否全部为数字

cph_sto

我有一个PySparkDataframe与一列strings如何检查其中的哪些行是数字。我在PySpark的官方文档中找不到任何功能-

values = [('25q36',),('75647',),('13864',),('8758K',),('07645',)]
df = sqlContext.createDataFrame(values,['ID',])
df.show()
+-----+
|   ID|
+-----+
|25q36|
|75647|
|13864|
|8758K|
|07645|
+-----+

在Python中,有一个函数.isDigit()会返回,True或者False如果string包含是否仅包含数字。

预期的DataFrame-

+-----+-------+
|   ID| Value |
+-----+-------+
|25q36| False |
|75647| True  |
|13864| True  |
|8758K| False |
|07645| True  |
+-----+-------+

我想避免创建UDF

史蒂文

一个简单的演员就可以完成这项工作:

from pyspark.sql import functions as F

my_df.select(
  "ID",
  F.col("ID").cast("int").isNotNull().alias("Value ")
).show()

+-----+------+
|   ID|Value |
+-----+------+
|25q36| false|
|75647|  true|
|13864|  true|
|8758K| false|
|07645|  true|
+-----+------+

本文收集自互联网,转载请注明来源。

如有侵权,请联系 [email protected] 删除。

编辑于
0

我来说两句

0 条评论
登录 后参与评论

相关文章

如何检查数据框的字符串列是否与另一个数据框的字符串列匹配?

检查数据框中的值是否包含字符串列表中的字符串

如何在C ++中检查字符串中的数据是否为数字?

检查数据框中的列是否包含字符串列表中的任何项目

检查字符串列表是否在熊猫数据框列中

如何检查python中字符串列表中的数字?

如何在pyspark数据框中减去两个字符串列?

如何在Go中检查字符串是否全部为大写或小写?

检查字符串列的最后一个字符是否为Pandas中的数字

检查 pandas 数据框列(字符串/对象)是否为数字(忽略空/NULL/NAN)

如何检查JavaScript中的字符串是否全部大写?

如何检查 Python 数据框列中的第一个字符是否为数字

如何检查字符串中的字符是否为数字?

检查是否为“?” 存在于字符串数据框python中的任何位置

检查数据框中的单元格值是否为字符串

如何检查字符串是否为数字

如何检查字符串是否为数字

如何检查字符串输入是否为数字?

如何检查字符串是否为数字Julia

在dart中检查字符串是否为数字

检查字符串是否为Android中的数字

如何检查字符串列表中的字符串是否在pandas dataframe列中

如何在Java中检查字符串是否为数字

在打字稿中,如何检查字符串是否为数字

如何在Java中检查字符串是否为字母数字

如何检查字符串列表及其索引中是否存在特定字符串

如何检查一行是否包含字符串列表中的特定字符串?

Pyspark:将参数传递给数据框中的字符串列

将字符串列转换为pyspark SQL数据框中的字典