我想创建一个示例单列 DataFrame,但以下代码不起作用:
df = spark.createDataFrame(["10","11","13"], ("age"))
## ValueError
## ...
## ValueError: Could not parse datatype: age
预期结果:
age
10
11
13
以下代码不起作用
对于单个元素,您需要一个模式作为类型
spark.createDataFrame(["10","11","13"], "string").toDF("age")
或DataType
:
from pyspark.sql.types import StringType
spark.createDataFrame(["10","11","13"], StringType()).toDF("age")
名称元素应该是元组和模式作为序列:
spark.createDataFrame([("10", ), ("11", ), ("13", )], ["age"])
本文收集自互联网,转载请注明来源。
如有侵权,请联系 [email protected] 删除。
我来说两句