我是新手,并且正在玩Pyspark.sql。根据pyspark.sql文档 这里,可以像这样设置Spark数据帧和架构:
rdd = sc.textFile('./some csv_to_play_around.csv'
schema = StructType([StructField('Name', StringType(), True),
StructField('DateTime', TimestampType(), True)
StructField('Age', IntegerType(), True)])
# create dataframe
df3 = sqlContext.createDataFrame(rdd, schema)
我的问题是,什么是 True
代表着 schema
列表上面?我似乎无法在文档中找到它。提前致谢