我是 Spark 的初学者,在阅读 Dataframe 时,我经常发现以下两个关于 dataframe 的语句-
1) DataFrame 是无类型的 2) DataFrame 有架构(就像数据库表一样,它包含与表属性相关的所有信息 - 名称、类型、非空)
这两个陈述不是相互矛盾的吗?首先,我们说 Dataframe 未键入,同时我们还说 Dataframe 具有有关所有列的信息,即架构,请帮助我在这里缺少什么?因为如果数据框有架构,那么它也知道列的类型,所以它是如何变成无类型的?
bigdata apache-spark apache-spark-sql
apache-spark ×1
apache-spark-sql ×1
bigdata ×1