Apache Spark Interviewfragen und Antworten
Question: What is the difference between a DataFrame and an RDD in Spark?Answer: A DataFrame is a distributed collection of data organized into named columns, similar to a relational table. An RDD (Resilient Distributed Dataset) is a low-level abstraction representing a distributed collection of objects.Example:
|
Zum Wiederholen speichern
Speichere diesen Eintrag als Lesezeichen, markiere ihn als schwierig oder lege ihn in einem Wiederholungsset ab.
Melde dich an, um Lesezeichen, schwierige Fragen und Wiederholungssets zu speichern.
Ist das hilfreich? Ja Nein
Am hilfreichsten laut Nutzern:
- What is the purpose of the Spark SQL module?
- Explain the difference between narrow and wide transformations in Spark.