Apache Spark Questions et reponses d'entretien
Question : What is the difference between a DataFrame and an RDD in Spark?Reponse : A DataFrame is a distributed collection of data organized into named columns, similar to a relational table. An RDD (Resilient Distributed Dataset) is a low-level abstraction representing a distributed collection of objects.Example:
|
Enregistrer pour revision
Ajoutez cet element aux favoris, marquez-le comme difficile ou placez-le dans un ensemble de revision.
Connectez-vous pour enregistrer des favoris, des questions difficiles et des ensembles de revision.
Est-ce utile ? Oui Non
Les plus utiles selon les utilisateurs :
- What is the purpose of the Spark SQL module?
- Explain the difference between narrow and wide transformations in Spark.