PySpark 面接の質問と回答
Question: Explain the concept of Resilient Distributed Datasets (RDD) in PySpark.Answer: RDD is the fundamental data structure in PySpark, representing an immutable distributed collection of objects. It allows parallel processing and fault tolerance.Example:
|
復習用に保存
この項目をブックマークに追加したり、難しい内容としてマークしたり、復習セットに入れたりできます。
役に立ちましたか? はい いいえ
ユーザー評価で最も役立つ内容: