Самые популярные вопросы и ответы для интервью и онлайн-тесты
Образовательная платформа для подготовки к интервью, онлайн-тестов, учебных материалов и живой практики

Развивайте навыки с целевыми маршрутами обучения, пробными тестами и контентом для подготовки к интервью.

WithoutBook объединяет вопросы для интервью по предметам, онлайн-практику, учебные материалы и сравнительные руководства в одном удобном учебном пространстве.

Подготовка к интервью

Apache Spark вопросы и ответы для интервью

Вопрос 6. Explain the concept of partitions in Apache Spark.

Partitions are basic units of parallelism in Spark. They represent the logical division of data across the nodes in a cluster, and each partition is processed independently.

Example:

val inputRDD = sc.parallelize(Seq(1, 2, 3, 4, 5), 2)

Это полезно? Добавить комментарий Посмотреть комментарии
 

Вопрос 7. What is a Spark Executor and what role does it play in Spark applications?

A Spark Executor is a process responsible for executing tasks on a worker node. Executors are launched at the beginning of a Spark application and run tasks until the application completes or encounters an error.

Example:

spark-submit --master yarn --deploy-mode client --num-executors 3 mySparkApp.jar

Это полезно? Добавить комментарий Посмотреть комментарии
 

Вопрос 8. How does Spark handle fault tolerance in RDDs?

Spark achieves fault tolerance through lineage information (DAG) and recomputing lost data from the original source. If a partition of an RDD is lost, Spark can recompute it using the lineage information.

Example:

val resilientRDD = originalRDD.filter(x => x > 0)

Это полезно? Добавить комментарий Посмотреть комментарии
 

Вопрос 9. What is the Broadcast variable in Spark and when is it used?

A Broadcast variable is a read-only variable cached on each worker node. It is used to efficiently distribute large read-only data structures, such as lookup tables, to all tasks in a Spark job.

Example:

val broadcastVar = sc.broadcast(Array(1, 2, 3))

Это полезно? Добавить комментарий Посмотреть комментарии
 

Вопрос 10. Explain the role of the Spark Driver in a Spark application.

The Spark Driver is the program that runs the main() function and creates the SparkContext. It coordinates the execution of tasks on the Spark Executors and collects results from them.

Example:

object MyApp {
  def main(args: Array[String]): Unit = {
    val sc = new SparkContext("local", "MyApp")
  }
}

Это полезно? Добавить комментарий Посмотреть комментарии
 

Самое полезное по оценкам пользователей:

Авторские права © 2026, WithoutBook.