Самые популярные вопросы и ответы для интервью и онлайн-тесты
Образовательная платформа для подготовки к интервью, онлайн-тестов, учебных материалов и живой практики

Развивайте навыки с целевыми маршрутами обучения, пробными тестами и контентом для подготовки к интервью.

WithoutBook объединяет вопросы для интервью по предметам, онлайн-практику, учебные материалы и сравнительные руководства в одном удобном учебном пространстве.

Подготовка к интервью

PySpark вопросы и ответы для интервью

Вопрос 21. What is the purpose of the 'groupBy' operation in PySpark?

'groupBy' is used to group the data based on one or more columns. It is often followed by aggregation functions to perform operations on each group.

Example:

grouped_data = df.groupBy('Category').agg({'Price': 'mean'})

Это полезно? Добавить комментарий Посмотреть комментарии
 

Вопрос 22. Explain the difference between 'cache' and 'persist' operations in PySpark.

'Cache' is a shorthand for 'persist(memory_only=True)', while 'persist' allows more flexibility by specifying storage levels (memory-only, disk-only, etc.).

Example:

df.cache()

Это полезно? Добавить комментарий Посмотреть комментарии
 

Вопрос 23. How can you create a temporary view from a PySpark DataFrame?

You can use the 'createOrReplaceTempView' method to create a temporary view from a PySpark DataFrame.

Example:

df.createOrReplaceTempView('temp_view')

Это полезно? Добавить комментарий Посмотреть комментарии
 

Вопрос 24. What is the purpose of the 'orderBy' operation in PySpark?

'OrderBy' is used to sort the rows of a DataFrame based on one or more columns.

Example:

result = df.orderBy('column')

Это полезно? Добавить комментарий Посмотреть комментарии
 

Вопрос 25. Explain the role of the 'broadcast' variable in PySpark.

A 'broadcast' variable is used to cache a read-only variable in each node of a cluster to enhance the performance of joins.

Example:

from pyspark.sql.functions import broadcast

result = df1.join(broadcast(df2), 'key')

Это полезно? Добавить комментарий Посмотреть комментарии
 

Самое полезное по оценкам пользователей:

Авторские права © 2026, WithoutBook.