NumPy
Pandas
Matplotlib
Seaborn
Polars
100

Что делает np.arange(5)?

Создаёт массив целых чисел от 0 до 4

100

Какой метод используется для чтения CSV-файла в pandas?

pd.read_csv()

100

Какая функция строит линейный график в matplotlib?

plt.plot()

100

На основе какой библиотеки построен seaborn?

matplotlib

100

Какая функция делает DataFrame "ленивым"?

lazy()

200

Что выведет код?  

import numpy as np 

a = np.array([1,2,3]) 

print(a * 2)

[2, 4, 6]
200

Что вернёт выражение: df[df["age"] > 18]?

Строки, в которых в столбце age число больше 18
200

Что делает параметр figsize=(10,5)?

Устанавливает размеры холста в дюймах

200

Какая функция seaborn строит heatmap?

sns.heatmap()

200

Какую функцию необходимо вызвать, чтобы увидеть lazyDataFrame?

collect()

300

Что выведет код? 

import numpy as np

a = np.array([1,2,3])

b = np.array([4,5,6])

print(a @ b)

32

300

В чём разница между loc и iloc?

loc - индексация по label

iloc - индексация по индексу

300

Что нужно вызвать, чтобы график появился в Jupyter Notebook?

plt.show()

300

Что делает параметр hue в seaborn?

Разделяет данные с помощью цвета по категориям

300

Что делает код?  

import polars as pl

df = pl.DataFrame({"a":[1,2,3]})

print(df.select(pl.col("a") * 10))

[10

20

30]

400

Что выведет код?  

import numpy as np

a = np.array([1,2,3])

b = np.array([[10],[20]])

print(a + b)

[[11 12 13]
 [21 22 23]]

400

Что выведет код?  

import pandas as pd

df = pd.DataFrame({"A":[1,2,None]})

print(df["A"].mean())

1.5

400

Найдите ошибку:  

import matplotlib.pyplot as plt

x = [1,2,3] y = [1,4,9]

plt.plot(x,y)

plt.title = ("Graph")

plt.show()

plt.title("Graph")

400

Какой тип графика лучше всего подойдёт для отображения распределения одной числовой переменной и почему?

Гистограмма

400

В чём разница между select() и with_columns() в Polars?

select создаёт новый DataFrame только с указанными колонками или выражениями.

with_columns добавляет или изменяет колонки в исходном DataFrame (логически — возвращает новый DF, но сохраняет структуру).

500

Что выведет код?  

import numpy as np

a = np.array([[1,2],[3,4]])

b = a[:,1]

b[0] = 100

print(a)

[[  1 100]
 [  3   4]]

500

Объясните разницу между inner, left, right и outer join.

inner - Оставляет только совпадающие ключи в обеих таблицах

left - Оставляет ВСЕ строки из левой таблицы. 

Если совпадения нет, то NaN.

right - Оставляет все строки из правой таблицы

outer - Оставляет ВСЕ ключи из обеих таблиц. Где нет совпадений - NaN.

500

Что делает subplot() в matplotlib и в каких случаях он особенно полезен? Приведите пример использования.

subplot() позволяет разделить одну фигуру на несколько графиков (подграфиков).

500

Вам нужно показать зависимость между 5 числовыми признаками и одной категориальной переменной. Какие графики seaborn вы бы выбрали и почему?

pairplot для общего обзора, 

scatterplot для отдельных зависимостей, 

boxplot/violinplot для сравнения распределений между категориями

heatmap для анализа корреляций.

500

В чём разница между asof join и обычным join в Polars?

asof_join ищет совпадения “по ближайшему значению”, а не по точному совпадению.

M
e
n
u