Что делает np.arange(5)?
Создаёт массив целых чисел от 0 до 4
Какой метод используется для чтения CSV-файла в pandas?
pd.read_csv()
Какая функция строит линейный график в matplotlib?
plt.plot()
На основе какой библиотеки построен seaborn?
matplotlib
Какая функция делает DataFrame "ленивым"?
lazy()
Что выведет код?
import numpy as np
a = np.array([1,2,3])
print(a * 2)
Что вернёт выражение: df[df["age"] > 18]?
Что делает параметр figsize=(10,5)?
Устанавливает размеры холста в дюймах
Какая функция seaborn строит heatmap?
sns.heatmap()
Какую функцию необходимо вызвать, чтобы увидеть lazyDataFrame?
collect()
Что выведет код?
import numpy as np
a = np.array([1,2,3])
b = np.array([4,5,6])
print(a @ b)
32
В чём разница между loc и iloc?
loc - индексация по label
iloc - индексация по индексу
Что нужно вызвать, чтобы график появился в Jupyter Notebook?
plt.show()
Что делает параметр hue в seaborn?
Разделяет данные с помощью цвета по категориям
Что делает код?
import polars as pl
df = pl.DataFrame({"a":[1,2,3]})
print(df.select(pl.col("a") * 10))
[10
20
30]
Что выведет код?
import numpy as np
a = np.array([1,2,3])
b = np.array([[10],[20]])
print(a + b)
[[11 12 13]
[21 22 23]]
Что выведет код?
import pandas as pd
df = pd.DataFrame({"A":[1,2,None]})
print(df["A"].mean())
1.5
Найдите ошибку:
import matplotlib.pyplot as plt
x = [1,2,3] y = [1,4,9]
plt.plot(x,y)
plt.title = ("Graph")
plt.show()
plt.title("Graph")
Какой тип графика лучше всего подойдёт для отображения распределения одной числовой переменной и почему?
Гистограмма
В чём разница между select() и with_columns() в Polars?
select создаёт новый DataFrame только с указанными колонками или выражениями.
with_columns добавляет или изменяет колонки в исходном DataFrame (логически — возвращает новый DF, но сохраняет структуру).
Что выведет код?
import numpy as np
a = np.array([[1,2],[3,4]])
b = a[:,1]
b[0] = 100
print(a)
[[ 1 100]
[ 3 4]]
Объясните разницу между inner, left, right и outer join.
inner - Оставляет только совпадающие ключи в обеих таблицах
left - Оставляет ВСЕ строки из левой таблицы.
Если совпадения нет, то NaN.
right - Оставляет все строки из правой таблицы
outer - Оставляет ВСЕ ключи из обеих таблиц. Где нет совпадений - NaN.
Что делает subplot() в matplotlib и в каких случаях он особенно полезен? Приведите пример использования.
subplot() позволяет разделить одну фигуру на несколько графиков (подграфиков).
Вам нужно показать зависимость между 5 числовыми признаками и одной категориальной переменной. Какие графики seaborn вы бы выбрали и почему?
pairplot для общего обзора,
scatterplot для отдельных зависимостей,
boxplot/violinplot для сравнения распределений между категориями
heatmap для анализа корреляций.
В чём разница между asof join и обычным join в Polars?
asof_join ищет совпадения “по ближайшему значению”, а не по точному совпадению.