Иногда при работе с наборами данных в Pandas нужно выбрать несколько столбцов из существующего DataFrame и создать из них новый DataFrame. Это может быть полезно во многих случаях, например, когда необходимо провести анализ только определенных столбцов данных.
Пример проблемы
Представим, что есть DataFrame, который содержит данные о студентах:
import pandas as pd data = { 'Имя': ['Алексей', 'Виктория', 'Сергей', 'Елена'], 'Возраст': [23, 20, 22, 21], 'Специальность': ['Математика', 'Физика', 'Химия', 'Биология'], 'Средний балл': [4.5, 4.7, 4.1, 4.2] } df = pd.DataFrame(data) print(df)
Вывод:
Имя Возраст Специальность Средний балл
0 Алексей 23 Математика 4.5
1 Виктория 20 Физика 4.7
2 Сергей 22 Химия 4.1
3 Елена 21 Биология 4.2
Теперь предположим, что нам нужно создать новый DataFrame, который содержит только имена студентов и их специальности.
Решение
Для этого можно использовать двойные квадратные скобки [[ ]]
. Внутри вторых скобок указываются имена столбцов, которые нужно выбрать.
df1 = df[['Имя', 'Специальность']] print(df1)
Вывод:
Имя Специальность
0 Алексей Математика
1 Виктория Физика
2 Сергей Химия
3 Елена Биология
Таким образом, df1
теперь является новым DataFrame, который содержит только имена студентов и их специальности.
Заключение
Выбор нескольких столбцов из DataFrame в Pandas — это простая и часто используемая операция. Основная идея здесь — использовать двойные квадратные скобки для выбора нужных столбцов. Это позволяет быстро и эффективно создавать новые DataFrame из существующих данных.
Добавить комментарий