Удаление уровня из многоуровневого индекса в Pandas

#Python и Pandas для анализа данных #Анализ данных #Pandas и анализ данных

Пройдите тест, узнайте какой профессии подходите

Сколько вам лет

До 18

От 18 до 24

От 25 до 34

От 35 до 44

От 45 до 49

От 50 до 54

Больше 55

Быстрый ответ

Если вам необходимо исключить определённый уровень из DataFrame с многосоставными колонками в pandas, примените метод droplevel() напрямую к объекту столбцов:

Python

Скопировать код

df.columns = df.columns.droplevel(0)  # замените 0 на номер уровня, который хотите убрать

Таким образом, вы сможете удалить самый внешний уровень, если таковых несколько. Для удаления другого уровня достаточно изменить его порядковый номер.

Конечная цель: Удаление уровня колонки

С выходом версии pandas 0.24.0, стал доступен метод DataFrame.droplevel(). Если вы предпочитаете функциональный подход в программировании, выбор этого метода будет для вас наиболее удобным:

Python

Скопировать код

df = df.droplevel(0, axis=1)

Сборка 'Мстителей': Объединение уровней

Устранить избыточные уровни можно с помощью функции суммирования sum(), применённой к нашему DataFrame. Функция агрегации объединит данные по указанному уровню, таким образом исключая его из структуры.

Python

Скопировать код

df = df.sum(level=1, axis=1)

Дефинирующий удар: Метод .xs

Если вам требуется более контролируемый процесс удаления уровней, воспользуйтесь методом .xs.

Python

Скопировать код

df = df.xs('Key_Level', axis=1, drop_level=True)

Визуализация

Рассмотрим многоуровневую структуру как шкаф с файлами, разбитыми на ящики:

Markdown

Скопировать код

🗂 Верхний ящик (Уровень 0): 'Предмет'
🗂 Средний ящик (Уровень 1): 'Глава'
🗂 Нижний ящик (Уровень 2): 'Тема'

Удаление уровня поможет нам упростить эту систему организации данных.

Python

Скопировать код

df.columns = df.columns.droplevel(1)

И теперь мы получаем оптимизированную структуру:

Markdown

Скопировать код

🗂 Переработанный ящик: 'Предмет'  |  'Тема'

Как создавать многоуровневые индексы

Метод pd.MultiIndex.from_tuples() возможно использовать для создания многоуровневых индексов.

Python

Скопировать код

tuples = [('a', 'b'), ('a', 'c')]
df.columns = pd.MultiIndex.from_tuples(tuples)

Цепочки методов для более эффективного кода

Фраза «меньше значит больше» отлично передаёт суть использования цепочек методов в pandas:

Python

Скопировать код

df = (df.set_index('Key_Column')
        .droplevel(0, axis=1)
        .reset_index())

Перестройка структуры колонок

Для изменения индексов колонок используйте метод get_level_values():

Python

Скопировать код

new_columns = df.columns.get_level_values(1)
df.columns = new_columns

Полезные материалы

Завершение

Углубление ваших знаний — путь к пониманию. Не прекращайте практиковать и, если этот ответ был полезен, не забудьте его отметить. Удачи в программировании! 👩‍💻

Проверь как ты усвоил материалы статьи

Пройди тест и узнай насколько ты лучше других читателей

Какой метод используется для удаления уровня из многоуровневого индекса в Pandas?

1 / 5

Екатерина Громова

аналитик данных

Свежие материалы

Как использовать API ChatGPT: руководство для начинающих

6 сентября 2024

Видео уроки по искусственному интеллекту

6 сентября 2024

Анализ данных и генерация текста с помощью ChatGPT API

6 сентября 2024

Удаление уровня из многоуровневого индекса в Pandas

Быстрый ответ

Конечная цель: Удаление уровня колонки

Сборка 'Мстителей': Объединение уровней

Дефинирующий удар: Метод .xs

Визуализация

Как создавать многоуровневые индексы

Цепочки методов для более эффективного кода

Перестройка структуры колонок

Полезные материалы

Завершение

Загрузка...