Вебинары Разобраться в IT Реферальная программа
Программирование Аналитика Дизайн Маркетинг
07 Июл 2023
2 мин
159

Направляющие по преобразованию DataFrame с помощью pivot в Python

Преобразование данных в Python с помощью функции pivot в Pandas — это общая задача при анализе данных. Функция pivot позволяет преобразовывать данные из длинного

Преобразование данных в Python с помощью функции pivot в Pandas — это общая задача при анализе данных. Функция pivot позволяет преобразовывать данные из длинного формата в широкий формат, что делает данные более удобными для анализа.

Рассмотрим пример. У нас есть DataFrame, который выглядит следующим образом:

   key   row   item   col  val0  val1
0   key0  row3  item1  col3  0.81  0.04
1   key1  row2  item1  col2  0.44  0.07
2   key1  row0  item1  col0  0.77  0.01
3   key0  row4  item0  col2  0.15  0.59
4   key1  row0  item2  col1  0.81  0.64

На основе этого набора данных могут возникнуть следующие вопросы:

  1. Как преобразовать DataFrame таким образом, чтобы значения ‘col’ стали столбцами, значения ‘row’ стали индексом, а значения ‘val0’ стали значениями в таблице?
  2. Как заполнить недостающие значения нулями?
  3. Как выполнить агрегацию, кроме среднего, например, сумму?
  4. Можно ли выполнить более одной агрегации за раз?
  5. Можно ли агрегировать по нескольким столбцам значений?
  6. Можно ли подразделить по нескольким столбцам?
  7. Как агрегировать частоту, с которой столбец и строки встречаются вместе (т.е. кросс-табуляция)?
  8. Как преобразовать DataFrame из длинного в широкий формат, поворачивая только на двух столбцах?
  9. Как преобразовать множественный индекс в одиночный индекс после применения pivot?

Все эти вопросы можно решить с помощью функции pivot в Pandas. Она принимает три аргумента: индекс, столбцы и значения, и преобразует данные так, что индекс становится индексом DataFrame, столбцы становятся столбцами DataFrame, а значения заполняют DataFrame.

Важно отметить, что при использовании функции pivot, необходимо убедиться, что пары индекс/столбцы уникальны, иначе возникнет ошибка.

Преобразование данных с помощью функции pivot — это мощный инструмент при анализе данных в Python. Он позволяет легко преобразовывать данные между длинным и широким форматами, что делает анализ данных более эффективным и удобным.

Тест на профориентацию
За 10 минут узнайте, как ваш опыт пригодиться в IT индустрии
Подробнее
Тест на профориентацию

Добавить комментарий