ПРИХОДИТЕ УЧИТЬСЯ НОВОЙ ПРОФЕССИИ ЛЕТОМ СО СКИДКОЙ ДО 70%Забронировать скидку

Параметр 'axis' в Pandas: правильное использование в mean()

Пройдите тест, узнайте какой профессии подходите и получите бесплатную карьерную консультацию
В конце подарим скидку до 55% на обучение
Я предпочитаю
0%
Работать самостоятельно и не зависеть от других
Работать в команде и рассчитывать на помощь коллег
Организовывать и контролировать процесс работы

Быстрый ответ

В библиотеке Pandas параметр axis определяет направление выполнения операции: движение вниз по строкам (по умолчанию) соответствует axis=0, что эквивалентно операциям агрегации данных по столбцам; движение вбок по столбцам соответствует axis=1, что эквивалентно операциям агрегации данных по строкам.

Python
Скопировать код
# Суммирование по столбцам: прямое движение вниз (axis=0)
column_sum = df.sum()  

# Суммирование по строкам: движение идет вбок по столбцам (axis=1)
row_sum = df.sum(axis=1)

Здесь column_sum вернёт сумму элементов по столбцам, а row_sum — сумму элементов по строкам.

Пройдите тест и узнайте подходит ли вам сфера IT
Пройти тест

Исследование с использованием 'index' и 'columns'

Выберите метки axis='index' или axis='columns' вместо числовых индикаторов axis=0 или axis=1. Это повышает читаемость кода при вычислении среднего значения по строкам или столбцам:

Python
Скопировать код
# Среднее значение вдоль индекса (эквивалентно axis=0):
mean_index = df.mean(axis='index')  

# Среднее значение вдоль столбцов (эквивалентно axis=1):
mean_columns = df.mean(axis='columns')

Детальное рассмотрение сложного использования и возможных ошибок

Целенаправленная работа с конкретными строками или столбцами

Профессиональная разработка требует точности. Использование df.loc[] в сочетании с параметром axis позволяет осуществлять непосредственное вычисление конкретных строк или столбцов:

Python
Скопировать код
# Вычисление среднего для определённых столбцов: 'A' и 'B' – не просто символы
specific_mean = df.loc[:, ['A', 'B']].mean(axis=0)

# Вычисление среднего для определённых строк: иногда ключ к пониманию данных – в строках
specific_row_mean = df.loc['row_label'].mean()

Эффект домино: как меняются данные после set_index

Применение функции set_index может полностью изменить интерпретацию параметра axis. Это особо актуально при использовании последовательных операций:

Python
Скопировать код
# Изменение индекса повлияет на структуру данных:
df_with_new_index = df.set_index('new_column')
mean_with_new_index = df_with_new_index.mean(axis='index')

Искусство конкатенации данных

При использовании pd.concat() параметр axis определяет, в каком направлении выполняется соединение. Это оказывает влияние на структуру результата:

Python
Скопировать код
# Конкатенация столбцов приводит к расширению горизонтальной структуры:
concatenated_columns = pd.concat([df1, df2], axis='columns')

# Конкатенация строк увеличивает вертикальный размер данных:
concatenated_rows = pd.concat([df1, df2], axis='index')

Запомните: результат конкатенации может значительно изменить ваш набор данных!

Вопрос перспективы: применим транспонирование

Иногда транспонирование DataFrame позволяет взглянуть на данные с новой стороны:

Python
Скопировать код
# Транспонирование – это переосмысление данных:
transposed_df = df.T

Визуализация

Вот так можно визуализировать параметр axis :

axis=0 (⬇️)axis=1 (➡️)
Вниз по строкамВбок по столбцам

В Pandas параметр axis контролирует направление операций, указывая направлять их вниз по строкам или вбок по столбцам.

Советы, оси и гибкость работы с pandas

NumPy: Ближайший сосед

NumPy и pandas часто используются совместно. Особенности осей в pandas во многом объясняются влиянием NumPy. В NumPy при axis=None (по умолчанию) операции применяются ко всему массиву, что аналогично выполнению операции на полном наборе данных в DataFrame в pandas:

Python
Скопировать код
# Вычисление среднего по всему массиву в NumPy:
np_mean = numpy_array.mean(axis=None)

# Аналогичная операция в Pandas:
flat_mean = df.values.flatten().mean()

Массивы – универсальное средство

В связи со своей гибкостью и прозрачностью представления данных, массивы зачастую предпочтительнее матриц:

Python
Скопировать код
# Массивы, выбор многих:
array_like = df.iloc[:,0]

Ориентир в мире данных для новичков

Axis в мире данных Python – важный ориентир. Знание осей позволяет сохранить контроль при использовании агрегирующих функций (mean(), sum) и функций изменения формы (stack(), unstack()).

Полезные материалы

  1. DataFrame — документация Pandas 2.2.0
  2. python – Как понять ось в pandas? – Stack Overflow
  3. Pandas и Python для анализа данных – Real Python
  4. Совершенство агрегации данных с помощью Groupby в Pandas
  5. Pandas для всех: параметр Axis – лекция на YouTube от Даниэля Чена