Вебинары Разобраться в IT Реферальная программа
Программирование Аналитика Дизайн Маркетинг Управление проектами
7 профессий по цене одной
07:05:47:06
дн. ч. мин. сек.
20 Июл 2024
1 мин
2169

Замена значений NaN на ноль в столбце DataFrame Pandas

Часто при работе с данными в Python и библиотеке Pandas возникает проблема обработки пропущенных или неопределенных значений, которые обычно представлены

Часто при работе с данными в Python и библиотеке Pandas возникает проблема обработки пропущенных или неопределенных значений, которые обычно представлены как NaN (Not a Number). Пример такого DataFrame может выглядеть следующим образом:

import pandas as pd
import numpy as np

data = {'A': [1, 2, np.nan], 'B': [5, np.nan, np.nan], 'C': [1, 2, 3]}
df = pd.DataFrame(data)

print(df)

Вывод:

     A    B  C
0  1.0  5.0  1
1  2.0  NaN  2
2  NaN  NaN  3

Для замены всех значений NaN на ноль в определенном столбце DataFrame можно использовать метод fillna(). Этот метод позволяет заменить пропущенные данные на указанное значение. Применяется он следующим образом:

df['A'] = df['A'].fillna(0)

В результате все значения NaN в столбце ‘A’ будут заменены на 0:

     A    B  C
0  1.0  5.0  1
1  2.0  NaN  2
2  0.0  NaN  3

Если же требуется заменить все значения NaN на ноль во всем DataFrame, то можно использовать ту же функцию без указания конкретного столбца:

df = df.fillna(0)

В результате все значения NaN в DataFrame заменяются на 0:

     A    B  C
0  1.0  5.0  1
1  2.0  0.0  2
2  0.0  0.0  3

Таким образом, функция fillna() представляет собой простой и эффективный способ замены пропущенных или неопределенных значений на ноль или любое другое значение в DataFrame библиотеки Pandas.

Проверь как ты усвоил материалы статьи
Пройди тест и узнай насколько ты лучше других читателей

Добавить комментарий