Вебинары Разобраться в IT Реферальная программа
Программирование Аналитика Дизайн Маркетинг Управление проектами
24 Фев 2023
2 мин
2968

Как подсчитать количество значений NaN в столбце DataFrame в pandas?

В работе с данными на Python, особенно с большими наборами данных, часто приходится сталкиваться с пропущенными или неполными данными. Эти данные обычно

Освойте Python на курсе от Skypro. Вас ждут 400 часов обучения и практики (достаточно десяти часов в неделю), подготовка проектов для портфолио, индивидуальная проверка домашних заданий и помощь опытных наставников. Получится, даже если у вас нет опыта в IT.


В работе с данными на Python, особенно с большими наборами данных, часто приходится сталкиваться с пропущенными или неполными данными. Эти данные обычно представлены как NaN (Not a Number) в DataFrame библиотеки pandas. Важным этапом предварительной обработки данных является обнаружение и обработка таких значений.

Рассмотрим следующий DataFrame в pandas:

import pandas as pd
import numpy as np

data = {'A': [1, 2, np.nan, 4, 5],
        'B': [np.nan, 2, 3, 4, 5],
        'C': [1, 2, 3, np.nan, np.nan],
        'D': [1, 2, 3, 4, 5]}

df = pd.DataFrame(data)

При выводе этого DataFrame на экран, значения NaN будут отображены, указывая на места пропущенных или недостающих данных.

Чтобы подсчитать количество значений NaN в каждом столбце DataFrame, можно использовать метод isnull(), который возвращает DataFrame того же размера, заполненный булевыми значениями. Этот метод возвращает True там, где первоначальные данные были NaN, и False в противном случае.

Затем, чтобы подсчитать количество True (то есть NaN в исходных данных) в каждом столбце, можно использовать метод sum().

В итоге, для подсчета значений NaN в каждом столбце достаточно применить следующую команду:

df.isnull().sum()

Эта команда вернет серию, где индекс будет именами столбцов исходного DataFrame, а значения — количеством NaN в каждом столбце.

Важно помнить, что работа с пропущенными данными — важная часть предварительной обработки данных, и правильное обращение с ними может значительно повлиять на качество последующего анализа данных.

На курсе Skypro «Python-разработчик» освоите основные инструменты программирования, получите опыт на реальных проектах и сможете стартовать в профессии уверенным новичком. Преподаватели — практикующие программисты с большим опытом, а в центре карьеры помогут составить цепляющее резюме и подготовиться к собеседованию.

Проверь как ты усвоил материалы статьи
Пройди тест и узнай насколько ты лучше других читателей

Добавить комментарий