Освойте Python на курсе от Skypro. Вас ждут 400 часов обучения и практики (достаточно десяти часов в неделю), подготовка проектов для портфолио, индивидуальная проверка домашних заданий и помощь опытных наставников. Получится, даже если у вас нет опыта в IT.
В работе с данными на Python, особенно с большими наборами данных, часто приходится сталкиваться с пропущенными или неполными данными. Эти данные обычно представлены как NaN
(Not a Number) в DataFrame библиотеки pandas. Важным этапом предварительной обработки данных является обнаружение и обработка таких значений.
Рассмотрим следующий DataFrame в pandas:
import pandas as pd import numpy as np data = {'A': [1, 2, np.nan, 4, 5], 'B': [np.nan, 2, 3, 4, 5], 'C': [1, 2, 3, np.nan, np.nan], 'D': [1, 2, 3, 4, 5]} df = pd.DataFrame(data)
При выводе этого DataFrame на экран, значения NaN
будут отображены, указывая на места пропущенных или недостающих данных.
Чтобы подсчитать количество значений NaN
в каждом столбце DataFrame, можно использовать метод isnull()
, который возвращает DataFrame того же размера, заполненный булевыми значениями. Этот метод возвращает True
там, где первоначальные данные были NaN
, и False
в противном случае.
Затем, чтобы подсчитать количество True
(то есть NaN
в исходных данных) в каждом столбце, можно использовать метод sum()
.
В итоге, для подсчета значений NaN
в каждом столбце достаточно применить следующую команду:
df.isnull().sum()
Эта команда вернет серию, где индекс будет именами столбцов исходного DataFrame, а значения — количеством NaN
в каждом столбце.
Важно помнить, что работа с пропущенными данными — важная часть предварительной обработки данных, и правильное обращение с ними может значительно повлиять на качество последующего анализа данных.
На курсе Skypro «Python-разработчик» освоите основные инструменты программирования, получите опыт на реальных проектах и сможете стартовать в профессии уверенным новичком. Преподаватели — практикующие программисты с большим опытом, а в центре карьеры помогут составить цепляющее резюме и подготовиться к собеседованию.
Добавить комментарий