Удаление строк с NaN в определенном столбце в Pandas DataFrame

Пройдите тест, узнайте какой профессии подходите

Содержание

Вконтакте

Одноклассники

Скопировать ссылку

Часто при работе с данными в Python с помощью библиотеки Pandas возникают ситуации, когда в определенном столбце присутствуют пропущенные значения (NaN).

Алексей Кодов

Автор статьи

Освойте Python на курсе от Skypro. Вас ждут 400 часов обучения и практики (достаточно десяти часов в неделю), подготовка проектов для портфолио, индивидуальная проверка домашних заданий и помощь опытных наставников. Получится, даже если у вас нет опыта в IT.

Часто при работе с данными в Python с помощью библиотеки Pandas возникают ситуации, когда в определенном столбце присутствуют пропущенные значения (NaN). Во многих случаях, для анализа данных удобнее работать только с полными данными, то есть удалять те строки, в которых есть пропущенные значения.

Пример ситуации: имеется DataFrame с информацией о компаниях и их доходах. Однако, в некоторых строках данные о доходах отсутствуют и отображаются как NaN.

import pandas as pd
import numpy as np

data = {'Компания': ['ООО "Рога и Копыта"', 'АО "Красная шапка"', 'ООО "Зайцы и морковка"', 'АО "Белые медведи"'],
        'Доход': [500000, np.nan, 300000, np.nan]}

df = pd.DataFrame(data)

В результате получается следующий DataFrame:

| | Компания | Доход |
|—:|:———————|———:|
| 0 | ООО «Рога и Копыта» | 500000 |
| 1 | АО «Красная шапка» | NaN |
| 2 | ООО «Зайцы и морковка» | 300000 |
| 3 | АО «Белые медведи» | NaN |

Для удаления строк с пропущенными значениями в столбце ‘Доход’ можно воспользоваться методом dropna:

df = df.dropna(subset=['Доход'])

В результате получим DataFrame без строк, в которых в столбце ‘Доход’ были пропущенные значения:

| | Компания | Доход |
|—:|:———————|———:|
| 0 | ООО «Рога и Копыта» | 500000 |
| 2 | ООО «Зайцы и морковка» | 300000 |

Таким образом, с помощью метода dropna можно легко и быстро удалить из DataFrame строки с пропущенными значениями в определенном столбце.

На курсе Skypro «Python-разработчик» освоите основные инструменты программирования, получите опыт на реальных проектах и сможете стартовать в профессии уверенным новичком. Преподаватели — практикующие программисты с большим опытом, а в центре карьеры помогут составить цепляющее резюме и подготовиться к собеседованию.

Пройди тест: кто я в IT

Удаление строк с NaN в определенном столбце в Pandas DataFrame

Добавить комментарий

Ещё по теме