Как добавить строку в DataFrame pandas

Пройдите тест, узнайте какой профессии подходите

Я предпочитаю
0%
Работать самостоятельно и не зависеть от других
Работать в команде и рассчитывать на помощь коллег
Организовывать и контролировать процесс работы

Введение

Работа с DataFrame в pandas — это основа анализа данных в Python. DataFrame представляет собой двумерную таблицу данных, аналогичную таблицам в базах данных или электронных таблицах Excel. Одной из часто встречающихся задач является добавление новой строки в уже существующий DataFrame. В этой статье мы рассмотрим несколько способов, как это сделать, используя методы loc и append. Мы также обсудим, в каких ситуациях каждый из этих методов может быть наиболее полезен, и приведем примеры кода, которые помогут вам лучше понять их применение.

Кинга Идем в IT: пошаговый план для смены профессии

Создание DataFrame

Прежде чем мы начнем добавлять строки, давайте создадим примерный DataFrame. Это поможет нам лучше понять, как работают методы добавления строк. DataFrame можно создать из различных источников данных, таких как списки, словари или даже файлы CSV. В нашем примере мы будем использовать словарь для создания DataFrame.

Python
Скопировать код
import pandas as pd

# Создаем DataFrame
data = {
    'Name': ['Alice', 'Bob', 'Charlie'],
    'Age': [25, 30, 35],
    'City': ['New York', 'Los Angeles', 'Chicago']
}

df = pd.DataFrame(data)
print(df)

Этот код создаст DataFrame с тремя столбцами: Name, Age и City, и тремя строками. DataFrame будет выглядеть следующим образом:

      Name  Age         City
0    Alice   25     New York
1      Bob   30  Los Angeles
2  Charlie   35      Chicago

Добавление строки с использованием loc

Метод loc позволяет добавлять строки, указывая индекс новой строки и значения для каждого столбца. Этот метод особенно полезен, если вам нужно добавить строку в определенное место DataFrame. Например, если вы хотите добавить строку с индексом 3, вы можете использовать следующий код:

Python
Скопировать код
# Добавляем новую строку с использованием loc
df.loc[3] = ['David', 40, 'San Francisco']
print(df)

После выполнения этого кода, DataFrame будет выглядеть следующим образом:

      Name  Age           City
0    Alice   25       New York
1      Bob   30    Los Angeles
2  Charlie   35        Chicago
3    David   40  San Francisco

Метод loc также позволяет добавлять строки в любое место DataFrame, указывая соответствующий индекс. Например, если вы хотите добавить строку с индексом 1.5, вы можете использовать следующий код:

Python
Скопировать код
# Добавляем новую строку с использованием loc
df.loc[1\.5] = ['Eve', 28, 'Boston']
print(df)

После выполнения этого кода, DataFrame будет выглядеть следующим образом:

      Name  Age           City
0    Alice   25       New York
1      Bob   30    Los Angeles
1.5    Eve   28         Boston
2  Charlie   35        Chicago
3    David   40  San Francisco

Добавление строки с использованием append

Метод append позволяет добавлять строки к DataFrame, создавая новый DataFrame. Этот метод удобен, если вам нужно добавить несколько строк или если вы хотите сохранить оригинальный DataFrame неизменным. Например, если вы хотите добавить строку с именем Eve, возрастом 28 и городом Boston, вы можете использовать следующий код:

Python
Скопировать код
# Создаем новую строку в виде словаря
new_row = {'Name': 'Eve', 'Age': 28, 'City': 'Boston'}

# Добавляем новую строку с использованием append
df = df.append(new_row, ignore_index=True)
print(df)

После выполнения этого кода, DataFrame будет выглядеть следующим образом:

      Name  Age           City
0    Alice   25       New York
1      Bob   30    Los Angeles
2  Charlie   35        Chicago
3    David   40  San Francisco
4      Eve   28         Boston

Метод append также позволяет добавлять несколько строк одновременно. Например, если вы хотите добавить две новые строки, вы можете использовать следующий код:

Python
Скопировать код
# Создаем новые строки в виде списка словарей
new_rows = [
    {'Name': 'Frank', 'Age': 33, 'City': 'Seattle'},
    {'Name': 'Grace', 'Age': 29, 'City': 'Austin'}
]

# Добавляем новые строки с использованием append
df = df.append(new_rows, ignore_index=True)
print(df)

После выполнения этого кода, DataFrame будет выглядеть следующим образом:

      Name  Age           City
0    Alice   25       New York
1      Bob   30    Los Angeles
2  Charlie   35        Chicago
3    David   40  San Francisco
4      Eve   28         Boston
5    Frank   33        Seattle
6    Grace   29         Austin

Заключение

Теперь вы знаете два основных способа добавления строк в DataFrame pandas: с использованием методов loc и append. Оба метода имеют свои преимущества и могут быть использованы в зависимости от конкретной задачи. Метод loc позволяет добавлять строки в определенное место DataFrame и может быть полезен, если вам нужно добавить строку с определенным индексом. Метод append позволяет добавлять строки, создавая новый DataFrame, и может быть удобен, если вам нужно добавить несколько строк или если вы хотите сохранить оригинальный DataFrame неизменным.

Надеемся, что эта статья помогла вам лучше понять, как работать с DataFrame в pandas. Теперь вы можете использовать эти методы для добавления строк в ваши собственные DataFrame и улучшить свои навыки анализа данных в Python.

Читайте также