При работе с библиотекой Pandas в Python часто возникает задача создания пустого DataFrame и последующего его заполнения данными. Рассмотрим типичный пример.
Возьмем следующую ситуацию: необходимо создать DataFrame с заданными столбцами и индексами в виде временных меток, все значения которого изначально равны 0 или NaN. Затем, в процессе работы, в DataFrame будут добавляться новые значения, а существующие могут изменяться в зависимости от предыдущих.
Создание DataFrame
DataFrame в Pandas можно создать несколькими способами. Один из наиболее простых — использовать конструктор pd.DataFrame()
. Для создания пустого DataFrame с заданными столбцами достаточно передать в конструктор список названий столбцов:
import pandas as pd df = pd.DataFrame(columns=['A', 'B'])
Такой код создаст пустой DataFrame с двумя столбцами «A» и «B».
Заполнение DataFrame
Теперь перейдем к вопросу заполнения DataFrame. Для этого можно использовать метод .loc[]
, который позволяет обращаться к строкам и столбцам DataFrame по их меткам.
Предположим, что необходимо добавить в DataFrame новую строку с меткой ‘2021-01-01’ и значениями столбцов ‘A’ и ‘B’ равными 1 и 2 соответственно:
df.loc['2021-01-01'] = [1, 2]
Или если требуется изменить значение в определенной ячейке, можно указать метку строки и столбца:
df.loc['2021-01-01', 'A'] = 3
Таким образом, создание и заполнение DataFrame в Pandas — это простой и гибкий процесс, который позволяет удобно работать с данными различных типов.
Добавить комментарий