Библиотека pandas является одной из самых популярных библиотек в Python для обработки и анализа данных. С помощью pandas можно легко манипулировать таблицами данных, выполнять различные агрегации и визуализации. В этой статье мы рассмотрим основные возможности работы с pandas и научимся использовать эту библиотеку.
Установка и импорт
Для начала работы с pandas, убедитесь, что у вас установлена эта библиотека. Если нет, установите ее с помощью команды:
pip install pandas
Далее импортируйте библиотеку в свой Python-скрипт:
import pandas as pd
Создание и чтение DataFrame
DataFrame – это основной объект pandas, который представляет собой двумерную таблицу с метками на строках и колонках. Создадим простой DataFrame из словаря:
data = { "Name": ["Alice", "Bob", "Charlie"], "Age": [25, 30, 35], "City": ["New York", "San Francisco", "Los Angeles"] } df = pd.DataFrame(data)
Чтобы загрузить данные из файла, например, CSV, используйте следующую функцию:
df = pd.read_csv("file.csv")
Основные операции с DataFrame
Посмотрим на первые 5 строк нашего DataFrame:
print(df.head())
Выберем определенную колонку:
print(df["Name"])
Выберем строки по индексу:
print(df.loc[1])
Выберем строки и колонки по условию:
print(df[df["Age"] > 25])
Агрегация данных
С помощью pandas можно легко агрегировать данные. Например, посчитаем средний возраст:
print(df["Age"].mean())
Или найдем минимальное и максимальное значение:
print(df["Age"].min()) print(df["Age"].max())
Сохранение DataFrame
Чтобы сохранить ваш DataFrame в файл, например, в формате CSV, используйте следующую функцию:
df.to_csv("output.csv", index=False)
Теперь вы знаете основы работы с библиотекой pandas в Python. 😊 Удачи вам в изучении этой мощной библиотеки и использовании ее для анализа данных! Не забывайте практиковаться и пробовать новые возможности pandas на реальных проектах.
Добавить комментарий