При работе с библиотекой pandas в Python часто возникает задача выбора определенных строк из DataFrame на основе значений в определенных столбцах. Это достаточно простая задача, если выбирать строки по одному значению. Например, есть DataFrame:
import pandas as pd df = pd.DataFrame({'A' : [5,6,3,4], 'B' : [1,2,3, 5]}) print(df)
Результатом будет:
A B
0 5 1
1 6 2
2 3 3
3 4 5
И для выбора строк, где значение в столбце ‘A’ равно 3, можно использовать следующий код:
x = df[df['A'] == 3] print(x)
Что даст следующий результат:
A B
2 3 3
Однако, что делать, если необходимо выбрать строки по нескольким значениям? Например, выбрать все строки, где значение в столбце ‘A’ равно 3 или 6. Для этого можно использовать функцию isin()
из библиотеки pandas.
list_of_values = [3,6] y = df[df['A'].isin(list_of_values)] print(y)
В результате получится следующий DataFrame:
A B
1 6 2
2 3 3
Таким образом, с помощью функции isin()
можно выбрать строки из DataFrame pandas по списку значений. Это удобный и простой способ фильтрации данных.
Добавить комментарий