Computer >> Máy Tính >  >> Lập trình >> Python

Python Pandas - Lọc một vài hàng từ DataFrame trên cơ sở tổng

Để lọc một vài hàng khỏi DataFrame trên cơ sở tổng, chúng tôi đã xem xét một ví dụ với Dấu hiệu sinh viên. Chúng ta cần tính tổng của một môn học cụ thể trong đó tổng số lớn hơn 200, tức là tổng số của cả 3 sinh viên trong môn học cụ thể đó là hơn 200. Bằng cách này, chúng ta có thể sắp xếp các hàng của mình có tổng số ít hơn 200.

Đầu tiên, chúng ta hãy tạo DataFrame với 3 cột, tức là bản ghi của 3 sinh viên -

dataFrame = pd.DataFrame({'Jacob_Marks': [95, 90, 70, 85, 88],'Ted_Marks': [60, 50, 65, 85, 70],'Jamie_Marks': [77, 76, 60, 45, 50]})

Lọc trên cơ sở các hàng. Đang tìm nạp các hàng có tổng số lớn hơn 200 cho cả 3 sinh viên -

dataFrame = dataFrame[dataFrame.sum(axis=1) > 200]

Ví dụ

Sau đây là mã hoàn chỉnh -

import pandas as pd

# create a dataframe with 3 columns
dataFrame = pd.DataFrame({'Jacob_Marks': [95, 90, 70, 85, 88],'Ted_Marks': [60, 50, 65, 85, 70],'Jamie_Marks': [77, 76, 60, 45, 50]})

print"Dataframe...\n",dataFrame

# filtering on the basis of rows
# fetching rows with total greater than 200 for all the 3 students
dataFrame = dataFrame[dataFrame.sum(axis=1) > 200]

# dataframe
print"Updated Dataframe...\n",dataFrame

Đầu ra

Điều này sẽ tạo ra kết quả sau -

Dataframe...
   Jacob_Marks  Jamie_Marks   Ted_Marks
0           95           77         60
1           90           76         50
2           70           60         65
3           85           45         85
4           88           50         70
Updated Dataframe...
   Jacob_Marks   Jamie_Marks   Ted_Marks
0           95            77         60
1           90            76         50
3           85            45         85
4           88            50         70