Computer >> Máy Tính >  >> Lập trình >> Python

Python - Lọc dữ liệu bằng phương thức Pandas .query ()

Pandas là một thư viện python được sử dụng rất rộng rãi để làm sạch dữ liệu, phân tích dữ liệu, v.v. Trong bài viết này, chúng ta sẽ thấy cách chúng ta có thể sử dụng phương pháp truy vấn để tìm nạp dữ liệu cụ thể từ một tập dữ liệu nhất định. Chúng ta có thể có cả điều kiện đơn và nhiều điều kiện bên trong một truy vấn.

Đọc dữ liệu

Đầu tiên chúng ta hãy đọc dữ liệu vào khung dữ liệu gấu trúc bằng thư viện gấu trúc. Chương trình dưới đây chỉ thực hiện điều đó.

Ví dụ

import pandas as pd

# Reading data frame from csv file
data = pd.read_csv("D:\\heart.csv")

print(data)

Đầu ra

Chạy đoạn mã trên cho chúng ta kết quả sau -

Python - Lọc dữ liệu bằng phương thức Pandas .query ()

Truy vấn với một điều kiện duy nhất

Tiếp theo, chúng ta xem cách chúng ta có thể sử dụng phương thức truy vấn với điều kiện duy nhất. Như bạn có thể thấy kết quả là chỉ có 119 hàng từ 303 hàng ban đầu được trả về.

Ví dụ

import pandas as pd

# Data frame from csv file
data = pd.read_csv("D:\\heart.csv")

data.query('chol < 230', inplace=True)

# Result
print(data)

Đầu ra

Chạy đoạn mã trên cho chúng ta kết quả sau -

Python - Lọc dữ liệu bằng phương thức Pandas .query ()

Truy vấn với nhiều điều kiện

Trong một cách tiếp cận tương tự như trên, chúng ta có thể áp dụng nhiều điều kiện cho phương thức truy vấn. Điều này sẽ hạn chế tập dữ liệu kết quả hơn nữa. Hiện chỉ có 79 hàng được trả lại khi chúng tôi cũng giới hạn độ tuổi lớn hơn 60.

Ví dụ

import pandas as pd

# Data frame from csv file
data = pd.read_csv("D:\\heart.csv")

data.query('chol < 230' and 'age > 60', inplace=True)

# Result
print(data)

Đầu ra

Chạy đoạn mã trên cho chúng ta kết quả sau -

Python - Lọc dữ liệu bằng phương thức Pandas .query ()