Computer >> Máy Tính >  >> Lập trình >> Python

Trích xuất các hàng bằng Pandas .iloc [] trong Python

Pandas là một thư viện python nổi tiếng được sử dụng rộng rãi để xử lý và phân tích dữ liệu trong python. Trong bài viết này, chúng ta sẽ xem cách sử dụng phương thức .iloc được sử dụng để đọc dữ liệu chọn lọc từ python bằng cách lọc cả hàng và cột từ khung dữ liệu.

Phương pháp iloc xử lý dữ liệu bằng cách sử dụng các chỉ mục dựa trên số nguyên có thể là một phần của tập dữ liệu gốc hoặc không. Hàng đầu tiên được gán chỉ mục 0 và thứ hai và chỉ mục 1, v.v. Tương tự, cột đầu tiên là chỉ mục 0 và cột thứ hai là chỉ mục 1, v.v.

Tập dữ liệu

Dưới đây là tập dữ liệu mà chúng tôi sẽ sử dụng.

 Id SepalLengthCm ... PetalLengthCm PetalWidthCmIris-setosa-1 5.1 ... 1.4 0.2Iris-setosa-2 4.9 ... 1.4 0.2Iris-setosa-3 4.7 ... 1.3 0.2 

Chọn hàng

Chúng ta có thể chọn cả một hàng và nhiều hàng bằng cách chỉ định số nguyên cho chỉ mục. Trong ví dụ dưới đây, chúng tôi đang chọn các hàng riêng lẻ ở hàng 0 và hàng 1.

Ví dụ

 nhập gấu trúc dưới dạng pd # Tạo khung dữ liệu từ csv archiveata =pd.read_csv ("D:\\ Iris_readings.csv") row0 =data.iloc [0] row1 =data.iloc [1] print (row0) print (row1) 

Đầu ra

Chạy đoạn mã trên cho chúng ta kết quả sau -

 Id Iris-setosa-1SepalLengthCm 5.1SepalWidthCm 3.5PetalLengthCm 1.4PetalWidthCm 0.2Name:0, dtype:objectId Iris-setosa-2SepalLengthCm 4.9SepalWidthCm 3PetalLengthCm 1.4PetalWidth:object  Chọn nhiều hàng  

Trong ví dụ dưới đây, chúng tôi chọn nhiều hàng cùng một lúc bằng cách đề cập đến phần của các hàng mà chúng tôi cần.

Ví dụ

 nhập gấu trúc dưới dạng pd # tạo khung dữ liệu từ csv filesata =pd.read_csv ("D:\\ Iris_readings.csv") rows =data.iloc [4:8] print (row) 

Đầu ra

Chạy đoạn mã trên cho chúng ta kết quả sau -

 Id SepalLengthCm SepalWidthCm PetalLengthCm PetalWidthCm4 Iris-setosa-5 5.0 3.6 1.4 0.25 Iris-versicolor-51 7.0 3.2 4.7 1.46 Iris-versicolor-52 6.4 3.2 4.5 1.57 Iris-versicolor-53 6.9 3.1 4.9 1.5 

Chọn hàng và cột

Trong ví dụ dưới đây, chúng ta có thể chọn cả hàng và cột nếu cần.

Ví dụ

 nhập gấu trúc dưới dạng pd # tạo khung dữ liệu từ csv archiveata =pd.read_csv ("D:\\ Iris_readings.csv") row_columns =data.iloc [4:8,0:2] print (row_columns) 

Đầu ra

Chạy đoạn mã trên cho chúng ta kết quả sau -

 Id SepalLengthCm4 Iris-setosa-5 5.05 Iris-versicolor-51 7.06 Iris-versicolor-52 6.47 Iris-versicolor-53 6.9