Computer >> Máy Tính >  >> Lập trình >> Python

Python - Xóa hàng / cột khỏi DataFrame bằng Pandas.drop ()

Pandas là một trong những thư viện python phổ biến nhất để phân tích dữ liệu và xử lý dữ liệu. Trong bài viết này, chúng ta sẽ xem cách chúng ta có thể tạo khung dữ liệu gấu trúc và sau đó xóa một số hàng hoặc cột có chọn lọc khỏi khung dữ liệu này.

Xóa roews

Trong ví dụ dưới đây, chúng tôi có tệp iris.csv được đọc vào một khung dữ liệu. Đầu tiên chúng ta xem xét khung dữ liệu hiện có và sau đó áp dụng chức năng drop cho cột chỉ mục bằng cách cung cấp giá trị mà chúng ta muốn giảm. Như chúng ta có thể thấy ở cuối tập kết quả, số hàng đã giảm đi 3.

Ví dụ

import pandas as pd
# making data frame from csv file
data = pd.read_csv("E:\\iris1.csv",index_col ="Id")
print(data)
# dropping passed values
data.drop([6,9,10],inplace=True)
# display
print(data)

Đầu ra

Chạy đoạn mã trên cho chúng ta kết quả sau -

   SepalLengthCm    SepalWidthCm    PetalLengthCm    PetalWidthCm    Species
Id
1    5.1                3.5             1.4             0.2       Iris-setosa
2    4.9                3.0             1.4             0.2       Iris-setosa
3    4.7                3.2             1.3             0.2       Iris-setosa
.   ..   …   .…   .…..……
[150 rows x 5 columns]

After Dropping
   SepalLengthCm    SepalWidthCm    PetalLengthCm    PetalWidthCm    Species
Id
1      5.1                3.5             1.4             0.2       Iris-setosa
2      4.9                3.0             1.4             0.2       Iris-setosa
3      4.7                3.2             1.3             0.2       Iris-setosa
149    6.2                3.4             5.4             2.3       Iris-virginica
150    5.9                3.0             5.1             1.8       Iris-virginica
………………….
[147 rows x 5 columns]

Cột thả

Để thả các cột tạo thành khung dữ liệu gấu trúc, chúng tôi sử dụng tham số trục. Giá trị của nó được đặt thành một trong hàm drop và chúng tôi cung cấp tên cột sẽ bị loại bỏ. Như bạn có thể thấy, số lượng cột trong tập kết quả giảm từ 5 xuống còn 3.

Ví dụ

import pandas as pd
# making data frame from csv file
data = pd.read_csv("E:\\iris1.csv",index_col ="Id")
print(data)
# dropping passed values
data.drop(['SepalWidthCm','PetalLengthCm'],axis=1,inplace=True)
print("After Dropping")
# display
print(data)

Đầu ra

Chạy đoạn mã trên cho chúng ta kết quả sau -

   SepalLengthCm    SepalWidthCm    PetalLengthCm    PetalWidthCm    Species
Id
1       5.1          3.5                1.4             0.2          Iris-setosa
2       4.9          3.0                1.4             0.2          Iris-setosa
3       4.7          3.2                1.3             0.2          Iris-setosa
.   .   .…   .…   .….   .……
[150 rows x 5 columns]
After Dropping
   SepalLengthCm    PetalWidthCm    Species
Id
1    5.1             0.2             Iris-setosa
2    4.9             0.2             Iris-setosa
3    4.7             0.2             Iris-setosa
.....….
[150 rows x 3 columns]