Dataframe là cấu trúc dữ liệu hai chiều, nơi dữ liệu được lưu trữ ở định dạng bảng, dưới dạng hàng và cột.
Nó có thể được hình dung như một bảng dữ liệu SQL hoặc một biểu diễn trang tính excel. Một cột trong khung dữ liệu có thể bị xóa bằng các phương pháp khác nhau.
Chúng ta sẽ thấy hàm pop lấy tên của cột cần xóa làm tham số và xóa nó.
Ví dụ
import pandas as pd my_data = {'ab' : pd.Series([1, 8, 7], index=['a', 'b', 'c']), 'cd' : pd.Series([1, 2, 0, 9], index=['a', 'b', 'c', 'd']), 'ef' : pd.Series([56, 78, 32],index=['a','b','c']), 'gh' : pd.Series([66, 77, 88, 99],index=['a','b','c', 'd']) } my_df = pd.DataFrame(my_data) print("The dataframe is :") print(my_df) print("Deleting the column using the 'pop' function") my_df.pop('cd') print(my_df)
Đầu ra
The dataframe is : ab cd ef gh a 1.0 1 56.0 66 b 8.0 2 78.0 77 c 7.0 0 32.0 88 d NaN 9 NaN 99 Deleting the column using the 'pop' function ab ef gh a 1.0 56.0 66 b 8.0 78.0 77 c 7.0 32.0 88 d NaN NaN 99
Giải thích
-
Các thư viện bắt buộc được nhập và đặt tên bí danh để dễ sử dụng.
-
Các giá trị từ điển bao gồm khóa và giá trị được tạo, trong đó giá trị thực sự là cấu trúc dữ liệu chuỗi.
-
Từ điển này sau đó được chuyển dưới dạng tham số cho hàm "Dataframe" có trong thư viện "pandas"
-
Hàm 'pop' được sử dụng để xóa một cột cụ thể.
-
Tên của cột cần xóa được chuyển dưới dạng tham số cho hàm 'pop'.
-
Khung dữ liệu mới được in trên bảng điều khiển.
Lưu ý - Từ ‘NaN’ đề cập đến ‘Không phải số’, có nghĩa là giá trị [hàng, cột] cụ thể không có bất kỳ mục nhập hợp lệ nào.