Nhiều thông tin về dữ liệu có thể được thu thập bằng cách sử dụng các chức năng khác nhau trên đó. Nhưng nếu chúng ta muốn lấy tất cả thông tin về dữ liệu, thì có thể sử dụng hàm "description".
Hàm này sẽ cung cấp thông tin như "số lượng", "trung bình", "độ lệch chuẩn", phân vị thứ 25, phân vị thứ 50 và phân vị thứ 75.
Ví dụ
import pandas as pd my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']), 'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20]) } print("The dataframe is :") my_df = pd.DataFrame(my_data) print(my_df) print("The description of data is :") print(my_df.describe())
Đầu ra
The dataframe is : Name Age value 0 Tom 45 8.79 1 Jane 67 23.24 2 Vin 89 31.98 3 Eve 12 78.56 4 Will 23 90.20 The description of data is : Age value count 5.000000 5.000000 mean 47.200000 46.554000 std 31.499206 35.747102 min 12.000000 8.790000 25% 23.000000 23.240000 50% 45.000000 31.980000 75% 67.000000 78.560000 max 89.000000 90.200000
Giải thích
- Các thư viện bắt buộc được nhập và đặt tên bí danh để dễ sử dụng.
- Từ điển chuỗi bao gồm khóa và giá trị được tạo, trong đó giá trị thực sự là cấu trúc dữ liệu chuỗi.
- Từ điển này sau đó được chuyển dưới dạng tham số cho hàm "Dataframe" có trong thư viện "pandas"
- Khung dữ liệu được in trên bảng điều khiển.
- Chúng tôi đang tìm cách thu thập tất cả thông tin về dữ liệu.
- Hàm "description" được gọi trên khung dữ liệu.
- Mô tả được in trên bảng điều khiển.