Computer >> Máy Tính >  >> Lập trình >> Python

Làm thế nào dữ liệu có thể được tóm tắt trong Pandas Python?

Nhiều thông tin về dữ liệu có thể được thu thập bằng cách sử dụng các chức năng khác nhau trên đó. Nhưng nếu chúng ta muốn lấy tất cả thông tin về dữ liệu, thì có thể sử dụng hàm "description".

Hàm này sẽ cung cấp thông tin như "số lượng", "trung bình", "độ lệch chuẩn", phân vị thứ 25, phân vị thứ 50 và phân vị thứ 75.

Ví dụ

import pandas as pd
my_data = {'Name':pd.Series(['Tom','Jane','Vin','Eve','Will']),
'Age':pd.Series([45, 67, 89, 12, 23]),'value':pd.Series([8.79,23.24,31.98,78.56,90.20])
}
print("The dataframe is :")
my_df = pd.DataFrame(my_data)
print(my_df)
print("The description of data is :")
print(my_df.describe())

Đầu ra

The dataframe is :
   Name  Age   value
0  Tom   45   8.79
1  Jane  67   23.24
2  Vin   89   31.98
3  Eve   12   78.56
4  Will  23   90.20
The description of data is :
          Age     value
count  5.000000  5.000000
mean  47.200000  46.554000
std   31.499206  35.747102
min   12.000000  8.790000
25%   23.000000  23.240000
50%   45.000000  31.980000
75%   67.000000  78.560000
max   89.000000  90.200000

Giải thích

  • Các thư viện bắt buộc được nhập và đặt tên bí danh để dễ sử dụng.
  • Từ điển chuỗi bao gồm khóa và giá trị được tạo, trong đó giá trị thực sự là cấu trúc dữ liệu chuỗi.
  • Từ điển này sau đó được chuyển dưới dạng tham số cho hàm "Dataframe" có trong thư viện "pandas"
  • Khung dữ liệu được in trên bảng điều khiển.
  • Chúng tôi đang tìm cách thu thập tất cả thông tin về dữ liệu.
  • Hàm "description" được gọi trên khung dữ liệu.
  • Mô tả được in trên bảng điều khiển.