Computer >> Máy Tính >  >> Lập trình >> Python

Tránh các điểm bị chồng lên nhau mà không sử dụng tham số jitter trong biểu đồ phân tán phân loại trong Python Seaborn?

Chúng tôi sẽ sử dụng Seaborn. Seaborn là một thư viện giúp trực quan hóa dữ liệu. Nó đi kèm với các chủ đề tùy chỉnh và giao diện cấp cao. Giao diện này giúp tùy chỉnh và kiểm soát loại dữ liệu cũng như cách nó hoạt động khi một số bộ lọc nhất định được áp dụng cho nó.

Hàm 'stripplot' được sử dụng khi ít nhất một trong các biến được phân loại. Dữ liệu được biểu diễn theo cách được sắp xếp dọc theo một trong các trục. Nhưng nhược điểm là một số điểm bị trùng lặp. Đây là nơi tham số 'jitter' phải được sử dụng để tránh sự chồng chéo giữa các biến.

Nó thêm một số nhiễu ngẫu nhiên vào tập dữ liệu và điều chỉnh vị trí của các giá trị dọc theo trục phân loại. Tuy nhiên, thay vì sử dụng tham số ‘jitter’, chúng ta có thể sử dụng ‘swarmplot’ để có được biểu đồ phân tán phân loại.

Cú pháp của hàm swarmplot

seaborn.swarmplot(x, y,data,…)

Nó đã được chứng minh bên dưới -

Ví dụ

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('iris')
sb.swarmplot(x = "species", y = "petal_length", data = my_df)
plt.show()

Đầu ra

Tránh các điểm bị chồng lên nhau mà không sử dụng tham số jitter trong biểu đồ phân tán phân loại trong Python Seaborn?

Giải thích

  • Các gói bắt buộc đã được nhập.
  • Dữ liệu đầu vào là 'iris_data' được tải từ thư viện học scikit.
  • Dữ liệu này được lưu trữ trong một khung dữ liệu.
  • Hàm 'load_dataset' được sử dụng để tải dữ liệu mống mắt.
  • Dữ liệu này được hiển thị trực quan bằng cách sử dụng hàm "swarmplot".
  • Tại đây, khung dữ liệu được cung cấp dưới dạng tham số.
  • Ngoài ra, các giá trị x và y cũng được chỉ định.
  • Dữ liệu này được hiển thị trên bảng điều khiển.