Thư viện python Sklearn cung cấp các tập dữ liệu mẫu có thể được sử dụng để tạo các biểu đồ khác nhau. Tính hữu ích của các bộ dữ liệu này là trong việc tạo các đồ thị và biểu đồ mẫu và dự đoán hành vi của biểu đồ khi các giá trị thay đổi. Ngoài ra, bạn có thể làm việc trên các thông số khác như quyết định màu sắc và trục, v.v. trên biểu đồ mẫu này trước khi sử dụng tập dữ liệu thực tế.
Sử dụng make_blobs
Trong ví dụ dưới đây, chúng tôi sử dụng thư viện sklearn cùng với matplotlib để tạo biểu đồ phân tán với một kiểu cụ thể. Chúng tôi chọn một mẫu gồm 200 điểm dữ liệu và cũng chọn màu sắc và kiểu của các cụm.
Ví dụ
from sklearn.datasets import make_blobs from matplotlib import pyplot as plt from matplotlib import style style.use("fast") X, y = make_blobs(n_samples=200, centers=, cluster_std=1, n_features=2) plt.scatter(X[:, 0], X[:, 1], s=60, color='r') plt.xlabel("X") plt.ylabel("Y") plt.show() plt.clf()
Đầu ra
Chạy đoạn mã trên cho chúng ta kết quả sau -
Sử dụng make_circles
Tương tự như cách tiếp cận trên, chúng tôi sử dụng hàm make_circles để tạo các vòng tròn với kích thước mẫu là 100 và màu xanh lam.
Ví dụ
from sklearn.datasets import make_circles from matplotlib import pyplot as plt from matplotlib import style style.use("fast") X, y = make_circles(n_samples=100, noise=0.04) plt.scatter(X[:, 0], X[:, 1], s=40, color='b') plt.xlabel("X") plt.ylabel("Y") plt.show() plt.clf()
Đầu ra
Chạy đoạn mã trên cho chúng ta kết quả sau -