Computer >> Máy Tính >  >> Lập trình >> Python

Python - Tạo tập dữ liệu thử nghiệm bằng Sklearn

Thư viện python Sklearn cung cấp các tập dữ liệu mẫu có thể được sử dụng để tạo các biểu đồ khác nhau. Tính hữu ích của các bộ dữ liệu này là trong việc tạo các đồ thị và biểu đồ mẫu và dự đoán hành vi của biểu đồ khi các giá trị thay đổi. Ngoài ra, bạn có thể làm việc trên các thông số khác như quyết định màu sắc và trục, v.v. trên biểu đồ mẫu này trước khi sử dụng tập dữ liệu thực tế.

Sử dụng make_blobs

Trong ví dụ dưới đây, chúng tôi sử dụng thư viện sklearn cùng với matplotlib để tạo biểu đồ phân tán với một kiểu cụ thể. Chúng tôi chọn một mẫu gồm 200 điểm dữ liệu và cũng chọn màu sắc và kiểu của các cụm.

Ví dụ

from sklearn.datasets import make_blobs
from matplotlib import pyplot as plt
from matplotlib import style
style.use("fast")
X, y = make_blobs(n_samples=200, centers=,
                  cluster_std=1, n_features=2)

plt.scatter(X[:, 0], X[:, 1], s=60, color='r')
plt.xlabel("X")
plt.ylabel("Y")
plt.show()
plt.clf()

Đầu ra

Chạy đoạn mã trên cho chúng ta kết quả sau -

Python - Tạo tập dữ liệu thử nghiệm bằng Sklearn

Sử dụng make_circles

Tương tự như cách tiếp cận trên, chúng tôi sử dụng hàm make_circles để tạo các vòng tròn với kích thước mẫu là 100 và màu xanh lam.

Ví dụ

from sklearn.datasets import make_circles
from matplotlib import pyplot as plt
from matplotlib import style
style.use("fast")
X, y = make_circles(n_samples=100, noise=0.04)
plt.scatter(X[:, 0], X[:, 1], s=40, color='b')
plt.xlabel("X")
plt.ylabel("Y")
plt.show()
plt.clf()

Đầu ra

Chạy đoạn mã trên cho chúng ta kết quả sau -

Python - Tạo tập dữ liệu thử nghiệm bằng Sklearn