Computer >> Máy Tính >  >> Lập trình >> Python

Thư viện scikit-learning có thể được sử dụng như thế nào để tải dữ liệu bằng Python?

Scikit-learning, thường được gọi là sklearn là một thư viện mã nguồn mở bằng Python được sử dụng cho mục đích triển khai các thuật toán học máy.

Điều này bao gồm phân loại, hồi quy, phân cụm, giảm kích thước và hơn thế nữa với sự trợ giúp của giao diện ổn định và mạnh mẽ trong Python. Thư viện này được xây dựng dựa trên các thư viện Numpy, SciPy và Matplotlib.

Hãy để chúng tôi xem một ví dụ để tải dữ liệu -

Ví dụ

from sklearn.datasets import load_iris
my_data = load_iris()
X = my_data.data
y = my_data.target
feature_name = my_data.feature_names
target_name = my_data.target_names
print("Feature names are : ", feature_name)
print("Target names are : ", target_name)
print("\nFirst 8 rows of the dataset are : \n", X[:8])

Đầu ra

Feature names are : ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
Target names are : ['setosa' 'versicolor' 'virginica']
First 8 rows of the dataset are :
[[5.1 3.5 1.4 0.2]
[4.9 3. 1.4 0.2]
[4.7 3.2 1.3 0.2]
[4.6 3.1 1.5 0.2]
[5. 3.6 1.4 0.2]
[5.4 3.9 1.7 0.4]
[4.6 3.4 1.4 0.3]
[5. 3.4 1.5 0.2]]

Giải thích

  • Các gói bắt buộc đã được nhập.
  • Tập dữ liệu cần thiết cho việc này cũng được tải vào môi trường.
  • Các tính năng và giá trị mục tiêu được tách biệt khỏi tập dữ liệu.
  • Các tính năng và mục tiêu này được in trên bảng điều khiển.
  • Ngoài ra, để xem mẫu dữ liệu, 8 hàng đầu tiên của dữ liệu được in trên bảng điều khiển.