Trong bài viết này, chúng ta sẽ tìm hiểu những kiến thức cơ bản về học máy bằng Python 3.x. Hoặc sớm hơn.
Trước tiên, chúng ta cần sử dụng các thư viện hiện có để thiết lập môi trường học máy
>>> pip cài đặt numpy>>> pip cài đặt scipy>>> pip cài đặt matplotlib>>> pip cài đặt scikit-learning
Máy học liên quan đến việc nghiên cứu kinh nghiệm và sự kiện và dự đoán được đưa ra trên cơ sở các ý định được cung cấp. Cơ sở dữ liệu càng lớn thì mô hình học máy càng tốt.
Luồng của Học máy
- Làm sạch dữ liệu
- Cung cấp tập dữ liệu
- Đào tạo mô hình
- Kiểm tra tập dữ liệu
- Triển khai mô hình
Bây giờ, hãy xác định thư viện nào được sử dụng cho mục đích nào -
Khó chịu - thêm hỗ trợ cho các danh sách và ma trận khổng lồ, đa chiều, cùng với một bộ sưu tập các hàm toán học để hoạt động trên các mảng đầu vào này.
SciPy - một thư viện Python mã nguồn mở và miễn phí được sử dụng cho tính toán khoa học / toán học. Nó chứa các mô-đun để tối ưu hóa thuật toán, tích hợp dữ liệu, nội suy, một số hàm đặc biệt và đại số tuyến tính
Matplotlib - Một thư viện được sử dụng để hình thành các biểu đồ và số liệu. Nó cho phép vẽ biểu đồ dữ liệu để có được cái nhìn sâu sắc hơn về mô hình
Scikit-learning - nó có các thuật toán phân loại, phân cụm và hồi quy khác nhau để phân phối và tổ chức dữ liệu theo cách được xác định rõ ràng
Bây giờ chúng ta hãy tạo một mô hình học máy cơ bản với sự trợ giúp của scikit - hãy học. Ở đây, chúng tôi sẽ lấy các bộ dữ liệu có sẵn, tức là bộ dữ liệu mống mắt và chữ số có sẵn trong bộ môn trượt tuyết học.
from sklearn import datasetsiris =datasets.load_iris ()umbers =datasets.load_digits ()
Bây giờ để xem dữ liệu từ các tập dữ liệu chúng tôi sử dụng
print (digit.data)
Hàm .target cho phép chúng tôi xem những điều chúng tôi muốn mô hình của mình học hỏi
umbers.target
mảng ([0, 1, 2, ..., 8, 9, 8])
để truy cập hình dạng của bộ dữ liệu chữ số mà chúng tôi sử dụng
umbers.images [0]
array ([[0, 0., 5., 13., 9., 1., 0., 0.], [0., 0., 13., 15., 10., 15. , 5., 0.], [0., 3., 15., 2., 0., 11., 8., 0.], [0., 4., 12., 0., 0., 8., 8., 0.], [0., 5., 8., 0., 0., 9., 8., 0.], [0., 4., 11., 0., 1 ., 12., 7., 0.], [0., 2., 14., 5., 10., 12., 0., 0.], [0., 0., 6., 13. , 10., 0., 0., 0.]])
Bây giờ chúng ta hãy chuyển sang phần tìm hiểu và dự đoán
from sklearn import svmclf =svm.SVC (gamma =0,001, C =100.)
Ở đây SVC là hỗ trợ phân loại vectơ hoạt động như một công cụ ước tính sẵn có cho mô hình của chúng tôi
clf.fit (digit.data [:- 1], digit.target [:- 1]) SVC (C =100.0, cache_size =200, class_weight =None, coef0 =0.0, quyết định_shape ='ovr', độ =3, gamma =0,001, nhân ='rbf', max_iter =-1, xác suất =Sai, ngẫu nhiên =Không có, thu nhỏ =Đúng, tol =0,001, chi tiết =Sai)
Trước tiên, chúng tôi cần cung cấp cho mô hình với tập dữ liệu bằng cách sử dụng phương pháp fit để mô hình của chúng tôi có thể học hỏi Tại đây, chúng tôi cung cấp tất cả các hình ảnh dưới dạng dữ liệu đào tạo ngoại trừ hình ảnh cuối cùng mà chúng tôi sẽ sử dụng cho mục đích thử nghiệm.
Bây giờ khi mô hình của chúng tôi được đào tạo, chúng tôi có thể dự đoán kết quả đầu ra của dữ liệu thử nghiệm bằng cách sử dụng hàm .p Dự đoán
clf.p Dự đoán (umbers.data [-1:]) mảng ([8])
Giờ đây, khi mô hình của chúng tôi được đào tạo, chúng tôi có thể tính toán hiệu quả và chu kỳ thời gian của mô hình của mình
Kết luận
Trong bài viết này, chúng ta đã tìm hiểu về một số khái niệm cơ bản về học máy và một số thư viện cơ bản được sử dụng để triển khai nó trong Python.