Computer >> Máy Tính >  >> Lập trình >> Python

Giới thiệu về Học máy bằng Python

Trong bài viết này, chúng ta sẽ tìm hiểu những kiến ​​thức cơ bản về học máy bằng Python 3.x. Hoặc sớm hơn.

Trước tiên, chúng ta cần sử dụng các thư viện hiện có để thiết lập môi trường học máy

>>> pip cài đặt numpy>>> pip cài đặt scipy>>> pip cài đặt matplotlib>>> pip cài đặt scikit-learning 

Máy học liên quan đến việc nghiên cứu kinh nghiệm và sự kiện và dự đoán được đưa ra trên cơ sở các ý định được cung cấp. Cơ sở dữ liệu càng lớn thì mô hình học máy càng tốt.

Luồng của Học máy

  • Làm sạch dữ liệu
  • Cung cấp tập dữ liệu
  • Đào tạo mô hình
  • Kiểm tra tập dữ liệu
  • Triển khai mô hình


Giới thiệu về Học máy bằng Python

Bây giờ, hãy xác định thư viện nào được sử dụng cho mục đích nào -

Khó chịu - thêm hỗ trợ cho các danh sách và ma trận khổng lồ, đa chiều, cùng với một bộ sưu tập các hàm toán học để hoạt động trên các mảng đầu vào này.

SciPy - một thư viện Python mã nguồn mở và miễn phí được sử dụng cho tính toán khoa học / toán học. Nó chứa các mô-đun để tối ưu hóa thuật toán, tích hợp dữ liệu, nội suy, một số hàm đặc biệt và đại số tuyến tính

Matplotlib - Một thư viện được sử dụng để hình thành các biểu đồ và số liệu. Nó cho phép vẽ biểu đồ dữ liệu để có được cái nhìn sâu sắc hơn về mô hình

Scikit-learning - nó có các thuật toán phân loại, phân cụm và hồi quy khác nhau để phân phối và tổ chức dữ liệu theo cách được xác định rõ ràng

Bây giờ chúng ta hãy tạo một mô hình học máy cơ bản với sự trợ giúp của scikit - hãy học. Ở đây, chúng tôi sẽ lấy các bộ dữ liệu có sẵn, tức là bộ dữ liệu mống mắt và chữ số có sẵn trong bộ môn trượt tuyết học.

 from sklearn import datasetsiris =datasets.load_iris ()umbers =datasets.load_digits () 

Bây giờ để xem dữ liệu từ các tập dữ liệu chúng tôi sử dụng

 print (digit.data) 


[[0. 0. 5. ... 0. 0. 0.] [0. 0. 0. ... 10. 0. 0.] [0. 0. 0. ... 16. 9. 0.] ... [0. 0. 1. ... 6. 0. 0.] [0. 0. 2. ... 12. 0. 0.] [0. 0. 10.. .. 12. 1. 0.]]

Hàm .target cho phép chúng tôi xem những điều chúng tôi muốn mô hình của mình học hỏi

umbers.target 


 mảng ([0, 1, 2, ..., 8, 9, 8]) 

để truy cập hình dạng của bộ dữ liệu chữ số mà chúng tôi sử dụng

umbers.images [0] 


 array ([[0, 0., 5., 13., 9., 1., 0., 0.], [0., 0., 13., 15., 10., 15. , 5., 0.], [0., 3., 15., 2., 0., 11., 8., 0.], [0., 4., 12., 0., 0., 8., 8., 0.], [0., 5., 8., 0., 0., 9., 8., 0.], [0., 4., 11., 0., 1 ., 12., 7., 0.], [0., 2., 14., 5., 10., 12., 0., 0.], [0., 0., 6., 13. , 10., 0., 0., 0.]]) 

Bây giờ chúng ta hãy chuyển sang phần tìm hiểu và dự đoán

 from sklearn import svmclf =svm.SVC (gamma =0,001, C =100.) 

Ở đây SVC là hỗ trợ phân loại vectơ hoạt động như một công cụ ước tính sẵn có cho mô hình của chúng tôi

 clf.fit (digit.data [:- 1], digit.target [:- 1]) SVC (C =100.0, cache_size =200, class_weight =None, coef0 =0.0, quyết định_shape ='ovr', độ =3, gamma =0,001, nhân ='rbf', max_iter =-1, xác suất =Sai, ngẫu nhiên =Không có, thu nhỏ =Đúng, tol =0,001, chi tiết =Sai) 

Trước tiên, chúng tôi cần cung cấp cho mô hình với tập dữ liệu bằng cách sử dụng phương pháp fit để mô hình của chúng tôi có thể học hỏi Tại đây, chúng tôi cung cấp tất cả các hình ảnh dưới dạng dữ liệu đào tạo ngoại trừ hình ảnh cuối cùng mà chúng tôi sẽ sử dụng cho mục đích thử nghiệm.

Bây giờ khi mô hình của chúng tôi được đào tạo, chúng tôi có thể dự đoán kết quả đầu ra của dữ liệu thử nghiệm bằng cách sử dụng hàm .p Dự đoán

 clf.p Dự đoán (umbers.data [-1:]) mảng ([8]) 

Giờ đây, khi mô hình của chúng tôi được đào tạo, chúng tôi có thể tính toán hiệu quả và chu kỳ thời gian của mô hình của mình

Kết luận

Trong bài viết này, chúng ta đã tìm hiểu về một số khái niệm cơ bản về học máy và một số thư viện cơ bản được sử dụng để triển khai nó trong Python.