Computer >> Máy Tính >  >> Lập trình >> Python

Xây dựng mô hình học tập trong Scikit-learning:Thư viện máy học Python

Trong bài viết này, chúng ta sẽ tìm hiểu về Xây dựng mô hình học tập trong Scikit-learn:Thư viện máy học Python.

Nó là một thư viện học máy miễn phí. Nó hỗ trợ các thuật toán khác nhau như rừng ngẫu nhiên, máy vectơ và k-láng giềng gần nhất với việc triển khai trực tiếp với numpy và scipy.

Nhập tập dữ liệu

import pandas
Url = < specify your URL here>
data=pandas.rad_csv(url)

Khám phá và làm sạch dữ liệu

Chúng ta có thể sử dụng phương thức head để chỉ định / lọc các bản ghi theo nhu cầu của mình.

data.head()
data.head(n=4) # restricting the record to be 4

Chúng tôi cũng có thể triển khai một số bản ghi cuối cùng của tập dữ liệu

data.tail()
data.tail(n=4) # restricting the record to be 4

Bây giờ là giai đoạn Trực quan hóa dữ liệu

Đối với điều này, chúng tôi sử dụng mô-đun Seaborn và matplotlib để trực quan hóa dữ liệu của chúng tôi

import seaborn as s
import matplotlib.pyplot as plt
sns.set(style="whitegrid", color_codes=True)
# create a countplot
sns.countplot('Route To Market',data=sales_data,hue = 'Opportunity Result')

Xử lý trước dữ liệu

from sklearn import preprocessing
le = preprocessing.LabelEncoder()
#convert the columns into numeric values
encoded_value = le.fit_transform(list of column names)
print(encoded_value)

Cuối cùng, chúng tôi đạt đến giai đoạn Xây dựng mô hình bằng cách đào tạo tập dữ liệu.

Xây dựng mô hình học tập trong Scikit-learning:Thư viện máy học Python

Kết luận

Trong bài viết này, chúng ta đã tìm hiểu về cách xây dựng mô hình trong scikit-learning - một thư viện có sẵn bằng Python.