Trong bài viết này, chúng ta sẽ tìm hiểu về Xây dựng mô hình học tập trong Scikit-learn:Thư viện máy học Python.
Nó là một thư viện học máy miễn phí. Nó hỗ trợ các thuật toán khác nhau như rừng ngẫu nhiên, máy vectơ và k-láng giềng gần nhất với việc triển khai trực tiếp với numpy và scipy.
Nhập tập dữ liệu
import pandas Url = < specify your URL here> data=pandas.rad_csv(url)
Khám phá và làm sạch dữ liệu
Chúng ta có thể sử dụng phương thức head để chỉ định / lọc các bản ghi theo nhu cầu của mình.
data.head() data.head(n=4) # restricting the record to be 4
Chúng tôi cũng có thể triển khai một số bản ghi cuối cùng của tập dữ liệu
data.tail() data.tail(n=4) # restricting the record to be 4
Bây giờ là giai đoạn Trực quan hóa dữ liệu
Đối với điều này, chúng tôi sử dụng mô-đun Seaborn và matplotlib để trực quan hóa dữ liệu của chúng tôi
import seaborn as s import matplotlib.pyplot as plt sns.set(style="whitegrid", color_codes=True) # create a countplot sns.countplot('Route To Market',data=sales_data,hue = 'Opportunity Result')
Xử lý trước dữ liệu
from sklearn import preprocessing le = preprocessing.LabelEncoder() #convert the columns into numeric values encoded_value = le.fit_transform(list of column names) print(encoded_value)
Cuối cùng, chúng tôi đạt đến giai đoạn Xây dựng mô hình bằng cách đào tạo tập dữ liệu.
Kết luận
Trong bài viết này, chúng ta đã tìm hiểu về cách xây dựng mô hình trong scikit-learning - một thư viện có sẵn bằng Python.