Khi các mô hình hồi quy đang được xây dựng, đa cộng tuyến được kiểm tra. Điều này là do chúng ta cần hiểu mối tương quan hiện diện giữa tất cả các kết hợp khác nhau của các biến liên tục. Nếu tồn tại đa cộng tuyến giữa các biến, chúng ta phải đảm bảo rằng biến đó bị xóa khỏi dữ liệu.
Dữ liệu trong thế giới thực thường là phi tuyến tính. Chúng ta cần tìm các cơ chế để phù hợp với dữ liệu phi tuyến tính đó với mô hình. Chúng tôi sẽ sử dụng tập dữ liệu của Anscombe để trực quan hóa dữ liệu này.
Hàm 'implot' được sử dụng với dữ liệu phi tuyến tính -
Ví dụ
import pandas as pd import seaborn as sb from matplotlib import pyplot as plt my_df = sb.load_dataset('anscombe') sb.lmplot(x = "x", y = "y", data = my_df.query("dataset == 'II'"),order = 3) plt.show()
Đầu ra
Giải thích
- Các gói bắt buộc đã được nhập.
- Dữ liệu đầu vào là 'anscombe' được tải từ thư viện seaborn.
- Dữ liệu này được lưu trữ trong một khung dữ liệu.
- Hàm 'load_dataset' được sử dụng để tải dữ liệu mống mắt.
- Dữ liệu này được hiển thị trực quan bằng cách sử dụng hàm "implot".
- Tại đây, khung dữ liệu được cung cấp dưới dạng tham số.
- Ngoài ra, giá trị x, giá trị y và thứ tự được chỉ định.
- Dữ liệu này được hiển thị trên bảng điều khiển.