Seaborn là một thư viện giúp trực quan hóa dữ liệu. Nó đi kèm với các chủ đề tùy chỉnh và giao diện cấp cao.
Khi các mô hình hồi quy đang được xây dựng, đa cộng tuyến sẽ được kiểm tra. Điều này là do chúng ta cần hiểu mối tương quan hiện diện giữa tất cả các kết hợp khác nhau của các biến liên tục. Nếu tồn tại đa cộng tuyến giữa các biến, chúng ta phải đảm bảo rằng biến đó bị xóa khỏi dữ liệu. Đây là lúc các hàm ‘regpot’ và ‘implot’ phát huy tác dụng. Chúng giúp hình dung mối quan hệ tuyến tính giữa các biến trong hồi quy tuyến tính.
Hàm ‘regplot’ chấp nhận các giá trị cho các biến ‘x’ và ‘y’ ở nhiều định dạng khác nhau và điều này bao gồm các mảng numpy, đối tượng chuỗi gấu trúc, tham chiếu đến các biến hoặc giá trị từ khung dữ liệu gấu trúc.
Mặt khác, hàm ‘implot’ yêu cầu người dùng chuyển một tham số cụ thể cho dữ liệu và các giá trị cho các biến ‘x’ và ‘y’ cần phải là chuỗi. Loại định dạng dữ liệu này được gọi là dữ liệu dạng dài. Đây là ví dụ -
Ví dụ
import seaborn as sb from matplotlib import pyplot as plt my_df = sb.load_dataset('tips') sb.regplot(x = "total_bill", y = "tip", data = my_df) sb.lmplot(x = "total_bill", y = "tip", data = my_df) plt.show()
Đầu ra
Giải thích
- Các gói bắt buộc đã được nhập.
- Dữ liệu đầu vào là "mẹo" được tải từ thư viện seaborn.
- Dữ liệu này được lưu trữ trong một khung dữ liệu.
- Hàm 'load_dataset' được sử dụng để tải dữ liệu mống mắt.
- Dữ liệu này được hiển thị trực quan bằng cách sử dụng hàm "regplot".
- Dữ liệu này được hiển thị trực quan bằng cách sử dụng hàm "implot".
- Tại đây, khung dữ liệu được cung cấp dưới dạng tham số.
- Ngoài ra, các giá trị x và y cũng được chỉ định.
- Dữ liệu này được hiển thị trên bảng điều khiển.