Computer >> Máy Tính >  >> Lập trình >> Python

Tương quan và hồi quy trong Python

Tương quan đề cập đến một số mối quan hệ thống kê liên quan đến sự phụ thuộc giữa hai tập dữ liệu. Trong khi hồi quy tuyến tính là một cách tiếp cận tuyến tính để thiết lập mối quan hệ giữa một biến phụ thuộc và một hoặc nhiều biến độc lập. Một biến độc lập duy nhất được gọi là hồi quy tuyến tính trong khi nhiều biến độc lập được gọi là hồi quy bội.

Tương quan

Ví dụ đơn giản về các hiện tượng phụ thuộc bao gồm mối tương quan giữa ngoại hình của bố mẹ và con cái của họ, và mối tương quan giữa giá của một sản phẩm và số lượng cung cấp của nó. Trong đó, chúng tôi cố gắng thiết lập mối tương quan giữa chiều dài và chiều rộng của các lá đài và cánh hoa của ba loài hoa iris. Dựa trên mối tương quan được tìm thấy, một mô hình mạnh có thể được tạo ra để dễ dàng phân biệt loài này với loài khác.

Ví dụ

import matplotlib.pyplot as plt
import seaborn as sns
df = sns.load_dataset('iris')
#without regression
sns.pairplot(df, kind="scatter")
plt.show()

Đầu ra

Chạy đoạn mã trên cho chúng ta kết quả sau -

Tương quan và hồi quy trong Python

Hồi quy tuyến tính

Về mặt toán học, một mối quan hệ tuyến tính biểu diễn một đường thẳng khi được vẽ dưới dạng đồ thị. Một mối quan hệ phi tuyến tính trong đó số mũ của bất kỳ biến nào không bằng 1 sẽ tạo ra một đường cong. Các hàm trong Seaborn để tìm mối quan hệ hồi quy tuyến tính là regplot. Ví dụ dưới đây cho thấy công dụng của nó.

Ví dụ

import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('tips')
sb.regplot(x = "total_bill", y = "tip", data = df)
plt.show()

Đầu ra

Chạy đoạn mã trên cho chúng ta kết quả sau -

Tương quan và hồi quy trong Python