Computer >> Máy Tính >  >> Lập trình >> Python

Làm thế nào để có được mối tương quan giữa hai cột trong Pandas?

Chúng tôi có thể sử dụng .corr () phương pháp để có được mối tương quan giữa hai cột trong Pandas. Hãy lấy một ví dụ và xem cách áp dụng phương pháp này.

Các bước

  • Tạo dữ liệu dạng bảng hai chiều, có thể thay đổi kích thước, có khả năng không đồng nhất, df .
  • In DataFrame đầu vào, df .
  • Khởi tạo hai biến, col1 col2 và gán cho họ các cột mà bạn muốn tìm mối tương quan.
  • Tìm mối tương quan giữa col1 và col2 bằng cách sử dụng df [col1] .corr (df [col2]) và lưu giá trị tương quan trong một biến, corr.
  • In giá trị tương quan, corr.

Ví dụ

import pandas as pd

df = pd.DataFrame(
   {
      "x": [5, 2, 7, 0],
      "y": [4, 7, 5, 1],
      "z": [9, 3, 5, 1]
   }
)
print "Input DataFrame is:\n", df

col1, col2 = "x", "y"
corr = df[col1].corr(df[col2])
print "Correlation between ", col1, " and ", col2, "is: ", round(corr, 2)

col1, col2 = "x", "x"
corr = df[col1].corr(df[col2])
print "Correlation between ", col1, " and ", col2, "is: ", round(corr, 2)

col1, col2 = "x", "z"
corr = df[col1].corr(df[col2])
print "Correlation between ", col1, " and ", col2, "is: ", round(corr, 2)

col1, col2 = "y", "x"
corr = df[col1].corr(df[col2])
print "Correlation between ", col1, " and ", col2, "is: ", round(corr, 2)

Đầu ra

Input DataFrame is:
  x y z
0 5 4 9
1 2 7 3
2 7 5 5
3 0 1 1
Correlation between x and y is: 0.41
Correlation between x and x is: 1.0
Correlation between x and z is: 0.72
Correlation between y and x is: 0.41