Computer >> Máy Tính >  >> Lập trình >> Python

Python - Chuyển đổi Pandas DataFrame thành dữ liệu nhị phân

Sử dụng phương thức get_dummies () để chuyển đổi DataFrame phân loại thành dữ liệu nhị phân. Sau đây là Pandas DataFrame của chúng tôi với 2 cột -

dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
   }
)

Sử dụng get_dummies () và đặt cột mà bạn muốn chuyển đổi sang dạng nhị phân. Ở đây, chúng tôi muốn hiển thị Kết quả ở dạng “Đạt” và “Không đạt”. Do đó, chúng tôi sẽ đặt cột "Kết quả" -

pd.get_dummies(dataFrame["Result"]

Ví dụ

Sau đây là mã -

import pandas as pd

# Create DataFrame
dataFrame = pd.DataFrame(
   {
      "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass']
   }
)

print"DataFrame ...\n",dataFrame

# converting to binary data
dfBinary = pd.get_dummies(dataFrame["Result"])
print"\nDisplaying DataFrame in Binary form...\n",dfBinary

Đầu ra

Điều này sẽ tạo ra kết quả sau -

DataFrame ...
   Result   Student
0    Pass      Jack
1    Fail     Robin
2    Fail       Ted
3    Pass  Scarlett
4    Pass       Kat

Displaying DataFrame in Binary form...
   Fail   Pass
0     0     1
1     1     0
2     1     0
3     0     1
4     0     1