Sử dụng phương thức get_dummies () để chuyển đổi DataFrame phân loại thành dữ liệu nhị phân. Sau đây là Pandas DataFrame của chúng tôi với 2 cột -
dataFrame = pd.DataFrame( { "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass'] } )
Sử dụng get_dummies () và đặt cột mà bạn muốn chuyển đổi sang dạng nhị phân. Ở đây, chúng tôi muốn hiển thị Kết quả ở dạng “Đạt” và “Không đạt”. Do đó, chúng tôi sẽ đặt cột "Kết quả" -
pd.get_dummies(dataFrame["Result"]
Ví dụ
Sau đây là mã -
import pandas as pd # Create DataFrame dataFrame = pd.DataFrame( { "Student": ['Jack', 'Robin', 'Ted', 'Scarlett', 'Kat'],"Result": ['Pass', 'Fail', 'Fail', 'Pass', 'Pass'] } ) print"DataFrame ...\n",dataFrame # converting to binary data dfBinary = pd.get_dummies(dataFrame["Result"]) print"\nDisplaying DataFrame in Binary form...\n",dfBinary
Đầu ra
Điều này sẽ tạo ra kết quả sau -
DataFrame ... Result Student 0 Pass Jack 1 Fail Robin 2 Fail Ted 3 Pass Scarlett 4 Pass Kat Displaying DataFrame in Binary form... Fail Pass 0 0 1 1 1 0 2 1 0 3 0 1 4 0 1